PaddleOCR は、PaddlePaddle で実装された、マルチリンガルで優れた最先端の実用的な OCR ツールの作成を目指しています。これにより、ユーザーはより良い モデル をトレーニングし、実務に適用できるようになります。PaddleOCR は、OCR に関連するさまざまな cutting-edge なアルゴリズムをサポートし、産業用ソリューションを開発しています。現在 PaddleOCR は W&B と インテグレーション されており、トレーニングおよび 評価メトリクス を、対応する メタデータ を含む モデル の チェックポイント と共に ログ 記録できるようになりました。Documentation Index
Fetch the complete documentation index at: https://wb-21fd5541-weave-caching.mintlify.app/llms.txt
Use this file to discover all available pages before exploring further.
ブログと Colab の例
ICDAR2015 データセット を使用して PaddleOCR で モデル をトレーニングする方法については、こちら をご覧ください。また、Google Colab も用意されており、対応するライブ W&B ダッシュボード は こちら からアクセス可能です。この ブログ の中国語版もこちらにあります: W&B对您的OCR模型进行训练和调试サインアップと APIキー の作成
APIキー は、お使いのデバイスを W&B に認証するために使用されます。 ユーザー プロフィールから APIキー を生成できます。For a more streamlined approach, create an API key by going directly to User Settings. Copy the newly created API key immediately and save it in a secure location such as a password manager.
- 右上隅にある ユーザー プロフィールアイコンをクリックします。
- User Settings を選択し、 API Keys セクションまでスクロールします。
wandb ライブラリ のインストールとログイン
ローカル環境に wandb ライブラリ をインストールしてログインするには:
- Command Line
- Python
- Python notebook
-
WANDB_API_KEY環境変数 に APIキー を設定します。 -
wandbライブラリ をインストールしてログインします。
config.yml ファイルへの wandb の追加
PaddleOCR では、設定変数を yaml ファイルで提供する必要があります。設定 yaml ファイルの最後に以下のスニペットを追加すると、すべての トレーニング およびバリデーション メトリクス が、モデル の チェックポイント と共に W&B ダッシュボード に自動的に ログ 記録されます。
wandb.init() に渡したい追加のオプション 引数 も、yaml ファイルの wandb ヘッダーの下に追加できます。
train.py への config.yml ファイルの受け渡し
その後、yaml ファイルを PaddleOCR リポジトリにある トレーニングスクリプト の 引数 として渡します。
train.py ファイルを実行すると、W&B ダッシュボード にアクセスするためのリンクが生成されます。


