失敗したモデルトレーニングのデバッグ - Rekognition

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

失敗したモデルトレーニングのデバッグ

モデルトレーニング中にエラーが発生する場合があります。Amazon Rekognition Custom Labels は、コンソールと DescribeProjectVersions からのレスポンスでトレーニングエラーを報告します。

エラーは、ターミナル (トレーニングを継続できない) か、非ターミナル (トレーニングを継続できる) かのいずれかです。トレーニングデータセットとテストデータセットのコンテンツに関連するエラーについては、検証結果 (マニフェストの概要トレーニングとテストの検証マニフェスト) をダウンロードできます。検証結果のエラーコードを使用して、このセクションの詳細情報を確認してください。このセクションには、マニフェストファイルエラー (マニフェストファイルの内容が検証される前に発生するターミナルエラー) に関する情報も記載されています。

注記

マニフェストは、データセットのコンテンツを保存するために使用されるファイルです。

一部のエラーは、Amazon Rekognition Custom Labels コンソールを使用して修正できます。そのほかのエラーでは、トレーニングマニフェストファイルまたはテストマニフェストファイルの更新が必要となる場合があります。IAM のアクセス許可など、他の変更が必要になる場合があります。詳細については、個々のエラーのドキュメントを参照してください。

ターミナルエラー

ターミナルエラーが発生すると、モデルのトレーニングが停止します。ターミナルトレーニングエラーには、サービスエラー、マニフェストファイルエラー、マニフェストコンテンツエラーの 3 つのカテゴリがあります。

コンソールの Amazon Rekognition Custom Labels のプロジェクトページの [ステータスメッセージ] 列には、モデルのターミナルエラーが表示されます。[プロジェクト管理] ダッシュボードのプロジェクトのリストには、名前、バージョン、作成日、モデルのパフォーマンスが示され、モデルの状態 (トレーニングの完了または失敗など) を示すステータスメッセージも表示されます。

[プロジェクト管理] ダッシュボードのスクリーンショット。

AWS SDK を使用している場合は、DescribeProjectVersions からのレスポンスをチェックすることで、ターミナルマニフェストファイルエラーまたはターミナルマニフェストコンテンツエラーが発生したかどうかを確認できます。この場合、Status 値は TRAINING_FAILED で、StatusMessage フィールドにはエラーが含まれています。

サービスエラー

ターミナルサービスエラーは、Amazon Rekognition でサービスの問題が発生し、トレーニングを継続できない場合に発生します。例えば、Amazon Rekognition Custom Labels が依存する別のサービスの障害などです。Amazon Rekognition でサービスの問題が発生したため、Amazon Rekognition Custom Labels は、コンソールにサービスエラーを報告します。 AWS SDK を使用する場合、トレーニング中に発生するサービスエラーは、CreateProjectVersionDescribeProjectVersions によってInternalServerError例外として発生します。

サービスエラーが発生した場合は、モデルのトレーニングを再試行してください。トレーニングが引き続き失敗する場合は、AWS Support に連絡し、サービスエラーで報告されたエラー情報を記載してください。

致命的マニフェストファイルエラーのリスト

マニフェストファイルエラーは、トレーニングデータセットとテストデータセット内の、ファイルレベルまたは複数のファイルにまたがって発生するターミナルエラーです。マニフェストファイルエラーは、トレーニングデータセットとテストデータセットの内容が検証される前に検出されます。マニフェストファイルエラーが発生すると、非ターミナルの検証エラーは報告されません。例えば、トレーニングマニフェストファイルが空の場合、マニフェストファイルは空ですというエラーが生成されます。ファイルが空であるため、非ターミナルの JSON 行検証エラーは報告されません。マニフェストの概要も作成されません。

モデルをトレーニングする前に、マニフェストファイルエラーを修正する必要があります。

マニフェストファイルエラーを以下に示します。

致命的マニフェストコンテンツエラーのリスト

マニフェストコンテンツエラーは、マニフェスト内のコンテンツに関連するターミナルエラーです。例えば、このマニフェストファイルには、自動分割を実行するには不十分なラベル付きイメージが含まれていますというエラーが表示された場合は、トレーニングデータセットにはテストデータセットを作成するのに十分な数のラベル付きイメージがないため、トレーニングを終了できません。

このエラーは、コンソールおよび DescribeProjectVersions からの応答で報告されるだけでなく、他のターミナルマニフェストコンテンツエラーとともにマニフェストの概要でも報告されます。詳細については、「マニフェストの概要について」を参照してください。

非ターミナル JSON 行エラーは、トレーニングとテストの別の検証結果マニフェストでも報告されます。Amazon Rekognition Custom Labels によって検出される非ターミナル JSON 行エラーは、必ずしもトレーニングを停止するマニフェストコンテンツエラーに関連しているわけではありません。詳細については、「トレーニングとテストの検証結果マニフェストを理解する」を参照してください。

モデルをトレーニングする前に、マニフェストコンテンツエラーを修正する必要があります。

マニフェストコンテンツエラーのエラーメッセージは次のとおりです。

非致命的 JSON 行検証エラーのリスト

JSON 行検証エラーは、Amazon Rekognition Custom Labels がモデルのトレーニングを停止する必要がない非ターミナルエラーです。

JSON 行検証エラーはコンソールには表示されません。

トレーニングデータセットとテストデータセットでは、JSON 行は 1 つのイメージのトレーニング情報またはテスト情報を表します。JSON 行の検証エラー (無効なイメージなど) は、トレーニングとテストの検証マニフェストで報告されます。Amazon Rekognition Custom Labels は、マニフェストに含まれる他の有効な JSON 行を使用してトレーニングを完了します。詳細については、「トレーニングとテストの検証結果マニフェストを理解する」を参照してください。検証ルールの詳細については、「マニフェストファイルの検証ルール」を参照してください。

注記

JSON 行エラーが多すぎるとトレーニングは失敗します。

非ターミナル JSON 行エラーも修正することをお勧めします。将来的にエラーが発生したり、モデルのトレーニングに影響を与えたりする可能性があるためです。

Amazon Rekognition Custom Labels は、次のような非ターミナル JSON 行検証エラーを生成する場合があります。