翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
モデルを調教した後、Amazon Comprehend はカスタム分類子モデルをテストします。テストデータセットを指定しないと、Amazon Comprehend は調教データの 90% を使用してモデルを調教します。調教データの 10% はテスト用に確保されます。テストデータセットを与える場合、テストデータには調教データセット内の固有のラベルごとに少なくとも 1 つの例が含まれている必要があります。
モデルをテストすると、モデルの精度推定に使用できる指標が得られます。コンソールの分類子の詳細ページの分類子パフォーマンスセクションに指標が表示されます。また、DescribeDocumentClassifier 演算機能によって Metrics
フィールドにも返されます。
次の調教データ例では、 DOCUMENTARY、DOCUMENTARY、SCIENCE_FICTION、DOCUMENTARY、ROMANTIC_COMEDY の 5 つのラベルがあります。DOCUMENTARY、SCIENCE_FICTION、ROMANTIC_COMEDY の 3 つの固有クラスがあります。
列 1 | 列 2 |
---|---|
DOCUMENTARY | 文書テキスト 1 |
DOCUMENTARY | 文書テキスト 2 |
SCIENCE_FICTION | 文書テキスト 3 |
DOCUMENTARY | 文書テキスト 4 |
ROMANTIC_COMEDY | 文書テキスト 5 |
自動分割(Amazon Comprehend が調教データの 10% をテスト用に確保)では、調教データに含まれている特定のラベルが限られていると、テストデータセットにはそのラベルの例が全くないという結果になり得ます。たとえば、調教データセットに DOCUMENTARY クラスのインスタンスが 1000 個、SCIENCE_FICTION のインスタンスが 900 個、ROMANTIC_COMEDY クラスのインスタンスが 1 つしかない場合、テストデータセットには 100 個のドキュメンタリーインスタンスと 90 個の SCIENCE_FICTION インスタンスが含まれていても、ROMANTIC_COMEDY インスタンスはゼロになる可能性があります。
モデルの調教が終わると、調教指標で得られる情報から、モデルがニーズに十分合っているかどうかを判断できます。