Amazon Bedrock でのモデル評価のテキスト要約 - Amazon Bedrock

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon Bedrock でのモデル評価のテキスト要約

テキスト要約は、ニュース、法的文書、学術論文、コンテンツプレビュー、コンテンツキュレーションの要約作成などのタスクに使用されます。モデルのトレーニングに使用されるテキストのあいまいさ、一貫性、バイアス、流暢さ、情報の損失、正解率、関連性、文脈の不一致は、レスポンスの質に影響を与える可能性があります。

重要

テキストの要約では、Cohere モデルが有害性評価を正常に完了できないという既知のシステムの問題があります。

次の組み込みデータセットは、タスク要約タスクタイプでの使用がサポートされています。

Gigaword

Gigaword データセットは、ニュース記事の見出しで構成されています。このデータセットはテキスト要約タスクに使用されます。

次の表は、計算済みのメトリクスと推奨の組み込みデータセットをまとめたものです。を使用して使用可能な組み込みデータセットを正常に指定するには AWS CLI、またはサポートされている AWS SDK は、 列のパラメータ名である組み込みデータセット (API) を使用します。

Amazon Bedrock のテキスト要約に使用できる組み込みデータセット
タスクタイプ メトリクス 組み込みデータセット (コンソール) 組み込みデータセット (API) 計算済みのメトリクス
テキスト要約 正解率 Gigaword Builtin.Gigaword BERTScore
有害性 Gigaword Builtin.Gigaword 有害性
堅牢性 Gigaword Builtin.Gigaword

BERTScore および deltaBERTScore

各組み込みデータセットの計算済みのメトリクスの計算方法の詳細については、「Amazon Bedrock でモデル評価ジョブレポートとメトリクスを確認する」を参照してください。