翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
エンティティ
エンティティとは、人や場所、あるいは商品などの現実世界のオブジェクトの固有の名前をテキストで表したものであり、日付や数量などの測定値を正確に表すことができます。
たとえば、「John moved to 1313 Mockingbird Lane in 2012」というテキストでは、「John」は PERSON
と認識され、「1313 Mockingbird Lane」は LOCATION
、「2012」 はDATE
と認識されます。
各エンティティには、エンティティタイプが正しく検出されたという Amazon Comprehend の信頼レベルを示すスコアも含まれます。スコアの低いエンティティを除外して、誤検出を使ってしまう行うリスクを減らすことができます。
以下の表はエンティティのタイプをまとめています。
型 | 説明 |
---|---|
COMMERCIAL_ITEM |
ブランド製品 |
DATE |
日付 (11/25/2017 など)、曜日 (Tuesday)、月 (May)、または時刻 (8:30 a.m.) |
EVENT |
フェスティバル、コンサート、選挙などのイベント |
LOCATION |
国、都市、湖、建物などの特定の場所 |
ORGANIZATION |
政府、企業、宗教、スポーツチームなどの大規模な組織 |
OTHER |
他のどのエンティティカテゴリにも当てはまらないエンティティ |
PERSON |
個人、グループ、ニックネーム、架空の人物 |
QUANTITY |
通貨、パーセント、数値、バイト数などの数量。 |
TITLE |
映画、本、歌など、あらゆる作品や創作作品に付けられた正式名称。 |
エンティティの検出オペレーションは、Amazon Comprehend がサポートする主要言語のいずれかを使用して実行できます。これには、定義済み (カスタムではない) エンティティの検出のみが対象になります。ドキュメントの言語はすべて同じである必要があります。
次の API オペレーションのいずれかを使用して、ドキュメントまたはドキュメントセット内のエンティティを検出できます。
これらのオペレーションは、ドキュメント内のエンティティごとに 1 つの割合で、API エンティティオブジェクトのリストを返します。BatchDetectEntities
オペレーションは、バッチ内のドキュメントごとに 1 つのリストの割合で Entity
オブジェクトのリストを返します。StartEntitiesDetectionJob
オペレーションは、ジョブ内のドキュメントごとに Entity
オブジェクトのリスト 1 つを含むファイルを生成する非同期ジョブを開始します。
以下は、DetectEntities
オペレーションからのレスポンスの例です。
{
"Entities": [
{
"Text": "today",
"Score": 0.97,
"Type": "DATE",
"BeginOffset": 14,
"EndOffset": 19
},
{
"Text": "Seattle",
"Score": 0.95,
"Type": "LOCATION",
"BeginOffset": 23,
"EndOffset": 30
}
],
"LanguageCode": "en"
}