實體 - Amazon Comprehend

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

實體

實體是一種文字參考,用於真實世界物件的唯一名稱,例如人物、地點和商業項目,以及精確參考日期和數量等指標。

例如,在文字中「John 於 2012 年移至 1313 Mockingbird Lane」,「John」可能被識別為 PERSON,「1313 Mockingbird Lane」可能被識別為 LOCATION,而「2012」可能被識別為 DATE

每個實體也都有一個分數,指出 Amazon Comprehend 正確偵測到實體類型的可信度。您可以篩選分數較低的實體,以降低使用不正確偵測的風險。

下表列出實體類型。

Type 描述

COMMERCIAL_ITEM

品牌產品

DATE

完整日期 (例如 11/25/2017)、天 (星期二)、月 (五月) 或時間 (上午 8:30)

EVENT

活動,例如節日、音樂會、選舉等。

LOCATION

特定位置,例如國家、城市、湖、建築物等。

組織

大型組織,例如政府、公司、宗教、運動隊伍等。

OTHER

不符合任何其他實體類別的實體

人物

個人、人物群組、綽號、虛構角色

數量

量化金額,例如貨幣、百分比、數字、位元組等。

標題

提供給任何創作或創意作品的官方名稱,例如電影、書籍、歌曲等。

您可以使用 Amazon Comprehend 支援的任何主要語言來執行偵測實體操作。這只包含預先定義的 (非自訂) 實體偵測。所有文件都必須使用相同的語言。

您可以使用下列任何 API 操作來偵測文件或一組文件中的實體。

操作會傳回 API 實體物件的清單,文件中每個實體各一個。BatchDetectEntities 操作會傳回Entity物件清單,即批次中每個文件的清單。StartEntitiesDetectionJob 操作會啟動非同步任務,產生包含任務中每個文件Entity物件清單的檔案。

下列範例是 DetectEntities操作的回應。

{ "Entities": [ { "Text": "today", "Score": 0.97, "Type": "DATE", "BeginOffset": 14, "EndOffset": 19 }, { "Text": "Seattle", "Score": 0.95, "Type": "LOCATION", "BeginOffset": 23, "EndOffset": 30 } ], "LanguageCode": "en" }