本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
實體
實體是一種文字參考,用於真實世界物件的唯一名稱,例如人物、地點和商業項目,以及精確參考日期和數量等指標。
例如,在文字中「John 於 2012 年移至 1313 Mockingbird Lane」,「John」可能被識別為 PERSON
,「1313 Mockingbird Lane」可能被識別為 LOCATION
,而「2012」可能被識別為 DATE
。
每個實體也都有一個分數,指出 Amazon Comprehend 正確偵測到實體類型的可信度。您可以篩選分數較低的實體,以降低使用不正確偵測的風險。
下表列出實體類型。
Type | 描述 |
---|---|
COMMERCIAL_ITEM |
品牌產品 |
DATE |
完整日期 (例如 11/25/2017)、天 (星期二)、月 (五月) 或時間 (上午 8:30) |
EVENT |
活動,例如節日、音樂會、選舉等。 |
LOCATION |
特定位置,例如國家、城市、湖、建築物等。 |
組織 |
大型組織,例如政府、公司、宗教、運動隊伍等。 |
OTHER |
不符合任何其他實體類別的實體 |
人物 |
個人、人物群組、綽號、虛構角色 |
數量 |
量化金額,例如貨幣、百分比、數字、位元組等。 |
標題 |
提供給任何創作或創意作品的官方名稱,例如電影、書籍、歌曲等。 |
您可以使用 Amazon Comprehend 支援的任何主要語言來執行偵測實體操作。這只包含預先定義的 (非自訂) 實體偵測。所有文件都必須使用相同的語言。
您可以使用下列任何 API 操作來偵測文件或一組文件中的實體。
操作會傳回 API 實體物件的清單,文件中每個實體各一個。BatchDetectEntities
操作會傳回Entity
物件清單,即批次中每個文件的清單。StartEntitiesDetectionJob
操作會啟動非同步任務,產生包含任務中每個文件Entity
物件清單的檔案。
下列範例是 DetectEntities
操作的回應。
{
"Entities": [
{
"Text": "today",
"Score": 0.97,
"Type": "DATE",
"BeginOffset": 14,
"EndOffset": 19
},
{
"Text": "Seattle",
"Score": 0.95,
"Type": "LOCATION",
"BeginOffset": 23,
"EndOffset": 30
}
],
"LanguageCode": "en"
}