本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
事件
使用事件偵測來分析特定類型事件及其相關實體的文字文件。Amazon Comprehend 支援使用非同步分析任務跨大型文件集合進行事件偵測。如需事件的詳細資訊,包括事件分析任務範例,請參閱宣布推出 Amazon Comprehend Events
實體
從輸入文字中,Amazon Comprehend 會擷取與偵測到的事件相關的實體清單。實體可以是真實世界的物件,例如人員、地點或位置;實體也可以是概念,例如測量、日期或數量。實體每次出現都會透過提及來識別,這是輸入文字中實體的文字參考。對於每個唯一的實體,所有提及項目都會分組到清單中。此清單提供實體發生之輸入文字中每個位置的詳細資訊。Amazon Comprehend 只會偵測與支援的事件類型相關聯的實體。
與支援的事件類型相關聯的每個實體都會傳回下列相關詳細資訊:
-
提及:輸入文字中相同實體每次出現的詳細資訊。
-
BeginOffset:輸入文字中的字元位移,顯示提及開始的位置 (第一個字元位於位置 0)。
-
EndOffset:輸入文字中的字元位移,顯示提及的結束位置。
-
分數:Amazon Comprehend 對實體類型準確性的可信度。
-
GroupScore:來自 Amazon Comprehend 的可信度層級,指出該提及項目已正確分組為相同實體的其他提及項目。
-
文字:實體的文字。
-
類型:實體的類型。如需所有支援的實體類型,請參閱 實體類型。
-
事件
Amazon Comprehend 傳回在輸入文字中偵測到的事件清單 (支援的事件類型)。每個事件都會傳回下列相關詳細資訊:
-
類型:事件的類型。如需所有支援的事件類型,請參閱 事件類型。
-
引數:與偵測到的事件相關的引數清單。引數由與偵測到的事件相關的實體組成。引數的角色描述關係,例如誰執行動作、時間和地點。
-
EntityIndex:從 Amazon Comprehend 傳回用於此分析的實體清單中識別實體的索引值。
-
角色:引數類型,描述此引數的實體與事件的關聯。如需所有支援的引數類型,請參閱 引數類型。
-
分數:Amazon Comprehend 對角色偵測準確性的可信度。
-
-
觸發條件:偵測到事件的觸發條件清單。觸發是表示事件發生的單一單字或片語。
-
BeginOffset:輸入文字中的字元位移,顯示觸發程序開始的位置 (第一個字元位於位置 0)。
-
EndOffset:輸入文字中的字元位移,顯示觸發程序結束的位置。
-
分數:Amazon Comprehend 對偵測準確性的可信度。
-
文字:觸發程序的文字。
-
GroupScore:來自 Amazon Comprehend 的可信度層級,即觸發條件已正確分組為相同事件的其他觸發條件。
-
類型:此觸發器指示的事件類型。
-
偵測事件結果格式
當您的事件偵測任務完成時,Amazon Comprehend 會將分析結果寫入您啟動任務時指定的 Amazon S3 輸出位置。
對於每個偵測到的事件,輸出會以下列格式提供詳細資訊:
{ "Entities": [ { "Mentions": [ { "BeginOffset": number, "EndOffset": number, "Score": number, "GroupScore": number, "Text": "string", "Type": "string" }, ... ] }, ... ], "Events": [ { "Type": "string", "Arguments": [ { "EntityIndex": number, "Role": "string", "Score": number }, ... ], "Triggers": [ { "BeginOffset": number, "EndOffset": number, "Score": number, "Text": "string", "GroupScore": number, "Type": "string" }, ... ] }, ... ] }
實體、事件和引數支援的類型
實體類型
Type | 描述 |
---|---|
DATE | 日期或時間的任何參考,無論是特定或一般。 |
設施 | 建築物、機場、高速公路、橋樑和其他永久的人工結構和房地產改善。 |
LOCATION | 實體位置,例如街道、城市、州、國家/地區、水體或地理座標。 |
MONETARY_VALUE | 以美元或其他貨幣為單位的物件值。此值可以是特定或近似值。 |
組織 | 由已建立的組織結構定義的公司和其他人員群組。 |
人物 | 個人或虛構角色的名稱或暱稱。 |
PERSON_TITLE | 描述人員的任何標題,通常是雇用類別 (例如 CEO) 或榮譽 (例如 Mr.)。 |
數量 | 數字或值和測量單位。 |
STOCK_CODE | 股票代號,例如 AMZN、國際證券識別號碼 (ISIN)、統一證券識別程序委員會 (CUSIP) 或股票交易所每日官方清單 (SEDOL)。 |
事件類型
Type | 描述 |
---|---|
BANKRUPTCY | 涉及無法償還未償還債務之個人或公司的法律程序。 |
僱用 | 當員工被雇用、解雇、淘汰或以其他方式變更雇用狀態時發生。 |
CORPORATE_ACQUISTION | 當公司取得大部分或所有其他公司的股票或實體資產,以取得該公司的控制權時,便會發生。 |
INVESTMENT_GENERAL | 當個人或公司購買資產時,可能會產生未來的收入或收益。 |
CORPORATE_MERGER | 當兩家或多家公司聯合建立新法人實體時發生。 |
IPO | 在新的股票發行中,向大眾公開發行私有公司股票的初始公開發行 (IPO)。 |
RIGHTS_ISSUE | 一組提供給現有股東的權利,以購買額外的股票,稱為訂閱權杖,與其現有持倉成比例。 |
SECONDARY_OFFERING | 公司股東提供的有價證券。 |
SHELF_OFFERING | 一種美國證券交易委員會 (SEC) 條款,可讓發行者註冊新的安全問題,並在一段時間內銷售部分問題,而無須重新註冊該安全或產生懲罰。也稱為層架註冊。 |
TENDER_OFFERING | 購買公司中部分或全部股東股票的提議。 |
STOCK_SPLIT | 當公司的董事會透過發行更多股票給目前的股東來增加未發行的股票數量時,便會發生。此事件也適用於反向股票分割。 |
引數類型
引數類型 | 描述 |
---|---|
FILER | 提交該破產的個人或公司。 |
DATE | 暫停的日期或時間。 |
PLACE | 發生 (或最接近) 破產的位置或設施。 |
Type | 描述 |
---|---|
員工 | 公司僱用的人員。 |
EMPLOYEE_TITLE | 員工的標題。 |
員工 | 雇用該員工的人員或公司。 |
START_DATE | 僱用的開始日期或時間。 |
END_DATE | 僱用的結束日期或時間。 |
Type | 描述 |
---|---|
AMOUNT | 與交易相關聯的貨幣值。 |
INVESTEE | 與投資相關聯的個人或公司。 |
INVESTOR | 投資資產的人員或公司。 |
DATE | 取得或投資的日期或時間。 |
PLACE | (或最接近) 進行收購或投資的位置。 |
Type | 描述 |
---|---|
DATE | 合併的日期或時間。 |
NEW_COMPANY | 合併所產生的新法人實體。 |
參與者 | 參與合併的公司。 |
Type | 描述 |
---|---|
EXPIRE_DATE | 優惠的過期日期或時間。 |
INVESTOR | 投資資產的人員或公司。 |
優惠 | 接收優惠的個人或公司。 |
OFFERING_AMOUNT | 與 優惠相關聯的貨幣值。 |
OFFERING_DATE | 優惠的日期或時間。 |
優惠 | 發起方案的人員或公司。 |
OFFEROR_TOTAL_VALUE | 與方案相關聯的貨幣總值。 |
RECORD_DATE | 方案的記錄日期或時間。 |
SELLING_AGENT | 協助銷售優惠的人員或公司。 |
SHARE_PRICE | 與股票價格相關聯的貨幣值。 |
SHARE_QUANTITY | 與 優惠相關聯的共用數目。 |
編寫者 | 與方案承銷相關聯的公司。 |
Type | 描述 |
---|---|
公司 | 發行股票分割份額的公司。 |
DATE | 股票分割的日期或時間。 |
SPLIT_RATIO | 增加的已發行新股數量與股票分割之前目前股票數量的比率。 |