事件 - Amazon Comprehend

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

事件

使用事件偵測來分析特定類型事件及其相關實體的文字文件。Amazon Comprehend 支援使用非同步分析任務跨大型文件集合進行事件偵測。如需事件的詳細資訊,包括事件分析任務範例,請參閱宣布推出 Amazon Comprehend Events

實體

從輸入文字中,Amazon Comprehend 會擷取與偵測到的事件相關的實體清單。實體可以是真實世界的物件,例如人員、地點或位置;實體也可以是概念,例如測量、日期或數量。實體每次出現都會透過提及來識別,這是輸入文字中實體的文字參考。對於每個唯一的實體,所有提及項目都會分組到清單中。此清單提供實體發生之輸入文字中每個位置的詳細資訊。Amazon Comprehend 只會偵測與支援的事件類型相關聯的實體。

與支援的事件類型相關聯的每個實體都會傳回下列相關詳細資訊:

  • 提及:輸入文字中相同實體每次出現的詳細資訊。

    • BeginOffset:輸入文字中的字元位移,顯示提及開始的位置 (第一個字元位於位置 0)。

    • EndOffset:輸入文字中的字元位移,顯示提及的結束位置。

    • 分數:Amazon Comprehend 對實體類型準確性的可信度。

    • GroupScore:來自 Amazon Comprehend 的可信度層級,指出該提及項目已正確分組為相同實體的其他提及項目。

    • 文字:實體的文字。

    • 類型:實體的類型。如需所有支援的實體類型,請參閱 實體類型

事件

Amazon Comprehend 傳回在輸入文字中偵測到的事件清單 (支援的事件類型)。每個事件都會傳回下列相關詳細資訊:

  • 類型:事件的類型。如需所有支援的事件類型,請參閱 事件類型

  • 引數:與偵測到的事件相關的引數清單。引數由與偵測到的事件相關的實體組成。引數的角色描述關係,例如執行動作時間和地點

    • EntityIndex:從 Amazon Comprehend 傳回用於此分析的實體清單中識別實體的索引值。

    • 角色:引數類型,描述此引數的實體與事件的關聯。如需所有支援的引數類型,請參閱 引數類型

    • 分數:Amazon Comprehend 對角色偵測準確性的可信度。

  • 觸發條件:偵測到事件的觸發條件清單。觸發是表示事件發生的單一單字或片語。

    • BeginOffset:輸入文字中的字元位移,顯示觸發程序開始的位置 (第一個字元位於位置 0)。

    • EndOffset:輸入文字中的字元位移,顯示觸發程序結束的位置。

    • 分數:Amazon Comprehend 對偵測準確性的可信度。

    • 文字:觸發程序的文字。

    • GroupScore:來自 Amazon Comprehend 的可信度層級,即觸發條件已正確分組為相同事件的其他觸發條件。

    • 類型:此觸發器指示的事件類型。

偵測事件結果格式

當您的事件偵測任務完成時,Amazon Comprehend 會將分析結果寫入您啟動任務時指定的 Amazon S3 輸出位置。

對於每個偵測到的事件,輸出會以下列格式提供詳細資訊:

{ "Entities": [ { "Mentions": [ { "BeginOffset": number, "EndOffset": number, "Score": number, "GroupScore": number, "Text": "string", "Type": "string" }, ... ] }, ... ], "Events": [ { "Type": "string", "Arguments": [ { "EntityIndex": number, "Role": "string", "Score": number }, ... ], "Triggers": [ { "BeginOffset": number, "EndOffset": number, "Score": number, "Text": "string", "GroupScore": number, "Type": "string" }, ... ] }, ... ] }

實體、事件和引數支援的類型

實體類型

Type 描述
DATE 日期或時間的任何參考,無論是特定或一般。
設施 建築物、機場、高速公路、橋樑和其他永久的人工結構和房地產改善。
LOCATION 實體位置,例如街道、城市、州、國家/地區、水體或地理座標。
MONETARY_VALUE 以美元或其他貨幣為單位的物件值。此值可以是特定或近似值。
組織 由已建立的組織結構定義的公司和其他人員群組。
人物 個人或虛構角色的名稱或暱稱。
PERSON_TITLE 描述人員的任何標題,通常是雇用類別 (例如 CEO) 或榮譽 (例如 Mr.)。
數量 數字或值和測量單位。
STOCK_CODE 股票代號,例如 AMZN、國際證券識別號碼 (ISIN)、統一證券識別程序委員會 (CUSIP) 或股票交易所每日官方清單 (SEDOL)。

事件類型

Type 描述
BANKRUPTCY 涉及無法償還未償還債務之個人或公司的法律程序。
僱用 當員工被雇用、解雇、淘汰或以其他方式變更雇用狀態時發生。
CORPORATE_ACQUISTION 當公司取得大部分或所有其他公司的股票或實體資產,以取得該公司的控制權時,便會發生。
INVESTMENT_GENERAL 當個人或公司購買資產時,可能會產生未來的收入或收益。
CORPORATE_MERGER 當兩家或多家公司聯合建立新法人實體時發生。
IPO 在新的股票發行中,向大眾公開發行私有公司股票的初始公開發行 (IPO)。
RIGHTS_ISSUE 一組提供給現有股東的權利,以購買額外的股票,稱為訂閱權杖,與其現有持倉成比例。
SECONDARY_OFFERING 公司股東提供的有價證券。
SHELF_OFFERING 一種美國證券交易委員會 (SEC) 條款,可讓發行者註冊新的安全問題,並在一段時間內銷售部分問題,而無須重新註冊該安全或產生懲罰。也稱為層架註冊。
TENDER_OFFERING 購買公司中部分或全部股東股票的提議。
STOCK_SPLIT 當公司的董事會透過發行更多股票給目前的股東來增加未發行的股票數量時,便會發生。此事件也適用於反向股票分割。

引數類型

BANKRUPTCY 的引數類型
引數類型 描述
FILER 提交該破產的個人或公司。
DATE 暫停的日期或時間。
PLACE 發生 (或最接近) 破產的位置或設施。
EMPLOYMENT 的引數類型
Type 描述
員工 公司僱用的人員。
EMPLOYEE_TITLE 員工的標題。
員工 雇用該員工的人員或公司。
START_DATE 僱用的開始日期或時間。
END_DATE 僱用的結束日期或時間。
CORPORATE_ACQUISTION、INVESTMENT_GENERAL 的引數類型
Type 描述
AMOUNT 與交易相關聯的貨幣值。
INVESTEE 與投資相關聯的個人或公司。
INVESTOR 投資資產的人員或公司。
DATE 取得或投資的日期或時間。
PLACE (或最接近) 進行收購或投資的位置。
CORPORATE_MERGER 的引數類型
Type 描述
DATE 合併的日期或時間。
NEW_COMPANY 合併所產生的新法人實體。
參與者 參與合併的公司。
IPO、RIGHTS_ISSUE、SecCONDARY_OFFERING、SHELF_OFFERING、TENDER_OFFERING 的引數類型
Type 描述
EXPIRE_DATE 優惠的過期日期或時間。
INVESTOR 投資資產的人員或公司。
優惠 接收優惠的個人或公司。
OFFERING_AMOUNT 與 優惠相關聯的貨幣值。
OFFERING_DATE 優惠的日期或時間。
優惠 發起方案的人員或公司。
OFFEROR_TOTAL_VALUE 與方案相關聯的貨幣總值。
RECORD_DATE 方案的記錄日期或時間。
SELLING_AGENT 協助銷售優惠的人員或公司。
SHARE_PRICE 與股票價格相關聯的貨幣值。
SHARE_QUANTITY 與 優惠相關聯的共用數目。
編寫者 與方案承銷相關聯的公司。
STOCK_SPLIT 的引數類型
Type 描述
公司 發行股票分割份額的公司。
DATE 股票分割的日期或時間。
SPLIT_RATIO 增加的已發行新股數量與股票分割之前目前股票數量的比率。