什麼是 Amazon Comprehend? - Amazon Comprehend

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

什麼是 Amazon Comprehend?

Amazon Comprehend 使用自然語言處理 (NLP) 來擷取有關文件內容的見解。它可透過識別文件中的實體、關鍵片語、語言、情感和其他常見元素,以此形成洞見。使用 Amazon Comprehend 根據了解文件的結構來建立新產品。例如,使用 Amazon Comprehend,您可以搜尋社交網路摘要以取得產品的提及,或掃描整個文件儲存庫中的關鍵片語。

您可以使用亞馬遜主控台或使用 Amazon Comprehend API 存取 Amazon Comprehend 文件分析功能。您可以針對小型工作負載執行即時分析,也可以針對大型文件集啟動非同步分析工作。您可以使用 Amazon Comprehend 提供的預先訓練模型,也可以訓練自己的自訂模型以進行分類和實體辨識。

Amazon Comprehend 可能會儲存您的內容,以持續改善其預先訓練模型的品質。請參閱亞馬遜常見問答集以進一步了解

Amazon Comprehend 的所有功能都接受 UTF-8 文本文檔作為輸入。此外,自訂分類和自訂實體辨識可接受影像檔案、PDF 檔案和 Word 檔案做為輸入。

Amazon Comprehend 可以檢查和分析各種語言的文件,具體取決於特定功能。如需詳細資訊,請參閱 Amazon Comprehend 支持的語言。Amazon Comprehend 的主要语言功能可以檢查文件並判斷更廣泛的語言選擇的主要語言。

Amazon Comprehend 洞察

Amazon Comprehend 使用預先訓練的模型來檢查和分析文件或一組文件,以收集有關該文件的見解。此模型會在大型文字上持續訓練,因此您不需要提供訓練資料。

亞馬遜分析了以下類型的見解:

  • 實體 — 文件中包含之人員、地點、項目和位置名稱的參照。

  • 關鍵片語 — 出現在文件中的片語。例如,關於籃球比賽的文件可能會傳回球隊名稱、場地名稱和最終得分。

  • 人身份信息(PII)— 可以識別個人的個人數據,例如地址,銀行帳戶號碼或電話號碼。

  • 語言 — 文件的主要語言。

  • 情緒 — 文件的主要情緒,可以是正面、中性、負面或混合。

  • 目標情緒 — 與文件中特定實體相關聯的情緒。每個實體出現的情緒可以是正面、負面、中性或混合。

  • 語法 — 文件中每個單字的語音部分。

如需詳細資訊,請參閱 深入分析

Amazon Comprehend 定制

您可以根據自己的特定需求自訂 Amazon Comprehend,而不必具備建置機器學習型 NLP 解決方案所需的技能組合。Amazon Comprehend 自訂可使用自動機器學習或 AutoML,使用您現有的資料代表您建立自訂的 NLP 模型。

訂分類 — 建立自訂分類模型 (分類器),將文件組織成您自己的類別。

自訂實體辨識 — 建立自訂實體辨識模型 (辨識器),以分析特定詞彙和以名詞為基礎的片語的文字。

如需詳細資訊,請參閱 Amazon Comprehend 定制

飞轮

使用飛輪簡化隨著時間的推移訓練和管理自訂模型版本的程序。飛輪有助於協調與訓練和評估新模型版本相關的任務。Flywheels 支援用於自訂分類和自訂實體辨識的純文字自訂模型。如需詳細資訊,請參閱 飞轮

文件叢集 (主題建模)

您也可以使用 Amazon Comprehend 來檢查文件的語料庫,以根據其中的類似關鍵字來組織文件。文件叢集 (主題模型) 有助於將大型文件語料庫組織成以字詞頻率為基礎的類似主題或叢集。如需詳細資訊,請參閱 主題建模

範例

下列範例顯示如何在應用程式中使用 Amazon Comprehend 操作。

範例 1:尋找有關主旨的文件

使用亞馬遜主題建模來尋找有關特定主題的文件。掃描一組文件以決定討論的主題,並尋找與每個主題相關聯的文件。您可以指定 Amazon Comprehend 應該從文件集傳回的主題數目。

範例 2:了解客戶對您的產品的看法

如果您的公司發佈目錄,請讓 Amazon Comprehend 告訴您客戶對您產品的看法。將每個客戶評論發送到DetectSentiment操作中,它會告訴您客戶對產品的感覺是否正面,負面,中立或混合。

範例 3:發現對您的客戶至關重要的事情

使用 Amazon Comprehend 主題模型來探索客戶在論壇和留言板上討論的主題,然後使用實體偵測來判斷與主題相關聯的人員、地點和事物。使用情緒分析來判斷客戶對某個主題的看法。

優勢

使用 Amazon Comprehend 的好處包括:

  • 強大的自然語言處理功能整合到您的應用程式中 — Amazon Comprehend 透過簡單的 API 提供強大且精確的自然語言處理功能,從而消除在應用程式中建立文字分析功能的複雜性。您不需要文字分析專業知識,就能利用 Amazon Comprehend 產生的深入解析。

  • 深度學習為基礎的自然語言處理 — Amazon Comprehend 使用深度學習技術精確地分析文字。我們的模型經過不斷訓練,涵蓋多個領域的新資料,以提高準確性。

  • 擴展的自然語言處理 — Amazon Comprehend 可讓您分析數百萬份文件,以便探索其中包含的深入解析。

  • 與其他 AWS 服務整合 — Amazon Comprehend 的設計可與 Amazon S3 和等其他 AWS 服務無縫協作。 AWS KMS AWS Lambda將您的文件存放在 Amazon S3 中,或使用 Firehose 分析即時資料。Support AWS Identity and Access Management (IAM) 可讓您輕鬆安全地控制對 Amazon Comprehend 操作的存取。您可以使用 IAM 建立和管理使用者和群組,將適當的存取權授予開發人員和使用者。

  • 輸出結果和磁碟區資料的加密 — Amazon S3 已經讓您加密輸入文件,而 Amazon Comprehend 將此文件擴展得更遠。透過使用自己的 KMS 金鑰,您可以加密任務的輸出結果,以及連接至處理分析工作之運算執行個體的儲存磁碟區上的資料。結果顯著增強了安全性。

  • 低成本 — 有了 Amazon Comprehend,就沒有最低費用或前期承諾。您需要支付您分析的文件以及訓練的自訂模型。

Amazon Comprehend 定價

使用 Amazon Comprehend,您只需為使用的資源付費。如果您是新 AWS 客戶,您可以免費開始使用 Amazon Comprehend。如需詳細資訊,請參閱AWS 免費用量方案

執行即時或非同步分析工作需支付使用費。您需要付費訓練自訂模型,而且需要支付自訂模型管理費用。對於使用自訂模型的即時請求,您需要從啟動端點開始支付端點費用,直到刪除端點為止。使用飛輪不收取額外費用。但是,當您執行飛輪反覆運算時,會產生訓練新模型版本和儲存模型資料的標準費用。

如需費率和其他詳細資訊,請參 Amazon Comprehend 定價。

您是亞馬遜的首次使用者嗎?

如果您是 Amazon Comprehend 的第一次使用者,我們建議您依序閱讀以下各節:

  1. 運作方式— 本節介紹 Amazon Comprehend 概念。

  2. 設定— 在本節中,您可以創建一個帳戶並設置 AWS CLI.

  3. 開始使用 Amazon Comprehend— 在本節中,您執行 Amazon Comprehend 分析任務。

  4. 教學:使用亞馬遜分析客戶評論中的見解— 在本節中,您會執行情緒和實體分析,並視覺化結果。

  5. Amazon Comprehend API 參考 — Amazon Comprehend 操作的參考文檔。

AWS 提供下列資源,以了解有關亞馬遜服務的資源: