本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
Amazon Comprehend 使用自然語言處理 (NLP) 來擷取文件內容的洞見。它可透過識別文件中的實體、關鍵片語、語言、情感和其他常見元素,以此形成洞見。使用 Amazon Comprehend 根據對文件結構的了解來建立新的產品。例如,使用 Amazon Comprehend,您可以搜尋社交網路饋送以取得提及的產品,或掃描整個文件儲存庫以取得金鑰片語。
您可以使用 Amazon Comprehend 主控台或使用 Amazon Comprehend APIs 來存取 Amazon Comprehend 文件分析功能。您可以針對小型工作負載執行即時分析,也可以針對大型文件集啟動非同步分析任務。您可以使用 Amazon Comprehend 提供的預先訓練模型,也可以訓練自己的自訂模型以進行分類和實體辨識。
Amazon Comprehend 可能會儲存您的內容,以持續改善其預先訓練模型的品質。如需進一步了解,請參閱 Amazon Comprehend 常見問答集
所有 Amazon Comprehend 功能都接受 UTF-8 文字文件做為輸入。此外,自訂分類和自訂實體辨識接受影像檔案、PDF 檔案和 Word 檔案做為輸入。
Amazon Comprehend 可以根據特定功能,檢查和分析各種語言的文件。如需詳細資訊,請參閱Amazon Comprehend 支援的語言。Amazon Comprehend 主要語言的功能可以檢查文件,並判斷更廣泛語言選擇的主要語言。
主題
Amazon Comprehend 洞見
Amazon Comprehend 使用預先訓練的模型來檢查和分析文件或一組文件,以收集其相關見解。此模型會在大量文字內文上持續訓練,因此您不需要提供訓練資料。
Amazon Comprehend 會分析下列類型的洞見:
-
實體 – 參考文件中包含的人員、位置、項目和位置名稱。
-
關鍵片語 – 出現在文件中的片語。例如,有關籃球遊戲的文件可能會傳回隊伍名稱、場地名稱和最終分數。
-
個人身分識別資訊 (PII) – 可識別個人身分的個人資料,例如地址、銀行帳戶號碼或電話號碼。
-
語言 – 文件的主要語言。
-
情緒 – 文件的主要情緒,可以是正面、中性、負面或混合。
-
目標情緒 – 與文件中特定實體相關聯的情緒。每個實體出現時的情緒可以是正面、負面、中性或混合。
-
語法 – 文件中每個字詞的語音部分。
如需詳細資訊,請參閱深入分析。
Amazon Comprehend Custom
您可以根據您的特定需求自訂 Amazon Comprehend,而無需建置機器學習型 NLP 解決方案所需的技能。Amazon Comprehend Custom 會使用自動機器學習或 AutoML,使用您已擁有的資料,代表您建置自訂的 NLP 模型。
自訂分類 – 建立自訂分類模型 (分類器),將文件整理成您自己的類別。
自訂實體辨識 – 建立自訂實體辨識模型 (辨識器),以分析特定詞彙和以名詞為基礎的片語的文字。
如需詳細資訊,請參閱Amazon Comprehend Custom。
飛輪
使用飛輪可簡化訓練和管理自訂模型版本的程序。飛輪有助於協調與訓練和評估新版本模型相關的任務。Flywheels 支援純文字自訂模型,可用於自訂分類和自訂實體辨識。如需詳細資訊,請參閱飛輪。
文件叢集 (主題建模)
您也可以使用 Amazon Comprehend 來檢查文件的 corpus,以根據其中的類似關鍵字來組織它們。文件叢集 (主題建模) 有助於將大型文件組合組織成根據文字頻率相似的主題或叢集。如需詳細資訊,請參閱主題建模。
範例
下列範例示範如何在應用程式中使用 Amazon Comprehend 操作。
範例 1:尋找有關主題的文件
使用 Amazon Comprehend 主題建模尋找特定主題的文件。掃描一組文件以判斷討論的主題,並尋找與每個主題相關聯的文件。您可以指定 Amazon Comprehend 應該從文件集傳回的主題數量。
範例 2:了解客戶對您的產品的感受
如果您的公司發佈目錄,讓 Amazon Comprehend 告訴您客戶對您的產品有何想法。將每個客戶評論傳送到 DetectSentiment
操作,它會告訴您客戶是否對產品感到正面、負面、中立或混合。
範例 3:探索什麼對您的客戶很重要
使用 Amazon Comprehend 主題建模來探索您的客戶在論壇和訊息板上討論的主題,然後使用實體偵測來判斷他們與該主題相關聯的人員、位置和物件。使用情緒分析來判斷客戶對主題的感受。
優勢
使用 Amazon Comprehend 的優點包括:
-
將強大的自然語言處理整合至您的應用程式 – Amazon Comprehend 透過簡單的 API 提供強大且準確的自然語言處理,消除了在應用程式中建置文字分析功能的複雜性。您不需要文字分析專業知識,就能利用 Amazon Comprehend 產生的洞見。
-
以深度學習為基礎的自然語言處理 – Amazon Comprehend 使用深度學習技術來準確分析文字。我們的模型會不斷在多個網域中訓練新資料,以提高準確性。
-
可擴展的自然語言處理 – Amazon Comprehend 可讓您分析數百萬份文件,以便探索其中包含的洞見。
-
與其他 AWS 服務整合 – Amazon Comprehend 旨在與其他 AWS 服務無縫搭配 AWS KMS運作,例如 Amazon S3 和 AWS Lambda。將文件存放在 Amazon S3 中,或使用 Firehose 分析即時資料。支援 AWS Identity and Access Management (IAM) 可讓您輕鬆安全地控制對 Amazon Comprehend 操作的存取。使用 IAM,您可以建立和管理使用者和群組,將適當的存取權授予開發人員和最終使用者。
-
輸出結果和磁碟區資料的加密 – Amazon S3 已可讓您加密輸入文件,而 Amazon Comprehend 甚至會進一步延伸。透過使用您自己的 KMS 金鑰,您可以加密任務的輸出結果,以及連接至處理分析任務之運算執行個體的儲存磁碟區上的資料。結果是大幅增強了安全性。
-
低成本 – 使用 Amazon Comprehend 時,沒有最低費用或預付承諾。您需為分析的文件和您訓練的自訂模型付費。
Amazon Comprehend 定價
使用 Amazon Comprehend,您只需為所使用的資源付費。如果您是新 AWS 客戶,可免費開始使用 Amazon Comprehend。如需詳細資訊,請參閱AWS 免費用量方案
執行即時或非同步分析任務需支付使用費。您需付費訓練自訂模型,並支付自訂模型管理的費用。對於使用自訂模型的即時請求,從您啟動端點到刪除端點為止,您要支付端點的費用。使用飛輪不收取額外費用。不過,當您執行飛輪反覆運算時,您需要支付訓練新模型版本和儲存模型資料的標準費用。
如需費率和其他詳細資訊,請參閱 Amazon Comprehend 定價
您是第一次使用 Amazon Comprehend 嗎?
如果您是第一次使用 Amazon Comprehend,我們建議您依序閱讀下列各節:
-
運作方式 – 本節介紹 Amazon Comprehend 概念。
-
設定 – 在此區段中,您會建立 帳戶並設定 AWS CLI。
-
Amazon Comprehend 入門 – 在本節中,您會執行 Amazon Comprehend 分析任務。
-
教學課程:使用 Amazon Comprehend 分析客戶評論的洞見 – 在本節中,您會執行情緒和實體分析,並將結果視覺化。
-
Amazon Comprehend API 參考 – Amazon Comprehend 操作的參考文件。
AWS 提供下列資源來了解 Amazon Comprehend 服務:
-
AWS Machine Learning 部落格
包含有關 Amazon Comprehend 的實用文章。 -
Amazon Comprehend Resources
提供有關 Amazon Comprehend 的實用影片和教學課程。