指南和配額 - Amazon Comprehend

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

指南和配額

除非另有說明,否則 Amazon Comprehend 的配額是以區域為單位。如果您的應用程式需要,您可以要求增加可調配額。如需配額的相關資訊以及要求增加配額,請參閱 AWS Service Quotas

支援地區

Amazon Comprehend 服務於下列區域提供: AWS

  • 美國東部 (俄亥俄)

  • 美國東部 (維吉尼亞北部)

  • 美國西部 (奧勒岡)

  • 亞太區域 (孟買)

  • 亞太區域 (首爾)

  • 亞太區域 (新加坡)

  • 亞太區域 (雪梨)

  • 亞太區域 (東京)

  • 加拿大 (中部)

  • 歐洲 (法蘭克福)

  • 歐洲 (愛爾蘭)

  • 歐洲 (倫敦)

  • AWS GovCloud (美國西部)

根據預設,Amazon Comprehend 會在每個支援的區域中提供所有 API 操作。如需例外狀況,請參閱文件處理

如需 API 端點的相關資訊,請參閱亞馬遜網路服務一般參考中的 Amazon Comprehend 區域和端點

若要檢閱區域中目前的配額,或要求增加可調配額的配額,請開啟「Service Quotas」主控台

內建模型的配額

Amazon Comprehend 提供內建模型供您分析 UTF-8 文字文件。Amazon Comprehend 提供使用內建模型的同步和非同步作業。

即時 (同步) 分析

本節說明使用內建模型進行即時分析的相關配額。

單一文件操作

Amazon Comprehend API 提供了將單個文檔作為輸入的操作。下列配額適用於這些作業。

單一文件作業的一般配額

下列配額適用於偵測實體、關鍵片語或主要語言的即時分析。對於實體偵測,這些配額適用於內建模型的偵測。如需自訂實體偵測的資訊,請參閱中的配額自訂實體辨識

描述 名額 / 指引
最大文件大小 100 KB
單一文件作業的特定作業配額

下列配額適用於偵測情緒、目標情緒和語法的即時分析。

描述 名額 / 指引
最大文件大小 5 KB

多重文件操作

Amazon Comprehend API 提供批次操作,可透過單一 API 請求處理多個文件。下列配額適用於批次作業。

描述 名額 / 指引
最大文件大小 5 KB
每個請求的最大文件 25

如需有關使用批次文件作業的詳細資訊,請參閱多文檔同步處理

即時 (同步) 要求的要求節流

亞馬遜套用動態節流到同步請求。如果系統處理頻寬可用,Amazon Comprehend 會逐漸增加其處理的請求數量。若要控制應用程式對同步 API 作業的使用,建議您在應用程式中開啟帳單警示或實作速率限制。

非同步分析

本節說明使用內建模型的非同步分析相關配額。

非同步 API 作業每個作業最多可支援 10 個作用中工作。若要檢視每個 API 作業的配額,請參閱 Amazon Comprehend 端點中的 Service Quotas 表和 Amazon Web Services 一般參考中的配額。

對於可調配額,您可以使用 Service Quotas 控制台申請增加配額。

非同步作業的一般配額

您可以使用主控台或任何 API 作業執行非同步分析工Start*作。如需何時使用非同步作業的資訊,請參閱非同步批次處理。下列配額適用於大部分內建模型的 API Start* 作業。有關例外情況,請參閱非同步工作的特定作業配額

描述 名額 / 指引
偵測實體、關鍵片語、PII 和語言的工作中,每個文件的大小上限 1 MB
請求中所有文件的最大總大小 5 GB
請求中所有檔案的最小總大小 500 位元組
檔案數目上限,每個檔案一個文件 1,000,000
最大總行數,每行一個文檔 1,000,000

非同步工作的特定作業配額

本節說明特定非同步作業的配額。如果未在下表中指定配額,則會套用一般配額值。

情緒

您使用作業建立的非同步情緒工StartSentimentDetectionJob作具有下列配額。

描述 名額 / 指引
每個輸入文件的大小上限 5 KB
目標情緒

您使用作業建立的非同步目標情緒工StartTargetedSentimentDetectionJob作具有下列配額。

描述 名額 / 指引
支援的文件格式 UTF-8
工作中每個文件的大小上限 10 KB
工作中所有文件的大小上限 三百公釐
檔案數目上限,每個檔案一個文件 30,000
最大總行數,每行一個文件 (適用於請求中的所有檔案) 30,000
事件

您使用作業建立的非同步事件偵測工StartEventsDetectionJob作具有下列配額。

描述 配額
字元編碼 UTF-8
工作中所有檔案的總大小 50 MB
工作中每個文件的大小上限 10 KB
檔案數目上限,每個檔案一個文件 5,000
最大總行數,每行一個文檔(適用於請求中的所有文件) 5,000
主題建模

您使用作業建立的非同步主題模型工StartTopicsDetectionJob作具有下列配額。

描述 名額 / 指引
字元編碼 UTF-8
要傳回的主題數目上限 100
一個檔案的最大檔案大小,每個檔案一個文件 100 MB

如需更多資訊,請參閱主題建模

異步請求的請求節流

每個非同步 API 作業支援每秒的請求數目上限 (每個區域、每個帳戶),以及最多 10 個作用中工作。若要檢視每個 API 作業的配額,請參閱 Amazon Comprehend 端點中的 Service Quotas 表和 Amazon Web Services 一般參考中的配額。

對於可調配額,您可以使用 Service Quotas 控制台申請增加配額。

自訂模型的配額

您可以使用 Amazon Comprehend 建立自己的自訂模型,以進行自訂分類和自訂實體辨識。本節提供與訓練和使用自訂模型相關的準則和配額。如需自訂模型的詳細資訊,請參閱Amazon Comprehend 定制

一般配額

Amazon Comprehend 會為您可以使用自訂模型進行分析的每種輸入文件類型設定一般大小配額。如需即時分析配額,請參閱即時分析的最大文件大小。如需非同步分析配額,請參閱非同步自訂分析的輸入

每個非同步 API 作業支援每秒的請求數目上限 (每個區域、每個帳戶),以及最多 10 個作用中工作。若要檢視每個 API 作業的配額,請參閱 Amazon Comprehend 端點中的 Service Quotas 表和 Amazon Web Services 一般參考中的配額。

對於可調配額,您可以使用 Service Quotas 控制台申請增加配額。

端點的配額

您可以建立端點以使用自訂模型執行即時分析。如需端點的相關資訊,請參閱管理 Amazon Comprehend 端點

下列配額適用於端點。如需如何要求增加配額的相關資訊,請參閱 AWS Service Quotas

描述 名額 / 指引
每個帳號每個區域的作用中端點數目上限 20
每個帳戶每個區域的推論單元數量上限 200
每個區域每個端點的推論單元數目上限 50
每個推論單位的最大輸送量 (字元) 每秒
每個推論單位 (文件) 的最大輸送量 每秒 2 次

文件分類

本節說明下列文件分類作業的準則與配額:

文件分類的一般配額

下表說明與訓練自訂分類器相關的一般配額。

描述 名額 / 指引
類別名稱的最大長度 五千個字元
類數(多類模式) 2—1,000
類別數目 (多標籤模式) 2—100
註釋格式
每個類的最小註釋數量(多類模式) 10
每個類的最小註釋數量(多標籤模式) 10
註釋的最小數目 (多標籤模式) 50
CSV 文件格式
每班培訓文件的最少數量(多課程模式) 50
每個班級的最少培訓文件數量(多標籤模式) 10
最少培訓文件數量(多標籤模式) 50

純文字文件的分類

您可以使用純文字輸入文件建立和訓練純文字模型。Amazon Comprehend 提供即時和非同步操作,以使用純文字模型對純文字文件進行分類。

培訓

下表說明與使用純文字文件訓練自訂分類器相關的配額。

描述 名額 / 指引
訓練工作中所有檔案的總大小 5 GB
訓練自訂分類器的增強資訊清單檔案數目上限 5
每個增強資訊清單檔案的屬性名稱數目上限 5
屬性名稱的最大長度 63 個字元
即時 (同步) 分析

下表說明與即時純文字文件分類相關的配額。

描述 名額 / 指引
每個同步請求的最大文檔數量 1
文字文件大小上限 (UTF-8 編碼) 10 KB
非同步分析

下表說明與純文字文件非同步分類相關的配額。

描述 名額 / 指引
非同步工作中所有檔案的總大小 5 GB
一個檔案的最大檔案大小,每個檔案一個文件 10 MB
檔案數目上限,每個檔案一個文件 1,000,000
最大總行數,每行一個文檔(適用於請求中的所有文件) 1,000,000

半結構化文件的分類

本節說明半結構化文件之文件分類的準則與配額。若要分類半結構化文件,請使用您使用原生輸入文件訓練的原生文件模型。

使用半結構化文件訓練原生文件模型

下表說明與使用半結構化文件 (例如 PDF 文件、Word 文件和影像檔) 訓練自訂分類器相關的配額。

描述 名額 / 指引
所有文件的最大頁數 10,000
最大註釋檔案大小 (所有 CSV 檔案大小合併) 5 MB
文件語料庫大小 (訓練與測試文件) 10 GB
訓練和測試檔案的檔案大小
圖像文件大小(JPG,PNG,TIFF)。 1 個字節-10 MB。

TIFF 檔案:最多一頁。

PDF 文件的頁面大小 1 個字節-10 MB
Word 文件的頁面大小 1 個字節-10 MB
Amazon Textract 取 API 輸出 JSON 大小 1 個字節-1 MB
即時 (同步) 分析

本節說明與半結構化文件的即時分類相關配額。

下表顯示輸入文件的最大檔案大小。對於所有輸入文件類型,輸入檔案最多為一頁,不超過 10,000 個字元。

檔案類型 大小上限 最大尺寸(控制台)
UTF-8 文字文件 10 KB 10 KB
PDF 文件 10 MB 5 MB
文字文件 10 MB 5 MB
影像檔 10 MB 5 MB
Amazon Textract 取 API 輸出大小 1 MB N/A
非同步分析

下表說明與非同步分類半結構化文件相關的配額。

描述 名額 / 指引
工作所有輸入文件的最大頁數 25,000
文件語料庫大小 25 GB
影像檔案大小 (JPG、PNG 或 TIFF 格式) 1 個字節-10 MB。

TIFF 檔案:最多一頁。

PDF 文件的頁面大小 1 個字節-10 MB
Word 文件的頁面大小 1 個字節-10 MB
Textract 取 API 輸出 JSON 大小 1 個字節-1 MB。

自訂實體辨識

本節說明下列自訂實體辨識作業的準則和配額:

純文字文件的自訂實體辨識

Amazon Comprehend 提供非同步和同步操作,可透過自訂實體辨識器分析純文字文件。

培訓

本節說明與訓練自訂實體辨識器以分析純文字文件相關的配額。若要訓練模型,您可以提供實體清單或一組已註解的文字文件。

下表說明與使用實體清單訓練模型相關的配額。

描述 名額 / 指引
每個模型的圖元數 1—25
文件大小 UTF-8 千字节
實體清單中的項目數 1 百萬
條目列表中個別條目的長度(後排) 1—5,000
實體列表語料庫大小(所有文檔以純文本組合) 5 KB

下表說明與使用註解文字文件訓練模型相關的配額。

描述 名額 / 指引
每個模型/自訂實體識別器的實體數量 1—25
文件大小 UTF-8 千字节
文件數目 (請參閱純文字註釋) 3—200,000
文件語料庫大小 (所有文件以純文字組合) 5 KB
每個圖元的最小註釋數 25
即時 (同步) 分析

下表說明與純文字文件的即時分析相關配額。

描述 名額 / 指引
每個同步請求的最大文檔數量 1
文字文件大小上限 (UTF-8 編碼) 5 KB
非同步分析

下表說明與純文字文件的非同步實體辨識相關的配額。

描述 名額/指引
文件大小 UTF-8 1 個字節-1 MB
檔案數目上限,每個檔案一個文件 1,000,000
最大總行數,每行一個文檔(適用於請求中的所有文件) 1,000,000
文件語料庫大小 (所有文件以純文字組合) 1 個字節 —5 GB

半結構化文件的自訂實體辨識

Amazon Comprehend 提供非同步和同步操作,可透過自訂實體辨識器分析半結構化文件。您必須使用帶註解的 PDF 文件來訓練模型。

培訓

下表說明與訓練自訂實體辨識器 (CreateEntityRecognizer) 以分析半結構化文件相關的配額。

描述 名額/指引
每個模型/自訂實體識別器的實體數量 1—25
註解檔案大小上限 UTF-8 5 MB
文件數 250—10,000
文件語料庫大小 (所有文件以純文字組合) 5 千兆 — 1 GB
每個圖元的最小註釋數 100
訓練自訂實體辨識器的增強資訊清單檔案數目上限 5
每個增強資訊清單檔案的屬性名稱數目上限 5
屬性名稱的最大長度 63 個字元
即時 (同步) 分析

本節說明與半結構化文件的即時分析相關配額。

下表顯示輸入文件的最大檔案大小。對於所有輸入文件類型,輸入檔案最多為一頁,不超過 10,000 個字元。

檔案類型 大小上限 最大尺寸(控制台)
UTF-8 文字文件 10 KB 10 KB
PDF 文件 10 MB 5 MB
文字文件 10 MB 5 MB
影像檔 10 MB 5 MB
文 Textract 輸出檔案 1 MB N/A
非同步分析

本節說明非同步分析半結構化文件的配額。

描述 名額/指引
影像大小 (JPG 或 PNG) 1 個字節-10 MB
影像尺寸 1 個字節-10 MB。最多一頁。
文件大小 1 個字節-50 MB
文件大小 (DOCX) 1 個字節 —5 MB
文件大小 UTF-8 1 個字節-1 MB
檔案數目上限,每個檔案一個文件 (影像檔案或 PDF/Word 文件不允許每行一個文件) 500
PDF 文件或 DOCX 文件的最大頁數 100
文本提取後的文檔語料庫大小(純文本,所有文件合併) 1 個字節 —5 GB

如需有關影像限制的詳細資訊,請參閱 Amazon Textract 中的硬性限制

飛輪配額

使用飛輪管理自訂模型版本的訓練和追蹤,以進行自訂分類和自訂實體辨識。若要取得有關飛輪的更多資訊,請參閱飞轮

飛輪的一般配額

以下配額適用於飛輪和飛輪迭代。

描述 名額/指引
最大飛輪數 50
「建立」狀態下的最大飛輪數 10
每個飛輪訓練資料集的最大數量 50
每個飛輪測試資料集的最大數量 50
具有擷取狀態的資料集數目上限 10
每個帳戶進行中的飛輪迭代次數上限 10

自訂分類模型的資料集配額

當您擷取與自訂分類模型相關聯之飛輪的資料集時,會套用下列配額。

描述 名額/指引
每個班級的最少培訓文件數量(多標籤模式) 50
培訓文件的最大數量 1,000,000
資料集大小下限 500 位元組
資料集大小上限 5 GB
一個檔案的最大檔案大小,每個檔案一個文件 10 MB

自訂實體辨識模型的資料集配額

當您擷取與自訂實體辨識模型相關聯之飛輪的資料集時,會套用下列配額。

描述 名額/指引
最大文件大小 5 KB
培訓文件的最少數量 3
培訓文件的最大數量 200,000
每個圖元的最小註釋數 25
資料集大小上限 200 MB