本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
主題建模的非同步分析
若要確定文件集中的主題,請使StartTopicsDetectionJob用啟動非同步工作。您可以監控以英文或西班牙文撰寫的文件中的主題。
開始之前
在開始之前,請確保您擁有:
-
輸入和輸出儲存貯體 — 識別要用於輸入和輸出的 Amazon S3 儲存貯體。值區必須與您呼叫的 API 位於相同的區域。
-
IAM 服務角色 — 您必須擁有具有存取輸入和輸出值區之權限的 IAM 服務角色。如需詳細資訊,請參閱 非同步操作所需的角色型許可。
使用 AWS Command Line Interface
下面的實例演示了使用StartTopicsDetectionJob
操作與 AWS CLI
此範例格式適用於 Unix、Linux 和 macOS。用於 Windows 時,請以插入號 (^) 取代每一行結尾處的 Unix 接續字元斜線 (\)。
aws comprehend start-topics-detection-job \ --number-of-topics
topics to return
\ --job-name "job name
" \ --regionregion
\ --cli-input-json file://path to JSON input file
對於cli-input-json
參數,您為包含請求資料的 JSON 檔案提供路徑,如下列範例所示。
{ "InputDataConfig": { "S3Uri": "s3://
input bucket
/input path
", "InputFormat": "ONE_DOC_PER_FILE" }, "OutputDataConfig": { "S3Uri": "s3://output bucket
/output path
" }, "DataAccessRoleArn": "arn:aws:iam::account ID
:role/data access role
" }
如果啟動主題偵測工作的要求成功,您將會收到下列回應:
{
"JobStatus": "SUBMITTED",
"JobId": "job ID
"
}
使用此ListTopicsDetectionJobs作業可查看您已提交的主題偵測工作清單。此清單包含您使用的輸入和輸出位置以及每個偵測工作狀態的相關資訊。此範例格式適用於 Unix、Linux 和 macOS。用於 Windows 時,請以插入號 (^) 取代每一行結尾處的 Unix 接續字元斜線 (\)。
aws comprehend list-topics-detection-jobs \--
region
您將獲得類似於以下內容的 JSON 作為回應:
{
"TopicsDetectionJobPropertiesList": [
{
"InputDataConfig": {
"S3Uri": "s3://input bucket
/input path
",
"InputFormat": "ONE_DOC_PER_LINE"
},
"NumberOfTopics": topics to return
,
"JobId": "job ID
",
"JobStatus": "COMPLETED",
"JobName": "job name
",
"SubmitTime": timestamp
,
"OutputDataConfig": {
"S3Uri": "s3://output bucket
/output path
"
},
"EndTime": timestamp
},
{
"InputDataConfig": {
"S3Uri": "s3://input bucket
/input path
",
"InputFormat": "ONE_DOC_PER_LINE"
},
"NumberOfTopics": topics to return
,
"JobId": "job ID
",
"JobStatus": "RUNNING",
"JobName": "job name
",
"SubmitTime": timestamp
,
"OutputDataConfig": {
"S3Uri": "s3://output bucket
/output path
"
}
}
]
}
您可以使用此DescribeTopicsDetectionJob作業來取得現有工作的狀態。此範例格式適用於 Unix、Linux 和 macOS。用於 Windows 時,請以插入號 (^) 取代每一行結尾處的 Unix 接續字元斜線 (\)。
aws comprehend describe-topics-detection-job --job-id
job ID
您將獲得以下 JSON 作為響應:
{
"TopicsDetectionJobProperties": {
"InputDataConfig": {
"S3Uri": "s3://input bucket
/input path
",
"InputFormat": "ONE_DOC_PER_LINE"
},
"NumberOfTopics": topics to return
,
"JobId": "job ID
",
"JobStatus": "COMPLETED",
"JobName": "job name
",
"SubmitTime": timestamp
,
"OutputDataConfig": {
"S3Uri": "s3://output bucket
/ouput path
"
},
"EndTime": timestamp
}
}
使用開發套件進行 Python 或 AWS SDK for .NET
如需如何開始主題建模工作的 SDK 範例,請參閱StartTopicsDetectionJob 搭配 AWS SDK或 使用 CLI。