Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Um die Themen in einer Dokumentenmappe zu ermitteln, verwenden Sie den, StartTopicsDetectionJobum einen asynchronen Job zu starten. Sie können Themen in Dokumenten überwachen, die auf Englisch oder Spanisch verfasst sind.
Themen
Bevor Sie beginnen
Bevor Sie beginnen, stellen Sie sicher, dass Sie über Folgendes verfügen:
-
Eingabe- und Ausgabe-Buckets — Identifizieren Sie die Amazon S3 S3-Buckets, die Sie für Eingabe und Ausgabe verwenden möchten. Die Buckets müssen sich in derselben Region befinden wie die API, die Sie aufrufen.
-
IAM-Servicerolle — Sie benötigen eine IAM-Dienstrolle mit der Berechtigung, auf Ihre Eingabe- und Ausgabe-Buckets zuzugreifen. Weitere Informationen finden Sie unter Rollenbasierte Berechtigungen sind für asynchrone Operationen erforderlich.
Verwenden von AWS Command Line Interface
Das folgende Beispiel zeigt die Verwendung der StartTopicsDetectionJob
Operation mit AWS CLI
Das Beispiel ist für Unix, Linux und macOS formatiert. Ersetzen Sie unter Windows den umgekehrten Schrägstrich (\), das Unix-Fortsetzungszeichen, am Ende jeder Zeile durch ein Caret-Zeichen oder Zirkumflex (^).
aws comprehend start-topics-detection-job \ --number-of-topics
topics to return
\ --job-name "job name
" \ --regionregion
\ --cli-input-json file://path to JSON input file
Für den cli-input-json
Parameter geben Sie den Pfad zu einer JSON-Datei an, die die Anforderungsdaten enthält, wie im folgenden Beispiel gezeigt.
{ "InputDataConfig": { "S3Uri": "s3://
input bucket
/input path
", "InputFormat": "ONE_DOC_PER_FILE" }, "OutputDataConfig": { "S3Uri": "s3://output bucket
/output path
" }, "DataAccessRoleArn": "arn:aws:iam::account ID
:role/data access role
" }
Wenn die Anfrage zum Starten des Jobs zur Themenerkennung erfolgreich war, erhalten Sie die folgende Antwort:
{
"JobStatus": "SUBMITTED",
"JobId": "job ID
"
}
Verwenden Sie den ListTopicsDetectionJobsVorgang, um eine Liste der von Ihnen eingereichten Jobs zur Themenerkennung anzuzeigen. Die Liste enthält Informationen zu den von Ihnen verwendeten Eingabe- und Ausgabespeicherorten sowie zum Status der einzelnen Erkennungsaufträge. Das Beispiel ist für Unix, Linux und macOS formatiert. Ersetzen Sie unter Windows den umgekehrten Schrägstrich (\), das Unix-Fortsetzungszeichen, am Ende jeder Zeile durch ein Caret-Zeichen oder Zirkumflex (^).
aws comprehend list-topics-detection-jobs \--
region
Als Antwort erhalten Sie JSON, das dem Folgenden ähnelt:
{
"TopicsDetectionJobPropertiesList": [
{
"InputDataConfig": {
"S3Uri": "s3://input bucket
/input path
",
"InputFormat": "ONE_DOC_PER_LINE"
},
"NumberOfTopics": topics to return
,
"JobId": "job ID
",
"JobStatus": "COMPLETED",
"JobName": "job name
",
"SubmitTime": timestamp
,
"OutputDataConfig": {
"S3Uri": "s3://output bucket
/output path
"
},
"EndTime": timestamp
},
{
"InputDataConfig": {
"S3Uri": "s3://input bucket
/input path
",
"InputFormat": "ONE_DOC_PER_LINE"
},
"NumberOfTopics": topics to return
,
"JobId": "job ID
",
"JobStatus": "RUNNING",
"JobName": "job name
",
"SubmitTime": timestamp
,
"OutputDataConfig": {
"S3Uri": "s3://output bucket
/output path
"
}
}
]
}
Sie können den DescribeTopicsDetectionJobVorgang verwenden, um den Status eines vorhandenen Jobs abzurufen. Das Beispiel ist für Unix, Linux und macOS formatiert. Ersetzen Sie unter Windows den umgekehrten Schrägstrich (\), das Unix-Fortsetzungszeichen, am Ende jeder Zeile durch ein Caret-Zeichen oder Zirkumflex (^).
aws comprehend describe-topics-detection-job --job-id
job ID
Als Antwort erhalten Sie den folgenden JSON-Code:
{
"TopicsDetectionJobProperties": {
"InputDataConfig": {
"S3Uri": "s3://input bucket
/input path
",
"InputFormat": "ONE_DOC_PER_LINE"
},
"NumberOfTopics": topics to return
,
"JobId": "job ID
",
"JobStatus": "COMPLETED",
"JobName": "job name
",
"SubmitTime": timestamp
,
"OutputDataConfig": {
"S3Uri": "s3://output bucket
/ouput path
"
},
"EndTime": timestamp
}
}
Verwenden des SDK für Python oder SDK for .NET
SDK-Beispiele zum Starten eines Themen-Modellierungsjobs finden Sie unterVerwendung StartTopicsDetectionJob mit einem AWS SDK oder CLI.