Transkribieren mit dem AWS CLI - Amazon Transcribe

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Transkribieren mit dem AWS CLI

Wenn Sie den verwenden AWS CLI , um eine Transkription zu starten, können Sie alle Befehle auf CLI-Ebene ausführen. Oder Sie führen den gewünschten Befehl aus, gefolgt von AWS-Region und dem Speicherort einer JSON-Datei, die einen Anforderungstext enthält. In diesem Leitfaden werden beide Methoden anhand von Beispielen dargestellt; dieser Abschnitt konzentriert sich jedoch auf die erste Methode.

Das unterstützt AWS CLI keine Streaming-Transkriptionen.

Bevor Sie fortfahren, vergewissern Sie sich, dass Sie Folgendes getan haben:

Sie finden alle AWS CLI Befehle für Amazon Transcribe in der AWS CLI Befehlsreferenz.

Aufnahme einer neuen Tätigkeit im Bereich der Transkription

Um eine neue Transkription zu starten, verwenden Sie den Befehl start-transcription-job .

  1. Geben Sie in einem Terminalfenster Folgendes ein:

    aws transcribe start-transcription-job \

    In der nächsten Zeile erscheint ein „>“, und Sie können nun, wie im nächsten Schritt beschrieben, die erforderlichen Parameter hinzufügen.

    Sie können „\“ auch weglassen und alle Parameter mit einem Leerzeichen getrennt anhängen.

  2. Mit dem Befehl start-transcription-job müssen Sie region, transcription-job-name, media und entweder language-code oder identify-languageeinschließen.

    Wenn Sie einen Ausgabespeicherort angeben möchten, fügen Sie output-bucket-name in Ihre Anfrage ein; wenn Sie einen Unterordner des angegebenen Ausgabebereichs angeben möchten, fügen Sie auch output-key ein.

    aws transcribe start-transcription-job \ --region us-west-2 \ --transcription-job-name my-first-transcription-job \ --media MediaFileUri=s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac \ --language-code en-US

    Wenn alle Parameter angehängt werden, sieht diese Anfrage wie folgt aus:

    aws transcribe start-transcription-job --region us-west-2 --transcription-job-name my-first-transcription-job --media MediaFileUri=s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac --language-code en-US

    Wenn Sie mit output-bucket-namekeinen Ausgabebereich angeben, legt Amazon Transcribe Ihre Transkriptionsausgabe in einem vom Dienst verwalteten Bereich ab. Die in einem serviceverwalteten Bucket gespeicherten Transkripte laufen nach 90 Tagen ab.

    Amazon Transcribe antwortet mit:

    { "TranscriptionJob": { "TranscriptionJobName": "my-first-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "en-US", "Media": { "MediaFileUri": "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac" }, "StartTime": "2022-03-07T15:03:44.246000-08:00", "CreationTime": "2022-03-07T15:03:44.229000-08:00" } }

Ihr Transkriptionsauftrag ist erfolgreich, wenn TranscriptionJobStatus von IN_PROGRESS auf COMPLETED wechselt. Um die aktualisierte TranscriptionJobStatus zu sehen, verwenden Sie den Befehl get-transcription-job oder list-transcription-job, wie im folgenden Abschnitt gezeigt.

Abrufen des Status eines Transkriptionsauftrags

Um Informationen über Ihren Transkriptionsauftrag zu erhalten, verwenden Sie den Befehl get-transcription-job.

Die einzigen erforderlichen Parameter für diesen Befehl sind der AWS-Region Speicherort des Auftrags und der Name des Auftrags.

aws transcribe get-transcription-job \ --region us-west-2 \ --transcription-job-name my-first-transcription-job

Amazon Transcribe antwortet mit:

{ "TranscriptionJob": { "TranscriptionJobName": "my-first-transcription-job", "TranscriptionJobStatus": "COMPLETED", "LanguageCode": "en-US", "MediaSampleRateHertz": 48000, "MediaFormat": "flac", "Media": { "MediaFileUri": "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac" }, "Transcript": { "TranscriptFileUri": "https://s3.the-URI-where-your-job-is-located.json" }, "StartTime": "2022-03-07T15:03:44.246000-08:00", "CreationTime": "2022-03-07T15:03:44.229000-08:00", "CompletionTime": "2022-03-07T15:04:01.158000-08:00", "Settings": { "ChannelIdentification": false, "ShowAlternatives": false } } }

Wenn Sie Ihren eigenen Amazon S3 Bucket für Ihre Transkriptionsausgabe ausgewählt haben, ist dieser Bucket mit TranscriptFileUri aufgeführt. Wenn Sie einen serviceverwalteten Bucket ausgewählt haben, wird ein temporärer URI bereitgestellt. Verwenden Sie diesen URI, um Ihr Transkript herunterzuladen.

Anmerkung

URIs Temporäre oder vom Service verwaltete Amazon S3 Buckets sind nur für 15 Minuten gültig. Wenn Sie bei der Verwendung der URI eine AccesDenied Fehlermeldung erhalten, führen Sie die Anforderung get-transcription-job erneut aus, um eine neue temporäre URI zu erhalten.

Auflistung Ihrer Transkriptionsaufträge

Verwenden Sie den Befehl, um alle Ihre Transkriptionsaufträge in einer bestimmten AWS-Region Liste aufzulisten. list-transcription-jobs

Der einzige erforderliche Parameter für diesen Befehl ist der, AWS-Region in dem sich Ihre Transkriptionsaufträge befinden.

aws transcribe list-transcription-jobs \ --region us-west-2

Amazon Transcribe antwortet mit:

{ "NextToken": "A-very-long-string", "TranscriptionJobSummaries": [ { "TranscriptionJobName": "my-first-transcription-job", "CreationTime": "2022-03-07T15:03:44.229000-08:00", "StartTime": "2022-03-07T15:03:44.246000-08:00", "CompletionTime": "2022-03-07T15:04:01.158000-08:00", "LanguageCode": "en-US", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "SERVICE_BUCKET" } ] }

Löschen Ihres Transkriptionsauftrags

Zum Löschen Ihres Transkriptionsauftrags verwenden Sie den Befehl delete-transcription-job.

Die einzigen erforderlichen Parameter für diesen Befehl sind der AWS-Region Ort, an dem sich der Job befindet, und der Name des Jobs.

aws transcribe delete-transcription-job \ --region us-west-2 \ --transcription-job-name my-first-transcription-job

Um zu bestätigen, dass Ihre Löschanfrage erfolgreich war, können Sie den Befehl list-transcription-jobs ausführen. Ihr Auftrag sollte nicht mehr in der Liste erscheinen.