Transkription von Mehrkanal-Audio - Amazon Transcribe

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Transkription von Mehrkanal-Audio

Wenn Ihr Audio zwei Kanäle hat, können Sie die Kanalidentifikation verwenden, um die Sprache von jedem Kanal separat zu transkribieren. Amazon Transcribeunterstützt derzeit kein Audio mit mehr als zwei Kanälen.

In Ihrem Transkript werden den Kanälen die Bezeichnungench_0 und zugewiesench_1.

Zusätzlich zu den standardmäßigen Transkriptabschnitten (transcriptsunditems) enthalten Anfragen mit aktivierter Kanalidentifikation einenchannel_labels Abschnitt. Dieser Abschnitt enthält jede Äußerung oder jedes Satzzeichen, gruppiert nach Kanälen, sowie die zugehörige Kanalbezeichnung, Zeitstempel und Konfidenzwert.

"channel_labels": { "channels": [ { "channel_label": "ch_0", "items": [ { "channel_label": "ch_0", "start_time": "4.86", "end_time": "5.01", "alternatives": [ { "confidence": "1.0", "content": "I've" } ], "type": "pronunciation" }, ... "channel_label": "ch_1", "items": [ { "channel_label": "ch_1", "start_time": "8.5", "end_time": "8.89", "alternatives": [ { "confidence": "1.0", "content": "Sorry" } ], "type": "pronunciation" }, ... "number_of_channels": 2 },

Beachten Sie, dass, wenn eine Person auf einem Kanal gleichzeitig mit einer Person auf einem separaten Kanal spricht, sich die Zeitstempel für jeden Kanal überschneiden, während die Personen übereinander sprechen.

Ein vollständiges Beispieltranskript mit Kanalidentifikation finden Sie unterBeispiel Kanalidentifikationsausgabe (Batch).

Verwendung der Kanalidentifikation bei einer Batch-Transkription

Um Kanäle in einer Batch-Transkription zu identifizieren, können Sie die AWS Management ConsoleAWS CLI, oder AWSSDKs verwenden. Beispiele finden Sie im Folgenden:

  1. Melden Sie sich an der AWS Management Console an.

  2. Wählen Sie im Navigationsbereich Transkriptionsaufträge und dann Job erstellen (oben rechts) aus. Dadurch wird die Seite „Jobdetails angeben“ geöffnet.

    Amazon TranscribeKonsolenseite „Auftragsdetails angeben“. Im Bereich „Auftragseinstellungen“ können Sie einen Namen für Ihren Transkriptionsjob angeben, einen Modelltyp auswählen und Ihre Spracheinstellungen festlegen.
  3. Füllen Sie auf der Seite „Jobdetails angeben“ alle Felder aus, die Sie einbeziehen möchten, und wählen Sie dann Weiter aus. Dadurch gelangen Sie zur Seite Job konfigurieren — optional.

    Wählen Sie im Bereich Audioeinstellungen die Option Kanalidentifikation aus (unter der Überschrift „Audioidentifizierungstyp“).

    Amazon TranscribeKonsolenseite „Job konfigurieren“. Im Bereich „Audioeinstellungen“ können Sie die Kanalidentifikation aktivieren.
  4. Wählen Sie Job erstellen aus, um Ihren Transkriptionsjob auszuführen.

In diesem Beispiel verwenden wir den start-transcription-job. Weitere Informationen finden Sie unter StartTranscriptionJob.

aws transcribe start-transcription-job \ --region us-west-2 \ --transcription-job-name my-first-transcription-job \ --media MediaFileUri=s3://DOC-EXAMPLE-BUCKET/my-input-files/my-media-file.flac \ --output-bucket-name DOC-EXAMPLE-BUCKET \ --output-key my-output-files/ \ --language-code en-US \ --settings ChannelIdentification=true

Hier ist ein weiteres Beispiel mit dem start-transcription-jobBefehl und einem Anforderungstext, der die Kanalidentifikation mit diesem Job ermöglicht.

aws transcribe start-transcription-job \ --region us-west-2 \ --cli-input-json file://my-first-transcription-job.json

Die Datei my-first-transcription-job.json enthält den folgenden Anforderungstext.

{ "TranscriptionJobName": "my-first-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/my-input-files/my-media-file.flac" }, "OutputBucketName": "DOC-EXAMPLE-BUCKET", "OutputKey": "my-output-files/", "LanguageCode": "en-US", "Settings": { "ChannelIdentification": true } }

In diesem Beispiel wird der verwendetAWS SDK for Python (Boto3), um Kanäle mithilfe der Methode start_transcription_job zu identifizieren. Weitere Informationen finden Sie unter StartTranscriptionJob.

from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', 'us-west-2') job_name = "my-first-transcription-job" job_uri = "s3://DOC-EXAMPLE-BUCKET/my-input-files/my-media-file.flac" transcribe.start_transcription_job( TranscriptionJobName = job_name, Media = { 'MediaFileUri': job_uri }, OutputBucketName = 'DOC-EXAMPLE-BUCKET', OutputKey = 'my-output-files/', LanguageCode = 'en-US', Settings = { 'ChannelIdentification':True } ) while True: status = transcribe.get_transcription_job(TranscriptionJobName = job_name) if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)

Verwendung der Kanalidentifikation in einer Streaming-Transkription

Um Kanäle in einer Streaming-Transkription zu identifizieren, können Sie HTTP/2 verwenden oder WebSockets; Beispiele finden Sie im Folgenden:

In diesem Beispiel wird eine HTTP/2-Anfrage erstellt, die Kanäle in Ihrer Transkriptionsausgabe trennt. Weitere Informationen zur Verwendung von HTTP/2-Streaming mitAmazon Transcribe finden Sie unterEinen HTTP /2-Stream einrichten. Weitere Informationen zu Parametern und Headern, die spezifisch für sindAmazon Transcribe, finden Sie unter StartStreamTranscription.

POST /stream-transcription HTTP/2 host: transcribestreaming.us-west-2.amazonaws.com X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription Content-Type: application/vnd.amazon.eventstream X-Amz-Content-Sha256: string X-Amz-Date: 20220208T235959Z Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string x-amzn-transcribe-language-code: en-US x-amzn-transcribe-media-encoding: flac x-amzn-transcribe-sample-rate: 16000 x-amzn-channel-identification: TRUE transfer-encoding: chunked

Parameterdefinitionen finden Sie in der API-Referenz. Parameter, die allenAWS API-Vorgängen gemeinsam sind, sind im Abschnitt Allgemeine Parameter aufgeführt.

In diesem Beispiel wird eine vorsignierte URL erstellt, die die Kanäle in Ihrer Transkriptionsausgabe voneinander trennt. Für eine bessere Lesbarkeit werden Zeilenumbrüche hinzugefügt. Weitere Informationen zur Verwendung von WebSocket Streams mitAmazon Transcribe finden Sie unterEinen Stream einrichten WebSocket . Weitere Informationen zu Parametern finden Sie unter StartStreamTranscription.

GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket? &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request &X-Amz-Date=20220208T235959Z &X-Amz-Expires=300 &X-Amz-Security-Token=security-token &X-Amz-Signature=string &X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date &language-code=en-US &specialty=PRIMARYCARE &type=DICTATION &media-encoding=flac &sample-rate=16000 &channel-identification=TRUE

Parameterdefinitionen finden Sie in der API-Referenz. Parameter, die allenAWS API-Vorgängen gemeinsam sind, sind im Abschnitt Allgemeine Parameter aufgeführt.