Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Transkription von Mehrkanal-Audio
Wenn Ihr Audio zwei Kanäle hat, können Sie die Kanalidentifikation verwenden, um die Sprache von jedem Kanal separat zu transkribieren. Amazon Transcribeunterstützt derzeit kein Audio mit mehr als zwei Kanälen.
In Ihrem Transkript werden den Kanälen die Bezeichnungench_0
und zugewiesench_1
.
Zusätzlich zu den standardmäßigen Transkriptabschnitten (transcripts
unditems
) enthalten Anfragen mit aktivierter Kanalidentifikation einenchannel_labels
Abschnitt. Dieser Abschnitt enthält jede Äußerung oder jedes Satzzeichen, gruppiert nach Kanälen, sowie die zugehörige Kanalbezeichnung, Zeitstempel und Konfidenzwert.
"channel_labels": { "channels": [ { "channel_label": "ch_0", "items": [ { "channel_label": "ch_0", "start_time": "4.86", "end_time": "5.01", "alternatives": [ { "confidence": "1.0", "content": "I've" } ], "type": "pronunciation" },
...
"channel_label": "ch_1", "items": [ { "channel_label": "ch_1", "start_time": "8.5", "end_time": "8.89", "alternatives": [ { "confidence": "1.0", "content": "Sorry" } ], "type": "pronunciation" },...
"number_of_channels": 2 },
Beachten Sie, dass, wenn eine Person auf einem Kanal gleichzeitig mit einer Person auf einem separaten Kanal spricht, sich die Zeitstempel für jeden Kanal überschneiden, während die Personen übereinander sprechen.
Ein vollständiges Beispieltranskript mit Kanalidentifikation finden Sie unterBeispiel Kanalidentifikationsausgabe (Batch).
Verwendung der Kanalidentifikation bei einer Batch-Transkription
Um Kanäle in einer Batch-Transkription zu identifizieren, können Sie die AWS Management ConsoleAWS CLI, oder AWSSDKs verwenden. Beispiele finden Sie im Folgenden:
-
Melden Sie sich an der AWS Management Console
an. -
Wählen Sie im Navigationsbereich Transkriptionsaufträge und dann Job erstellen (oben rechts) aus. Dadurch wird die Seite „Jobdetails angeben“ geöffnet.
-
Füllen Sie auf der Seite „Jobdetails angeben“ alle Felder aus, die Sie einbeziehen möchten, und wählen Sie dann Weiter aus. Dadurch gelangen Sie zur Seite Job konfigurieren — optional.
Wählen Sie im Bereich Audioeinstellungen die Option Kanalidentifikation aus (unter der Überschrift „Audioidentifizierungstyp“).
-
Wählen Sie Job erstellen aus, um Ihren Transkriptionsjob auszuführen.
In diesem Beispiel verwenden wir den start-transcription-jobStartTranscriptionJob
.
aws transcribe start-transcription-job \ --region
us-west-2
\ --transcription-job-namemy-first-transcription-job
\ --media MediaFileUri=s3://DOC-EXAMPLE-BUCKET
/my-input-files
/my-media-file
.flac
\ --output-bucket-nameDOC-EXAMPLE-BUCKET
\ --output-keymy-output-files
/ \ --language-codeen-US
\ --settings ChannelIdentification=true
Hier ist ein weiteres Beispiel mit dem start-transcription-job
aws transcribe start-transcription-job \ --region
us-west-2
\ --cli-input-json file://my-first-transcription-job
.json
Die Datei my-first-transcription-job.json enthält den folgenden Anforderungstext.
{ "TranscriptionJobName": "
my-first-transcription-job
", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET
/my-input-files
/my-media-file
.flac
" }, "OutputBucketName": "DOC-EXAMPLE-BUCKET
", "OutputKey": "my-output-files
/", "LanguageCode": "en-US
", "Settings": { "ChannelIdentification": true } }
In diesem Beispiel wird der verwendetAWS SDK for Python (Boto3), um Kanäle mithilfe der Methode start_transcription_job
from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', '
us-west-2
') job_name = "my-first-transcription-job
" job_uri = "s3://DOC-EXAMPLE-BUCKET
/my-input-files
/my-media-file
.flac
" transcribe.start_transcription_job( TranscriptionJobName = job_name, Media = { 'MediaFileUri': job_uri }, OutputBucketName = 'DOC-EXAMPLE-BUCKET
', OutputKey = 'my-output-files
/', LanguageCode = 'en-US
', Settings = { 'ChannelIdentification':True } ) while True: status = transcribe.get_transcription_job(TranscriptionJobName = job_name) if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)
Verwendung der Kanalidentifikation in einer Streaming-Transkription
Um Kanäle in einer Streaming-Transkription zu identifizieren, können Sie HTTP/2 verwenden oder WebSockets; Beispiele finden Sie im Folgenden:
In diesem Beispiel wird eine HTTP/2-Anfrage erstellt, die Kanäle in Ihrer Transkriptionsausgabe trennt. Weitere Informationen zur Verwendung von HTTP/2-Streaming mitAmazon Transcribe finden Sie unterEinen HTTP /2-Stream einrichten. Weitere Informationen zu Parametern und Headern, die spezifisch für sindAmazon Transcribe, finden Sie unter StartStreamTranscription.
POST /stream-transcription HTTP/2 host: transcribestreaming.
us-west-2
.amazonaws.com X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription
Content-Type: application/vnd.amazon.eventstream X-Amz-Content-Sha256:string
X-Amz-Date:20220208
T235959
Z Authorization: AWS4-HMAC-SHA256 Credential=access-key
/20220208
/us-west-2
/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string
x-amzn-transcribe-language-code:en-US
x-amzn-transcribe-media-encoding:flac
x-amzn-transcribe-sample-rate:16000
x-amzn-channel-identification: TRUE transfer-encoding: chunked
Parameterdefinitionen finden Sie in der API-Referenz. Parameter, die allenAWS API-Vorgängen gemeinsam sind, sind im Abschnitt Allgemeine Parameter aufgeführt.
In diesem Beispiel wird eine vorsignierte URL erstellt, die die Kanäle in Ihrer Transkriptionsausgabe voneinander trennt. Für eine bessere Lesbarkeit werden Zeilenumbrüche hinzugefügt. Weitere Informationen zur Verwendung von WebSocket Streams mitAmazon Transcribe finden Sie unterEinen Stream einrichten WebSocket . Weitere Informationen zu Parametern finden Sie unter StartStreamTranscription
.
GET wss://transcribestreaming.
us-west-2
.amazonaws.com:8443/stream-transcription-websocket? &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=AKIAIOSFODNN7EXAMPLE
%2F20220208
%2Fus-west-2
%2Ftranscribe
%2Faws4_request &X-Amz-Date=20220208
T235959
Z &X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=string
&X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date &language-code=en-US &specialty=PRIMARYCARE
&type=DICTATION
&media-encoding=flac
&sample-rate=16000
&channel-identification=TRUE
Parameterdefinitionen finden Sie in der API-Referenz. Parameter, die allenAWS API-Vorgängen gemeinsam sind, sind im Abschnitt Allgemeine Parameter aufgeführt.