Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Transkription eines Echtzeit-Streams unter Verwenden eines benutzerdefinierten medizinischen Vokabulars
Um die Transkriptionsgenauigkeit in einem Echtzeit-Stream zu verbessern, können Sie ein benutzerdefiniertes Vokabular verwenden, das entweder HTTP/2 oder Streams verwendet. WebSocket Um eine HTTP/2-Anfrage zu starten, verwenden Sie die StartMedicalStreamTranscription
-API. Sie können ein benutzerdefiniertes Vokabular in Echtzeit verwenden AWS Management Console, indem Sie entweder die StartMedicalStreamTranscription
API oder das WebSocket Protokoll verwenden.
AWS Management Console Um das Streaming-Audio eines medizinischen Diktats zu transkribieren, wählen Sie die Option zum Transkribieren eines medizinischen Diktats, starten Sie den Stream und beginnen Sie, in das Mikrofon zu sprechen.
Transkribieren von Streaming-Audio eines medizinischen Diktats (AWS Management Console)
-
Melden Sie sich an der AWS Management Console
an. -
Wählen Sie im Navigationsbereich unter Amazon Transcribe Medizinisch die Option Transkription in Echtzeit aus.
-
Wählen Sie unter Medizinisches Fachgebiet das medizinische Fachgebiet des Arztes, der im Stream spricht.
-
Wählen Sie als Audioeingangstyp entweder Gespräch oder Diktat.
-
Wählen Sie für Zusätzliche Einstellungen die Option Benutzerdefiniertes Vokabular.
-
Wählen Sie für die Vokalbularauswahl das benutzerdefinierte Vokabular.
-
-
Wählen Sie dann Start Streaming (Streamen starten).
-
Sprechen Sie in das Mikrofon.
Im Folgenden wird die Syntax für die Parameter einer HTTP/2-Anfrage beschrieben.
POST /medical-stream-transcription HTTP/2
host: transcribestreaming.us-west-2
.amazonaws.com
authorization: Generated value
x-amz-target: com.amazonaws.transcribe.Transcribe.StartMedicalStreamTranscription
x-amz-content-sha256: STREAMING-MED-AWS4-HMAC-SHA256-EVENTS
x-amz-date: 20220208T235959Z
x-amzn-transcribe-session-id: my-first-http2-med-stream
x-amzn-transcribe-language-code: en-US
x-amzn-transcribe-media-encoding: flac
x-amzn-transcribe-sample-rate: 16000
x-amzn-transcribe-vocabulary-name: my-first-med-vocab
x-amzn-transcribe-specialty: PRIMARYCARE
x-amzn-transcribe-type: CONVERSATION
x-amzn-transcribe-show-speaker-label: true
Content-type: application/vnd.amazon.eventstream
transfer-encoding: chunked
Beschreibung der Parameter:
-
host: Aktualisiere das AWS-Region ('us-west-2' im vorherigen Beispiel) mit dem, das AWS-Region du anrufst. Eine Liste der gültigen Endpoints finden Sie AWS-Regionen unter Endpoints AWS-Regionen .
-
Berechtigung: Dies ist ein generiertes Feld. Weitere Informationen zum Erstellen einer Signatur finden Sie unter Signieren von AWS Anfragen mit Signature Version 4.
-
x-amz-target: Ändern Sie dieses Feld nicht. Verwenden Sie den Inhalt, der im vorherigen Beispiel gezeigt wurde.
-
x-amz-content-sha256: Dies ist ein generiertes Feld. Weitere Informationen zur Berechnung einer Signatur finden Sie unter Signieren von AWS Anfragen mit Signature Version 4.
-
x-amz-date: Datum und Uhrzeit der Erstellung der Signatur. Das Format ist JJJJMMTTTHHMMSSZ, wobei JJJJ=Jahr, MM=Monat, TT=Tag, HH=Stunde, MM=Minute, SS=Sekunden und „T“ und „Z“ feste Zeichen sind. Weitere Informationen finden Sie unter Handhabung von Daten in Signature Version 4.
-
x-amzn-transcribe-session-id: Der Name für deine Streaming-Sitzung.
-
x-amzn-transcribe-language-code: Die Kodierung, die für Ihr Eingangs-Audio verwendet wird. Eine Liste gültiger Werte finden Sie unter
StartMedicalStreamTranscription
oder Unterstützte Sprachen und sprachspezifische Funktionen. -
x-amzn-transcribe-media-encoding: Die Kodierung, die für Ihr Eingangs-Audio verwendet wird. Gültige Werte sind
pcm
,ogg-opus
undflac
. -
x-amzn-transcribe-sample-rate: Die Samplerate des Eingangs-Audios (in Hertz). Amazon Transcribe unterstützt einen Bereich von 8.000 Hz bis 48.000 Hz. Niedrige Audioqualitäten, wie z. B. Telefonton, liegen in der Regel bei 8.000 Hz. Hochwertige Audiosignale liegen in der Regel im Bereich von 16.000 Hz bis 48.000 Hz. Beachten Sie, dass die von Ihnen angegebene Samplerate mit der Ihres Audios übereinstimmen muss.
-
x-amzn-transcribe-vocabulary-name: Der Name des Vokabulars, das Sie für Ihre Transkription verwenden möchten.
-
x-amzn-transcribe-specialty: Das medizinische Fachgebiet, das transkribiert wird.
-
x-amzn-transcribe-type: Wählen Sie aus, ob es sich um ein Diktat oder eine Konversation handelt.
-
x-amzn-transcribe-show-speaker-label: Um die Diarisierung zu aktivieren, muss dieser Wert
true
-
Inhaltstyp: Ändern Sie dieses Feld nicht; verwenden Sie den Inhalt aus dem vorangegangenen Beispiel.
Um Lautsprecher mit der API in WebSocket Streams zu partitionieren, verwenden Sie das folgende Format, um einen vorsignierten URI zu erstellen, um eine WebSocket Anfrage zu starten, und setzen Sie ihn vocabulary-name
auf den Namen des benutzerdefinierten Vokabulars.
GET wss://transcribestreaming.
us-west-2
.amazonaws.com:8443/medical-stream-transcription-websocket ?language-code=en-US &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=AKIAIOSFODNN7EXAMPLE
%2F20220208
%2Fus-west-2
%2Ftranscribe
%2Faws4_request &X-Amz-Date=20220208T235959Z
&X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=Signature Version 4 signature
&X-Amz-SignedHeaders=host &media-encoding=flac
&sample-rate=16000
&session-id=sessionId
&specialty=medicalSpecialty
&type=CONVERSATION
&vocabulary-name=vocabularyName
&show-speaker-label=boolean