As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Transcrever um fluxo em tempo real usando um vocabulário médico personalizado
Para melhorar a precisão da transcrição em um stream em tempo real, você pode usar um vocabulário personalizado usando HTTP/2 ou streams. WebSocket Para iniciar uma solicitação HTTP/2, use a API StartMedicalStreamTranscription
. Você pode usar um vocabulário personalizado em tempo real usando a StartMedicalStreamTranscription
API ou usando o WebSocket protocolo. AWS Management Console
Para usar o AWS Management Console para transcrever o streaming de áudio de um ditado médico, escolha a opção de transcrever um ditado médico, iniciar a transmissão e começar a falar no microfone.
Como transcrever o streaming de áudio de um ditado médico (AWS Management Console)
-
Faça login no AWS Management Console
. -
No painel de navegação, em Amazon Transcribe Médico, escolha Transcrição em tempo real.
-
Em Especialidade médica, escolha a especialidade médica do médico que está se pronunciando no fluxo.
-
Em Tipo de entrada de áudio, escolha Conversa ou Ditado.
-
Em Configurações adicionais, escolha Vocabulário personalizado.
-
Em Seleção de vocabulário, escolha o vocabulário personalizado.
-
-
Selecione Start streaming (Iniciar transmissão).
-
Fale pelo microfone.
Veja a seguir a sintaxe dos parâmetros de uma solicitação HTTP/2.
POST /medical-stream-transcription HTTP/2 host: transcribestreaming.
us-west-2
.amazonaws.com authorization:Generated value
x-amz-target: com.amazonaws.transcribe.Transcribe.StartMedicalStreamTranscription x-amz-content-sha256:STREAMING-MED-AWS4-HMAC-SHA256-EVENTS
x-amz-date:20220208T235959Z
x-amzn-transcribe-session-id:my-first-http2-med-stream
x-amzn-transcribe-language-code: en-US x-amzn-transcribe-media-encoding:flac
x-amzn-transcribe-sample-rate:16000
x-amzn-transcribe-vocabulary-name:my-first-med-vocab
x-amzn-transcribe-specialty:PRIMARYCARE
x-amzn-transcribe-type:CONVERSATION
x-amzn-transcribe-show-speaker-label: true Content-type: application/vnd.amazon.eventstream transfer-encoding: chunked
Descrições dos parâmetros:
-
host: atualize o Região da AWS ('us-west-2' no exemplo anterior) com Região da AWS o que você está chamando. Para obter uma lista de pontos finais válidos Regiões da AWS, consulte Regiões da AWS Endpoints.
-
authorization: esse é um campo gerado. Para saber mais sobre como criar uma assinatura, consulte Assinando AWS solicitações com o Signature versão 4.
-
x-amz-target: não altere esse campo; use o conteúdo mostrado no exemplo anterior.
-
x-amz-content-sha256: Esse é um campo gerado. Para saber mais sobre o cálculo de uma assinatura, consulte Assinando AWS solicitações com o Signature versão 4.
-
x-amz-date: a data e a hora em que a assinatura foi criada. O formato é YYYYMMDDTHHMMSSZ, onde YYYY = ano, mm = mês, DD = dia, HH = hora, MM = minuto, SS = segundos e “T” e “Z” são caracteres fixos. Para obter mais informações, consulte Handling Dates in Signature Version 4.
-
x-amzn-transcribe-session-id: o nome da sua sessão de streaming.
-
x-amzn-transcribe-language-code: a codificação usada para o áudio de entrada. Consulte
StartMedicalStreamTranscription
ou Idiomas oferecidos e recursos específicos do idioma para obter uma lista de valores válidos. -
x-amzn-transcribe-media-encoding: a codificação usada para o áudio de entrada. Os valores válidos são
pcm
,ogg-opus
eflac
. -
x-amzn-transcribe-sample-rate: A taxa de amostragem do áudio de entrada (em Hertz). Amazon Transcribe suporta uma faixa de 8.000 Hz a 48.000 Hz. O áudio de baixa qualidade, como o áudio telefônico, normalmente gira em torno de 8.000 Hz. Áudio de alta qualidade normalmente varia de 16.000 Hz a 48.000 Hz. Observe que a taxa de amostragem especificada deve corresponder à do áudio.
-
x-amzn-transcribe-vocabulary-name: o nome do vocabulário que você deseja usar com sua transcrição.
-
x-amzn-transcribe-specialty: A especialidade médica que está sendo transcrita.
-
x-amzn-transcribe-type: escolha se isso é um ditado ou uma conversa.
-
x-amzn-transcribe-show-speaker-label: para habilitar a diarização, esse valor deve ser.
true
-
content-type: não altere esse campo; use o conteúdo mostrado no exemplo anterior.
Para particionar alto-falantes em WebSocket streams com a API, use o formato a seguir para criar um URI pré-assinado para iniciar uma WebSocket solicitação e vocabulary-name
definir o nome do vocabulário personalizado.
GET wss://transcribestreaming.
us-west-2
.amazonaws.com:8443/medical-stream-transcription-websocket ?language-code=en-US &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=AKIAIOSFODNN7EXAMPLE
%2F20220208
%2Fus-west-2
%2Ftranscribe
%2Faws4_request &X-Amz-Date=20220208T235959Z
&X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=Signature Version 4 signature
&X-Amz-SignedHeaders=host &media-encoding=flac
&sample-rate=16000
&session-id=sessionId
&specialty=medicalSpecialty
&type=CONVERSATION
&vocabulary-name=vocabularyName
&show-speaker-label=boolean