As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
StartMedicalStreamTranscription
Inicia um HTTP/2 ou WebSocket stream bidirecional em que o áudio é transmitido para o Amazon Transcribe Medical e os resultados da transcrição são transmitidos para o aplicativo.
Os seguintes parâmetros são obrigatórios:
-
language-code
-
media-encoding
-
sample-rate
Para obter mais informações sobre streaming com o Amazon Transcribe Medical, consulte Transcrição de streaming de áudio.
Sintaxe da solicitação
POST /medical-stream-transcription HTTP/2
x-amzn-transcribe-language-code: LanguageCode
x-amzn-transcribe-sample-rate: MediaSampleRateHertz
x-amzn-transcribe-media-encoding: MediaEncoding
x-amzn-transcribe-vocabulary-name: VocabularyName
x-amzn-transcribe-specialty: Specialty
x-amzn-transcribe-type: Type
x-amzn-transcribe-show-speaker-label: ShowSpeakerLabel
x-amzn-transcribe-session-id: SessionId
x-amzn-transcribe-enable-channel-identification: EnableChannelIdentification
x-amzn-transcribe-number-of-channels: NumberOfChannels
x-amzn-transcribe-content-identification-type: ContentIdentificationType
Content-type: application/json
{
"AudioStream": {
"AudioEvent": {
"AudioChunk": blob
}
}
}
Parâmetros da solicitação de URI
A solicitação usa os parâmetros de URI a seguir.
- ContentIdentificationType
-
Rotula todas as informações de saúde pessoal (PHI) identificadas em sua transcrição.
A identificação do conteúdo é realizada no nível do segmento; o PHI é sinalizado após a transcrição completa de um segmento de áudio.
Para obter mais informações, consulte Identificação de informações pessoais de saúde (PHI) em uma transcrição.
Valores válidos:
PHI
- EnableChannelIdentification
-
Permite a identificação de canais em áudio multicanal.
A identificação do canal transcreve o áudio em cada canal de forma independente e, em seguida, acrescenta a saída de cada canal em uma transcrição.
Se você tiver áudio multicanal e não habilitar a identificação de canais, seu áudio será transcrito de forma contínua e sua transcrição não será separada por canal.
Se você incluir
EnableChannelIdentification
em sua solicitação, também deverá incluirNumberOfChannels
.Para obter mais informações, consulte Transcrever áudio de vários canais.
- LanguageCode
-
Especifique o código do idioma que representa o idioma falado em seu áudio.
Importante
O Amazon Transcribe Medical só oferece suporte ao inglês dos EUA (
en-US
).Valores válidos:
en-US | en-GB | es-US | fr-CA | fr-FR | en-AU | it-IT | de-DE | pt-BR | ja-JP | ko-KR | zh-CN | hi-IN | th-TH
Obrigatório: Sim
- MediaEncoding
-
Especifique a codificação usada para o áudio de entrada. Os formatos com suporte são:
-
FLAC
-
Áudio codificado em Opus em um contêiner Ogg
-
PCM (somente formatos de áudio little-endian de 16 bits assinados, que não incluem WAV)
Para obter mais informações, consulte Formatos de mídia.
Valores válidos:
pcm | ogg-opus | flac
Obrigatório: Sim
-
- MediaSampleRateHertz
-
A taxa de amostragem do áudio de entrada (em hertz). O Amazon Transcribe Medical suporta uma faixa de 16.000 Hz a 48.000 Hz. Observe que a taxa de amostragem especificada deve corresponder à do seu áudio.
Intervalo válido: valor mínimo de 8000. Valor máximo de 48000.
Obrigatório: Sim
- NumberOfChannels
-
Especifique o número de canais em sua transmissão de áudio. Esse valor deve ser
2
, pois somente dois canais são suportados. Se o áudio não contiver vários canais, não inclua esse parâmetro em sua solicitação.Se você incluir
NumberOfChannels
em sua solicitação, também deverá incluirEnableChannelIdentification
.Intervalo válido: valor mínimo de 2.
- SessionId
-
Especifique um nome para sua sessão de transcrição. Se você não incluir esse parâmetro em sua solicitação, o Amazon Transcribe Medical gerará uma ID e a retornará na resposta.
Restrições de comprimento: comprimento fixo de 36.
Padrão:
[a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}
- ShowSpeakerLabel
-
Permite o particionamento de alto-falantes (diarização) em sua saída de transcrição. O particionamento de alto-falantes rotula a fala de alto-falantes individuais em seu arquivo de mídia.
Para obter mais informações, consulte Partitioning speakers (diarização).
- Specialty
-
Especifique a especialidade médica contida em seu áudio.
Valores válidos:
PRIMARYCARE | CARDIOLOGY | NEUROLOGY | ONCOLOGY | RADIOLOGY | UROLOGY
Obrigatório: Sim
- Type
-
Especifique o tipo de entrada de áudio. Por exemplo, escolha
DICTATION
um provedor ditando as anotações do paciente eCONVERSATION
um diálogo entre um paciente e um profissional médico.Valores válidos:
CONVERSATION | DICTATION
Obrigatório: Sim
- VocabularyName
-
Especifique o nome do vocabulário personalizado que você deseja usar ao processar sua transcrição. Observe que os nomes do vocabulário diferenciam letras maiúsculas de minúsculas.
Restrições de tamanho: tamanho mínimo 1. Tamanho máximo de 200.
Padrão:
^[0-9a-zA-Z._-]+
Corpo da solicitação
A solicitação aceita os dados a seguir no formato JSON.
- AudioStream
-
Um fluxo codificado de bolhas de áudio. Os fluxos de áudio são codificados como HTTP/2 ou quadros WebSocket de dados.
Para obter mais informações, consulte Transcrever streaming de áudio.
Tipo: objeto AudioStream
Obrigatório: Sim
Sintaxe da resposta
HTTP/2 200
x-amzn-request-id: RequestId
x-amzn-transcribe-language-code: LanguageCode
x-amzn-transcribe-sample-rate: MediaSampleRateHertz
x-amzn-transcribe-media-encoding: MediaEncoding
x-amzn-transcribe-vocabulary-name: VocabularyName
x-amzn-transcribe-specialty: Specialty
x-amzn-transcribe-type: Type
x-amzn-transcribe-show-speaker-label: ShowSpeakerLabel
x-amzn-transcribe-session-id: SessionId
x-amzn-transcribe-enable-channel-identification: EnableChannelIdentification
x-amzn-transcribe-number-of-channels: NumberOfChannels
x-amzn-transcribe-content-identification-type: ContentIdentificationType
Content-type: application/json
{
"TranscriptResultStream": {
"BadRequestException": {
},
"ConflictException": {
},
"InternalFailureException": {
},
"LimitExceededException": {
},
"ServiceUnavailableException": {
},
"TranscriptEvent": {
"Transcript": {
"Results": [
{
"Alternatives": [
{
"Entities": [
{
"Category": "string",
"Confidence": number,
"Content": "string",
"EndTime": number,
"StartTime": number
}
],
"Items": [
{
"Confidence": number,
"Content": "string",
"EndTime": number,
"Speaker": "string",
"StartTime": number,
"Type": "string"
}
],
"Transcript": "string"
}
],
"ChannelId": "string",
"EndTime": number,
"IsPartial": boolean,
"ResultId": "string",
"StartTime": number
}
]
}
}
}
}
Elementos de resposta
Se a ação for bem-sucedida, o serviço reenviará uma resposta HTTP 200.
A resposta retorna os cabeçalhos HTTP a seguir.
- ContentIdentificationType
-
Mostra se a identificação do conteúdo foi ativada para sua transcrição.
Valores válidos:
PHI
- EnableChannelIdentification
-
Mostra se a identificação do canal foi ativada para sua transcrição.
- LanguageCode
-
Fornece o código de idioma que você especificou em sua solicitação. Deve ser
en-US
.Valores válidos:
en-US | en-GB | es-US | fr-CA | fr-FR | en-AU | it-IT | de-DE | pt-BR | ja-JP | ko-KR | zh-CN | hi-IN | th-TH
- MediaEncoding
-
Fornece a codificação de mídia que você especificou em sua solicitação.
Valores válidos:
pcm | ogg-opus | flac
- MediaSampleRateHertz
-
Fornece a taxa de amostragem que você especificou em sua solicitação.
Intervalo válido: valor mínimo de 8000. Valor máximo de 48000.
- NumberOfChannels
-
Fornece o número de canais que você especificou em sua solicitação.
Intervalo válido: valor mínimo de 2.
- RequestId
-
Fornece o identificador para sua solicitação de streaming.
- SessionId
-
Fornece o identificador para sua sessão de transcrição.
Restrições de comprimento: comprimento fixo de 36.
Padrão:
[a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}
- ShowSpeakerLabel
-
Mostra se o particionamento do alto-falante foi ativado para sua transcrição.
- Specialty
-
Fornece a especialidade médica que você especificou em sua solicitação.
Valores válidos:
PRIMARYCARE | CARDIOLOGY | NEUROLOGY | ONCOLOGY | RADIOLOGY | UROLOGY
- Type
-
Fornece o tipo de áudio que você especificou em sua solicitação.
Valores válidos:
CONVERSATION | DICTATION
- VocabularyName
-
Fornece o nome do vocabulário personalizado que você especificou em sua solicitação.
Restrições de tamanho: tamanho mínimo 1. Tamanho máximo de 200.
Padrão:
^[0-9a-zA-Z._-]+
Os seguintes dados são retornados no formato JSON pelo serviço.
- TranscriptResultStream
-
Fornece informações detalhadas sobre sua sessão de streaming.
Tipo: objeto MedicalTranscriptResultStream
Erros
Para obter informações sobre os erros comuns a todas as ações, consulteErros comuns.
- BadRequestException
-
Um ou mais argumentos para a
StartCallAnalyticsStreamTranscription
operaçãoStartStreamTranscription
StartMedicalStreamTranscription
, ou não eram válidos. Por exemplo,MediaEncoding
ouLanguageCode
usou valores não suportados. Verifique os parâmetros especificados e tente fazer sua solicitação novamente.Código de status HTTP: 400
- ConflictException
-
Um novo stream começou com o mesmo ID de sessão. O fluxo atual foi encerrado.
Código de status HTTP: 409
- InternalFailureException
-
Ocorreu um problema ao processar o áudio. O Amazon Transcribe encerrou o processamento.
Código de status HTTP: 500
- LimitExceededException
-
Seu cliente ultrapassou um dos limites do Amazon Transcribe. Normalmente, esse é o limite de duração do áudio. Divida seu fluxo de áudio em partes menores e tente fazer sua solicitação novamente.
Código de status HTTP: 429
- ServiceUnavailableException
-
O serviço está indisponível no momento. Experimente sua solicitação mais tarde.
Código de status HTTP: 503
Consulte também
Para obter mais informações sobre como usar essa API em um dos AWS SDKs específicos de linguagem, consulte o seguinte: