Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
StartCallAnalyticsStreamTranscription
Inicia una WebSocket transmisión o transmisión de HTTP/2 bidireccional donde el audio se transmite a Amazon Transcribe y los resultados de la transcripción se transmiten a la aplicación. Utilice esta operación para las transcripciones de Call Analytics.
Se requieren los siguientes parámetros:
-
language-code
-
media-encoding
-
sample-rate
Para obtener más información sobre la transmisión con Amazon Transcribe, consulte Transcribir audio en streaming.
Sintaxis de la solicitud
POST /call-analytics-stream-transcription HTTP/2
x-amzn-transcribe-language-code: LanguageCode
x-amzn-transcribe-sample-rate: MediaSampleRateHertz
x-amzn-transcribe-media-encoding: MediaEncoding
x-amzn-transcribe-vocabulary-name: VocabularyName
x-amzn-transcribe-session-id: SessionId
x-amzn-transcribe-vocabulary-filter-name: VocabularyFilterName
x-amzn-transcribe-vocabulary-filter-method: VocabularyFilterMethod
x-amzn-transcribe-language-model-name: LanguageModelName
x-amzn-transcribe-enable-partial-results-stabilization: EnablePartialResultsStabilization
x-amzn-transcribe-partial-results-stability: PartialResultsStability
x-amzn-transcribe-content-identification-type: ContentIdentificationType
x-amzn-transcribe-content-redaction-type: ContentRedactionType
x-amzn-transcribe-pii-entity-types: PiiEntityTypes
Content-type: application/json
{
"AudioStream": {
"AudioEvent": {
"AudioChunk": blob
},
"ConfigurationEvent": {
"ChannelDefinitions": [
{
"ChannelId": number
,
"ParticipantRole": "string
"
}
],
"PostCallAnalyticsSettings": {
"ContentRedactionOutput": "string
",
"DataAccessRoleArn": "string
",
"OutputEncryptionKMSKeyId": "string
",
"OutputLocation": "string
"
}
}
}
}
Parámetros de solicitud del URI
La solicitud utiliza los siguientes parámetros URI.
- ContentIdentificationType
-
Otorga una etiqueta a toda la información de identificación personal (PII, por sus siglas en inglés) identificada en la transcripción.
La identificación del contenido se realiza a nivel de segmento; la PII especificada en
PiiEntityTypes
se marca cuando se completa la transcripción de un segmento de audio.No puedes configurar
ContentIdentificationType
yContentRedactionType
en la misma solicitud. Si configuras ambos, tu solicitud devuelve unBadRequestException
.Para obtener más información, consulte Redactar o identificar información de identificación personal.
Valores válidos:
PII
- ContentRedactionType
-
Redacta toda la información de identificación personal (PII, por sus siglas en inglés) identificada en la transcripción.
La redacción del contenido se realiza a nivel de segmento; la PII especificada en
PiiEntityTypes
se redacta tras la transcripción completa de un segmento de audio.No puedes configurar
ContentRedactionType
yContentIdentificationType
en la misma solicitud. Si configuras ambos, tu solicitud devuelve unBadRequestException
.Para obtener más información, consulte Redactar o identificar información de identificación personal.
Valores válidos:
PII
- EnablePartialResultsStabilization
-
Permite la estabilización parcial de los resultados de la transcripción. La estabilización parcial de los resultados puede reducir la latencia de la salida, pero puede afectar a la precisión. Para obtener más información, consulte Estabilización de resultados parciales.
- LanguageCode
-
Especifique el código de idioma que representa el idioma que se habla en el audio.
Si no estás seguro del idioma que se habla en el audio, considera la posibilidad de
IdentifyLanguage
habilitar la identificación automática del idioma.Para obtener una lista de los idiomas compatibles con el análisis de llamadas en tiempo real, consulte la tabla de idiomas compatibles.
Valores válidos:
en-US | en-GB | es-US | fr-CA | fr-FR | en-AU | it-IT | de-DE | pt-BR
Obligatorio: sí
- LanguageModelName
-
Especifique el nombre del modelo de idioma personalizado que desea utilizar al procesar la transcripción. Tenga en cuenta que los nombres de modelo de idioma distinguen entre mayúsculas y minúsculas.
El idioma del modelo de idioma especificado debe coincidir con el código de idioma que especifique en la solicitud de transcripción. Si los idiomas no coinciden, no se aplica el modelo de idioma personalizado. No hay errores ni advertencias asociados a la falta de coincidencia de idiomas.
Para obtener más información, consulte Modelos de idioma personalizados.
Limitaciones de longitud: longitud mínima de 1. La longitud máxima es de 200 caracteres.
Patrón:
^[0-9a-zA-Z._-]+
- MediaEncoding
-
Especifique la codificación del audio de entrada. Los formatos admitidos son:
-
FLAC
-
Audio codificado en OPUS en un contenedor Ogg
-
PCM (solo formatos de audio little-endian firmados de 16 bits, que no incluyen WAV)
Para obtener más información, consulte Formatos de medios.
Valores válidos:
pcm | ogg-opus | flac
Obligatorio: sí
-
- MediaSampleRateHertz
-
La frecuencia de muestreo del audio de entrada (en hercios). El audio de baja calidad, como el audio del teléfono, suele rondar los 8.000 Hz. El audio de alta calidad suele oscilar entre 16.000 Hz y 48.000 Hz. Tenga en cuenta que la frecuencia de muestreo que especifique debe coincidir con la del audio.
Rango válido: valor mínimo de 8000. Valor máximo de 48000.
Obligatorio: sí
- PartialResultsStability
-
Especifique el nivel de estabilidad que se utilizará al habilitar la estabilización de resultados parciales (
EnablePartialResultsStabilization
).La baja estabilidad proporciona la máxima precisión. La alta estabilidad transcribe más rápido, pero con una precisión ligeramente inferior.
Para obtener más información, consulte Estabilización de resultados parciales.
Valores válidos:
high | medium | low
- PiiEntityTypes
-
Especifique qué tipos de información de identificación personal (PII) desea redactar en su expediente académico. Puede incluir tantos tipos como desee o puede seleccionar
ALL
.Para
PiiEntityTypes
incluirlo en su solicitud de análisis de llamadas, también debe incluir unoContentIdentificationType
oContentRedactionType
.Los valores deben estar separados por comas y pueden incluir:
ADDRESS
BANK_ACCOUNT_NUMBER
BANK_ROUTING
,CREDIT_DEBIT_CVV
,CREDIT_DEBIT_EXPIRY
,CREDIT_DEBIT_NUMBER
,EMAIL
NAME
,PHONE
,PIN
,SSN
, oALL
.Limitaciones de longitud: longitud mínima de 1. La longitud máxima es de 300 caracteres.
Patrón:
^[A-Z_, ]+
- SessionId
-
Especifique un nombre para la sesión de transcripción de Call Analytics. Si no incluye este parámetro en la solicitud, Amazon Transcribe genera un ID y lo devuelve en la respuesta.
Limitaciones de longitud: longitud fija de 36.
Patrón:
[a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}
- VocabularyFilterMethod
-
Especifica cómo quieres que se aplique el filtro de vocabulario a tu expediente académico.
Para reemplazar palabras por
***
, elijamask
.Para eliminar palabras, elija
remove
.Para marcar palabras sin cambiarlas, elige
tag
.Valores válidos:
remove | mask | tag
- VocabularyFilterName
-
Especifique el nombre del filtro de vocabulario personalizado que desea utilizar al procesar la transcripción. Tenga en cuenta que los nombres de filtro de vocabulario distinguen entre mayúsculas y minúsculas.
Si el idioma del filtro de vocabulario personalizado especificado no coincide con el idioma identificado en el contenido multimedia, el filtro de vocabulario no se aplica a la transcripción.
Para obtener más información, consulte Uso del filtrado de vocabulario con palabras no deseadas.
Limitaciones de longitud: longitud mínima de 1. La longitud máxima es de 200 caracteres.
Patrón:
^[0-9a-zA-Z._-]+
- VocabularyName
-
Especifique el nombre del vocabulario personalizado que desea utilizar al procesar la transcripción. Tenga en cuenta que los nombres de vocabulario distinguen entre mayúsculas y minúsculas.
Si el idioma del vocabulario personalizado especificado no coincide con el idioma identificado en el contenido multimedia, el vocabulario personalizado no se aplica a la transcripción.
Para obtener más información, consulte Vocabularios personalizados.
Limitaciones de longitud: longitud mínima de 1. La longitud máxima es de 200 caracteres.
Patrón:
^[0-9a-zA-Z._-]+
Cuerpo de la solicitud
La solicitud acepta los siguientes datos en formato JSON.
- AudioStream
-
Un flujo codificado de manchas de audio. Las transmisiones de audio se codifican como HTTP/2 o como tramas WebSocket de datos.
Para obtener más información, consulte Transcribir audio de streaming.
Tipo: objeto CallAnalyticsAudioStream
Obligatorio: sí
Sintaxis de la respuesta
HTTP/2 200
x-amzn-request-id: RequestId
x-amzn-transcribe-language-code: LanguageCode
x-amzn-transcribe-sample-rate: MediaSampleRateHertz
x-amzn-transcribe-media-encoding: MediaEncoding
x-amzn-transcribe-vocabulary-name: VocabularyName
x-amzn-transcribe-session-id: SessionId
x-amzn-transcribe-vocabulary-filter-name: VocabularyFilterName
x-amzn-transcribe-vocabulary-filter-method: VocabularyFilterMethod
x-amzn-transcribe-language-model-name: LanguageModelName
x-amzn-transcribe-enable-partial-results-stabilization: EnablePartialResultsStabilization
x-amzn-transcribe-partial-results-stability: PartialResultsStability
x-amzn-transcribe-content-identification-type: ContentIdentificationType
x-amzn-transcribe-content-redaction-type: ContentRedactionType
x-amzn-transcribe-pii-entity-types: PiiEntityTypes
Content-type: application/json
{
"CallAnalyticsTranscriptResultStream": {
"BadRequestException": {
},
"CategoryEvent": {
"MatchedCategories": [ "string" ],
"MatchedDetails": {
"string" : {
"TimestampRanges": [
{
"BeginOffsetMillis": number,
"EndOffsetMillis": number
}
]
}
}
},
"ConflictException": {
},
"InternalFailureException": {
},
"LimitExceededException": {
},
"ServiceUnavailableException": {
},
"UtteranceEvent": {
"BeginOffsetMillis": number,
"EndOffsetMillis": number,
"Entities": [
{
"BeginOffsetMillis": number,
"Category": "string",
"Confidence": number,
"Content": "string",
"EndOffsetMillis": number,
"Type": "string"
}
],
"IsPartial": boolean,
"IssuesDetected": [
{
"CharacterOffsets": {
"Begin": number,
"End": number
}
}
],
"Items": [
{
"BeginOffsetMillis": number,
"Confidence": number,
"Content": "string",
"EndOffsetMillis": number,
"Stable": boolean,
"Type": "string",
"VocabularyFilterMatch": boolean
}
],
"ParticipantRole": "string",
"Sentiment": "string",
"Transcript": "string",
"UtteranceId": "string"
}
}
}
Elementos de respuesta
Si la acción se realiza correctamente, el servicio devuelve una respuesta HTTP 200.
La respuesta devuelve los siguientes encabezados HTTP.
- ContentIdentificationType
-
Muestra si la identificación de contenido estaba habilitada para la transcripción de Call Analytics.
Valores válidos:
PII
- ContentRedactionType
-
Muestra si la redacción de contenido estaba habilitada para la transcripción de Call Analytics.
Valores válidos:
PII
- EnablePartialResultsStabilization
-
Muestra si la estabilización parcial de los resultados estaba habilitada para la transcripción de Call Analytics.
- LanguageCode
-
Proporciona el código de idioma que especificó en su solicitud de Call Analytics.
Valores válidos:
en-US | en-GB | es-US | fr-CA | fr-FR | en-AU | it-IT | de-DE | pt-BR
- LanguageModelName
-
Proporciona el nombre del modelo de idioma personalizado que especificó en su solicitud de Call Analytics.
Limitaciones de longitud: longitud mínima de 1. La longitud máxima es de 200 caracteres.
Patrón:
^[0-9a-zA-Z._-]+
- MediaEncoding
-
Proporciona la codificación multimedia que especificó en su solicitud de Call Analytics.
Valores válidos:
pcm | ogg-opus | flac
- MediaSampleRateHertz
-
Proporciona la frecuencia de muestreo que especificó en su solicitud de Call Analytics.
Rango válido: valor mínimo de 8000. Valor máximo de 48000.
- PartialResultsStability
-
Proporciona el nivel de estabilización utilizado para la transcripción.
Valores válidos:
high | medium | low
- PiiEntityTypes
-
Muestra los tipos de entidades de información personal que especificaste en tu solicitud de Call Analytics.
Limitaciones de longitud: longitud mínima de 1. La longitud máxima es de 300 caracteres.
Patrón:
^[A-Z_, ]+
- RequestId
-
Proporciona el identificador de su solicitud de análisis de llamadas en tiempo real.
- SessionId
-
Proporciona el identificador de la sesión de transcripción de Call Analytics.
Limitaciones de longitud: longitud fija de 36.
Patrón:
[a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}
- VocabularyFilterMethod
-
Proporciona el método de filtrado de vocabulario utilizado en la transcripción de Call Analytics.
Valores válidos:
remove | mask | tag
- VocabularyFilterName
-
Proporciona el nombre del filtro de vocabulario personalizado que especificó en su solicitud de Call Analytics.
Limitaciones de longitud: longitud mínima de 1. La longitud máxima es de 200 caracteres.
Patrón:
^[0-9a-zA-Z._-]+
- VocabularyName
-
Proporciona el nombre del vocabulario personalizado que especificó en su solicitud de Call Analytics.
Limitaciones de longitud: longitud mínima de 1. La longitud máxima es de 200 caracteres.
Patrón:
^[0-9a-zA-Z._-]+
El servicio devuelve los datos siguientes en formato JSON.
- CallAnalyticsTranscriptResultStream
-
Proporciona información detallada sobre su sesión de análisis de llamadas en tiempo real.
Tipo: objeto CallAnalyticsTranscriptResultStream
Errores
Para obtener información sobre los errores comunes a todas las acciones, consulteErrores comunes.
- BadRequestException
-
Uno o más argumentos de la
StartCallAnalyticsStreamTranscription
operaciónStartStreamTranscription
StartMedicalStreamTranscription
, o no eran válidos. Por ejemplo,MediaEncoding
oLanguageCode
usó valores no admitidos. Compruebe los parámetros especificados y vuelva a intentar realizar la solicitud.Código de estado HTTP: 400
- ConflictException
-
Se inició una nueva transmisión con el mismo ID de sesión. La transmisión actual ha finalizado.
Código de estado HTTP: 409
- InternalFailureException
-
Se ha producido un problema al procesar el audio. Amazon Transcribe ha finalizado el procesamiento.
Código de estado HTTP: 500
- LimitExceededException
-
Su cliente ha superado uno de los límites de Amazon Transcribe. Este suele ser el límite de longitud del audio. Divida la transmisión de audio en fragmentos más pequeños y vuelva a intentar realizar la solicitud.
Código de estado HTTP: 429
- ServiceUnavailableException
-
El servicio no está disponible en este momento. Prueba tu solicitud más tarde.
Código de estado HTTP: 503
Véase también
Para obtener más información sobre el uso de esta API en un SDK de AWS de un lenguaje específico, consulte: