Mejora de la precisión de la transcripción con vocabularios y modelos de lenguaje personalizados - Amazon Transcribe

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Mejora de la precisión de la transcripción con vocabularios y modelos de lenguaje personalizados

Si su contenido multimedia contiene términos no estándar o específicos de un dominio, como nombres de marcas, acrónimos, palabras técnicas y jerga, esAmazon Transcribe posible que estos términos no aparezcan correctamente en el resultado de la transcripción.

Para corregir las imprecisiones de la transcripción y personalizar el resultado para su caso de uso específico, puede crearVocabularios personalizados yModelos de lenguaje personalizados.

  • Vocabularios personalizadosestán diseñados para ajustar y mejorar tanto el reconocimiento como el formato de palabras específicas en todos los contextos. Esto implicaAmazon Transcribe proporcionar palabras y, opcionalmente, formularios de pronunciación y visualización.

    Si noAmazon Transcribe representa correctamente términos específicos en sus transcripciones, puede crear un archivo de vocabulario personalizado que indiqueAmazon Transcribe cómo desea que se muestren estos términos. Este enfoque específico para cada palabra es el más adecuado para corregir términos como nombres de marcas y acrónimos.

  • Modelos de lenguaje personalizadosestán diseñados para capturar el contexto asociado a los términos. Esto implica el suministroAmazon Transcribe de un gran volumen de datos de texto específicos del dominio.

    Si noAmazon Transcribe representa correctamente los términos técnicos o utiliza un homófono incorrecto en sus transcripciones, puede crear un modelo de idioma personalizado que enseñe el idioma específico deAmazon Transcribe su dominio. Por ejemplo, un modelo de lenguaje personalizado puede aprender cuándo usar «témpano» (témpano de hielo) en lugar de «flujo» (flujo lineal).

    Este enfoque basado en el contexto es el más apropiado para transcribir grandes volúmenes de voz de un dominio específico. Los modelos de lenguaje personalizados pueden producir mejoras de precisión significativas en comparación con los vocabularios personalizados por sí solos. Al utilizar transcripciones por lotes, puede incluir un modelo de idioma personalizado y un vocabulario personalizado en su solicitud.

sugerencia

Para lograr la máxima precisión de transcripción, utilice vocabularios personalizados junto con sus modelos de idioma personalizados.

Para ver un tutorial en vídeo sobre la creación y el uso de vocabularios personalizados, consulte:

Para ver un tutorial en vídeo sobre la creación y el uso de modelos de lenguaje personalizados, consulte: