Ejemplos de Amazon Transcribe utilizando AWS CLI - AWS SDKEjemplos de código

Hay más AWS SDK ejemplos disponibles en el GitHub repositorio de AWS Doc SDK Examples.

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Ejemplos de Amazon Transcribe utilizando AWS CLI

Los siguientes ejemplos de código muestran cómo realizar acciones e implementar escenarios comunes AWS Command Line Interface con Amazon Transcribe.

Las acciones son extractos de código de programas más grandes y deben ejecutarse en contexto. Mientras las acciones muestran cómo llamar a las funciones de servicio individuales, es posible ver las acciones en contexto en los escenarios relacionados.

Cada ejemplo incluye un enlace al código fuente completo, donde puede encontrar instrucciones sobre cómo configurar y ejecutar el código en su contexto.

Acciones

En el siguiente ejemplo de código se muestra cómo usar create-language-model.

AWS CLI

Ejemplo 1: Crear un modelo de lenguaje personalizado utilizando datos de entrenamiento y ajuste.

En el siguiente create-language-model ejemplo, se crea un modelo de idioma personalizado. Puede utilizar un modelo de lenguaje personalizado para mejorar el rendimiento de la transcripción en ámbitos como el jurídico, la hostelería, las finanzas y los seguros. Para el código de idioma, introduce un código de idioma válido. Para base-model-name ello, especifique el modelo base que mejor se adapte a la frecuencia de muestreo del audio que desea transcribir con su modelo de idioma personalizado. En model-name, especifique el nombre con el que quiere llamar al modelo de lenguaje personalizado.

aws transcribe create-language-model \ --language-code language-code \ --base-model-name base-model-name \ --model-name cli-clm-example \ --input-data-config S3Uri="s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix-for-training-data",TuningDataS3Uri="s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix-for-tuning-data",DataAccessRoleArn="arn:aws:iam::AWS-account-number:role/IAM-role-with-permissions-to-create-a-custom-language-model"

Salida:

{ "LanguageCode": "language-code", "BaseModelName": "base-model-name", "ModelName": "cli-clm-example", "InputDataConfig": { "S3Uri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix/", "TuningDataS3Uri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix/", "DataAccessRoleArn": "arn:aws:iam::AWS-account-number:role/IAM-role-with-permissions-create-a-custom-language-model" }, "ModelStatus": "IN_PROGRESS" }

Para obtener más información, consulte Mejora de la precisión de la transcripción específica de dominios con modelos de idiomas personalizados en la Guía para desarrolladores de Amazon Transcribe.

Ejemplo 2: Para crear un modelo de lenguaje personalizado utilizando únicamente datos de entrenamiento.

En el siguiente ejemplo de create-language-model se transcribe un archivo de audio. Puede utilizar un modelo de lenguaje personalizado para mejorar el rendimiento de la transcripción en ámbitos como el jurídico, la hostelería, las finanzas y los seguros. Para el código de idioma, introduce un código de idioma válido. Para base-model-name ello, especifique el modelo base que mejor se adapte a la frecuencia de muestreo del audio que desea transcribir con su modelo de idioma personalizado. En model-name, especifique el nombre con el que quiere llamar al modelo de lenguaje personalizado.

aws transcribe create-language-model \ --language-code en-US \ --base-model-name base-model-name \ --model-name cli-clm-example \ --input-data-config S3Uri="s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix-For-Training-Data",DataAccessRoleArn="arn:aws:iam::AWS-account-number:role/IAM-role-with-permissions-to-create-a-custom-language-model"

Salida:

{ "LanguageCode": "en-US", "BaseModelName": "base-model-name", "ModelName": "cli-clm-example", "InputDataConfig": { "S3Uri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix-For-Training-Data/", "DataAccessRoleArn": "arn:aws:iam::your-AWS-account-number:role/IAM-role-with-permissions-to-create-a-custom-language-model" }, "ModelStatus": "IN_PROGRESS" }

Para obtener más información, consulte Mejora de la precisión de la transcripción específica de dominios con modelos de idiomas personalizados en la Guía para desarrolladores de Amazon Transcribe.

  • Para API obtener más información, consulte la Referencia CreateLanguageModelde AWS CLI comandos.

En el siguiente ejemplo de código se muestra cómo usar create-medical-vocabulary.

AWS CLI

Para crear un vocabulario médico personalizado

En el siguiente ejemplo de create-medical-vocabulary se crea un vocabulario personalizado. Para crear un vocabulario personalizado, debe haber creado un archivo de texto con todos los términos que desee transcribir con mayor precisión. Para vocabulary-file-uri, especifique el Amazon Simple Storage Service (Amazon URI S3) de ese archivo de texto. En language-code, especifique un código de idioma correspondiente al idioma del vocabulario personalizado. En vocabulary-name, especifique cómo desea llamar al vocabulario personalizado.

aws transcribe create-medical-vocabulary \ --vocabulary-name cli-medical-vocab-example \ --language-code language-code \ --vocabulary-file-uri https://DOC-EXAMPLE-BUCKET.AWS-Region.amazonaws.com/the-text-file-for-the-medical-custom-vocabulary.txt

Salida:

{ "VocabularyName": "cli-medical-vocab-example", "LanguageCode": "language-code", "VocabularyState": "PENDING" }

Para obtener más información, consulte Vocabularios médicos personalizados en la Guía para desarrolladores de Amazon Transcribe.

En el siguiente ejemplo de código se muestra cómo usar create-vocabulary-filter.

AWS CLI

Para crear un filtro de vocabulario

En el siguiente create-vocabulary-filter ejemplo, se crea un filtro de vocabulario que utiliza un archivo de texto que contiene una lista de palabras que no desea que aparezcan en una transcripción. Para el código de idioma, especifique el código de idioma correspondiente al idioma del filtro de vocabulario. Para vocabulary-filter-file-uri, especifique el Amazon Simple Storage Service (Amazon URI S3) del archivo de texto. Para vocabulary-filter-name, especifique el nombre de su filtro de vocabulario.

aws transcribe create-vocabulary-filter \ --language-code language-code \ --vocabulary-filter-file-uri s3://DOC-EXAMPLE-BUCKET/vocabulary-filter.txt \ --vocabulary-filter-name cli-vocabulary-filter-example

Salida:

{ "VocabularyFilterName": "cli-vocabulary-filter-example", "LanguageCode": "language-code" }

Para obtener más información, consulte Filtrar palabras no deseadas en la Guía para desarrolladores de Amazon Transcribe.

En el siguiente ejemplo de código se muestra cómo usar create-vocabulary.

AWS CLI

Para crear un vocabulario personalizado

En el siguiente ejemplo de create-vocabulary se crea un vocabulario personalizado. Para crear un vocabulario personalizado, debe haber creado un archivo de texto con todos los términos que desee transcribir con mayor precisión. Para vocabulary-file-uri, especifique el Amazon Simple Storage Service (Amazon URI S3) de ese archivo de texto. En language-code, especifique un código de idioma correspondiente al idioma del vocabulario personalizado. En vocabulary-name, especifique cómo desea llamar al vocabulario personalizado.

aws transcribe create-vocabulary \ --language-code language-code \ --vocabulary-name cli-vocab-example \ --vocabulary-file-uri s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/the-text-file-for-the-custom-vocabulary.txt

Salida:

{ "VocabularyName": "cli-vocab-example", "LanguageCode": "language-code", "VocabularyState": "PENDING" }

Para obtener más información, consulte Vocabularios personalizados en la Guía para desarrolladores de Amazon Transcribe.

  • Para API obtener más información, consulte CreateVocabularyla Referencia de AWS CLI comandos.

En el siguiente ejemplo de código se muestra cómo usar delete-language-model.

AWS CLI

Para eliminar un modelo de idioma personalizado

En el siguiente delete-language-model ejemplo, se elimina un modelo de idioma personalizado.

aws transcribe delete-language-model \ --model-name model-name

Este comando no genera ninguna salida.

Para obtener más información, consulte Mejora de la precisión de la transcripción específica de dominios con modelos de idiomas personalizados en la Guía para desarrolladores de Amazon Transcribe.

  • Para API obtener más información, consulte DeleteLanguageModella Referencia de AWS CLI comandos.

En el siguiente ejemplo de código se muestra cómo usar delete-medical-transcription-job.

AWS CLI

Para eliminar un trabajo de transcripción médica

En el siguiente ejemplo de delete-medical-transcription-job se elimina un trabajo de transcripción médica.

aws transcribe delete-medical-transcription-job \ --medical-transcription-job-name medical-transcription-job-name

Este comando no genera ninguna salida.

Para obtener más información, consulte DeleteMedicalTranscriptionJobla Guía para desarrolladores de Amazon Transcribe.

En el siguiente ejemplo de código se muestra cómo usar delete-medical-vocabulary.

AWS CLI

Para eliminar un vocabulario médico personalizado

En el siguiente delete-medical-vocabulary ejemplo, se elimina un vocabulario médico personalizado. Para el nombre del vocabulario, especifique el nombre del vocabulario médico personalizado.

aws transcribe delete-vocabulary \ --vocabulary-name medical-custom-vocabulary-name

Este comando no genera ninguna salida.

Para obtener más información, consulte Vocabularios médicos personalizados en la Guía para desarrolladores de Amazon Transcribe.

En el siguiente ejemplo de código se muestra cómo usar delete-transcription-job.

AWS CLI

Para eliminar uno de los trabajos de transcripción

En el siguiente ejemplo de delete-transcription-job se elimina uno de los trabajos de transcripción.

aws transcribe delete-transcription-job \ --transcription-job-name your-transcription-job

Este comando no genera ninguna salida.

Para obtener más información, consulte DeleteTranscriptionJobla Guía para desarrolladores de Amazon Transcribe.

En el siguiente ejemplo de código se muestra cómo usar delete-vocabulary-filter.

AWS CLI

Para eliminar un filtro de vocabulario

En el siguiente delete-vocabulary-filter ejemplo, se elimina un filtro de vocabulario.

aws transcribe delete-vocabulary-filter \ --vocabulary-filter-name vocabulary-filter-name

Este comando no genera ninguna salida.

Para obtener más información, consulte Filtrar palabras no deseadas en la Guía para desarrolladores de Amazon Transcribe.

En el siguiente ejemplo de código se muestra cómo usar delete-vocabulary.

AWS CLI

Para eliminar un vocabulario personalizado

En el siguiente ejemplo de delete-vocabulary se elimina un vocabulario personalizado.

aws transcribe delete-vocabulary \ --vocabulary-name vocabulary-name

Este comando no genera ninguna salida.

Para obtener más información, consulte Vocabularios personalizados en la Guía para desarrolladores de Amazon Transcribe.

  • Para API obtener más información, consulte DeleteVocabularyla Referencia de AWS CLI comandos.

En el siguiente ejemplo de código se muestra cómo usar describe-language-model.

AWS CLI

Para obtener información sobre un modelo de lenguaje personalizado específico

En el siguiente describe-language-model ejemplo, se obtiene información sobre un modelo de idioma personalizado específico. Por ejemplo, en esta sección BaseModelName puede ver si su modelo está entrenado con un WideBand modelo NarrowBand o. Los modelos de lenguaje personalizados con un modelo NarrowBand base pueden transcribir audio con una frecuencia de muestreo inferior a 16kHz. Los modelos de lenguaje que utilizan un modelo WideBand base pueden transcribir audio con una frecuencia de muestreo superior a 16. kHz El parámetro S3Uri indica el prefijo Amazon S3 que ha utilizado para acceder a los datos de entrenamiento para crear el modelo de idioma personalizado.

aws transcribe describe-language-model \ --model-name cli-clm-example

Salida:

{ "LanguageModel": { "ModelName": "cli-clm-example", "CreateTime": "2020-09-25T17:57:38.504000+00:00", "LastModifiedTime": "2020-09-25T17:57:48.585000+00:00", "LanguageCode": "language-code", "BaseModelName": "base-model-name", "ModelStatus": "IN_PROGRESS", "UpgradeAvailability": false, "InputDataConfig": { "S3Uri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix/", "TuningDataS3Uri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix/", "DataAccessRoleArn": "arn:aws:iam::AWS-account-number:role/IAM-role-with-permissions-to-create-a-custom-language-model" } } }

Para obtener más información, consulte Mejora de la precisión de la transcripción específica de dominios con modelos de idiomas personalizados en la Guía para desarrolladores de Amazon Transcribe.

En el siguiente ejemplo de código se muestra cómo usar get-medical-transcription-job.

AWS CLI

Para obtener información sobre un trabajo específico de transcripción médica

En el siguiente get-medical-transcription-job ejemplo se obtiene información sobre un trabajo de transcripción médica específico. Para acceder a los resultados de la transcripción, utilice el TranscriptFileUri parámetro. Si has activado funciones adicionales para el trabajo de transcripción, puedes verlas en el objeto de configuración. El parámetro Especialidad muestra la especialidad médica del proveedor. El parámetro Type indica si el discurso del trabajo de transcripción corresponde a una conversación médica o a un dictado médico.

aws transcribe get-medical-transcription-job \ --medical-transcription-job-name vocabulary-dictation-medical-transcription-job

Salida:

{ "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "vocabulary-dictation-medical-transcription-job", "TranscriptionJobStatus": "COMPLETED", "LanguageCode": "en-US", "MediaSampleRateHertz": 48000, "MediaFormat": "mp4", "Media": { "MediaFileUri": "s3://Amazon-S3-Prefix/your-audio-file.file-extension" }, "Transcript": { "TranscriptFileUri": "https://s3.Region.amazonaws.com/Amazon-S3-Prefix/vocabulary-dictation-medical-transcription-job.json" }, "StartTime": "2020-09-21T21:17:27.045000+00:00", "CreationTime": "2020-09-21T21:17:27.016000+00:00", "CompletionTime": "2020-09-21T21:17:59.561000+00:00", "Settings": { "ChannelIdentification": false, "ShowAlternatives": false, "VocabularyName": "cli-medical-vocab-example" }, "Specialty": "PRIMARYCARE", "Type": "DICTATION" } }

Para obtener más información, consulte Batch Transcription en la Guía para desarrolladores de Amazon Transcribe.

En el siguiente ejemplo de código se muestra cómo usar get-medical-vocabulary.

AWS CLI

Para obtener información sobre un vocabulario médico personalizado

En el siguiente get-medical-vocabulary ejemplo se obtiene información sobre un vocabulario médico personalizado. Puede usar el VocabularyState parámetro para ver el estado de procesamiento del vocabulario. Si es asíREADY, puedes usarlo en la StartMedicalTranscriptionJob operación. :

aws transcribe get-medical-vocabulary \ --vocabulary-name medical-vocab-example

Salida:

{ "VocabularyName": "medical-vocab-example", "LanguageCode": "en-US", "VocabularyState": "READY", "LastModifiedTime": "2020-09-19T23:59:04.349000+00:00", "DownloadUri": "https://link-to-download-the-text-file-used-to-create-your-medical-custom-vocabulary" }

Para obtener más información, consulte Vocabularios médicos personalizados en la Guía para desarrolladores de Amazon Transcribe.

  • Para API obtener más información, consulte GetMedicalVocabularyla Referencia de AWS CLI comandos.

En el siguiente ejemplo de código se muestra cómo usar get-transcription-job.

AWS CLI

Para obtener información acerca de un determinado trabajo de transcripción

En el siguiente ejemplo de get-transcription-job se obtiene información sobre un determinado trabajo de transcripción. Para acceder a los resultados de la transcripción, utilice el TranscriptFileUri parámetro. Utilice el MediaFileUri parámetro para ver qué archivo de audio ha transcrito con este trabajo. Puede usar el objeto Settings para ver las características opcionales que ha habilitado en el trabajo de transcripción.

aws transcribe get-transcription-job \ --transcription-job-name your-transcription-job

Salida:

{ "TranscriptionJob": { "TranscriptionJobName": "your-transcription-job", "TranscriptionJobStatus": "COMPLETED", "LanguageCode": "language-code", "MediaSampleRateHertz": 48000, "MediaFormat": "mp4", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.file-extension" }, "Transcript": { "TranscriptFileUri": "https://Amazon-S3-file-location-of-transcription-output" }, "StartTime": "2020-09-18T22:27:23.970000+00:00", "CreationTime": "2020-09-18T22:27:23.948000+00:00", "CompletionTime": "2020-09-18T22:28:21.197000+00:00", "Settings": { "ChannelIdentification": false, "ShowAlternatives": false }, "IdentifyLanguage": true, "IdentifiedLanguageScore": 0.8672199249267578 } }

Para obtener más información, consulte Introducción (interfaz de línea de AWS comandos) en la Guía para desarrolladores de Amazon Transcribe.

  • Para API obtener más información, consulte GetTranscriptionJobla Referencia de AWS CLI comandos.

En el siguiente ejemplo de código se muestra cómo usar get-vocabulary-filter.

AWS CLI

Para obtener información sobre un filtro de vocabulario

En el siguiente get-vocabulary-filter ejemplo, se obtiene información sobre un filtro de vocabulario. Puede usar el DownloadUri parámetro para obtener la lista de palabras que utilizó para crear el filtro de vocabulario.

aws transcribe get-vocabulary-filter \ --vocabulary-filter-name testFilter

Salida:

{ "VocabularyFilterName": "testFilter", "LanguageCode": "language-code", "LastModifiedTime": "2020-05-07T22:39:32.147000+00:00", "DownloadUri": "https://Amazon-S3-location-to-download-your-vocabulary-filter" }

Para obtener más información, consulte Filtrar palabras no deseadas en la Guía para desarrolladores de Amazon Transcribe.

  • Para API obtener más información, consulte GetVocabularyFilterla Referencia de AWS CLI comandos.

En el siguiente ejemplo de código se muestra cómo usar get-vocabulary.

AWS CLI

Para obtener información sobre un vocabulario personalizado

En el siguiente ejemplo de get-vocabulary se obtiene información sobre un vocabulario personalizado creado anteriormente.

aws transcribe get-vocabulary \ --vocabulary-name cli-vocab-1

Salida:

{ "VocabularyName": "cli-vocab-1", "LanguageCode": "language-code", "VocabularyState": "READY", "LastModifiedTime": "2020-09-19T23:22:32.836000+00:00", "DownloadUri": "https://link-to-download-the-text-file-used-to-create-your-custom-vocabulary" }

Para obtener más información, consulte Vocabularios personalizados en la Guía para desarrolladores de Amazon Transcribe.

  • Para API obtener más información, consulte GetVocabularyla Referencia de AWS CLI comandos.

En el siguiente ejemplo de código se muestra cómo usar list-language-models.

AWS CLI

Para enumerar sus modelos de lenguaje personalizados

En el siguiente list-language-models ejemplo, se enumeran los modelos de idioma personalizados asociados a su AWS cuenta y región. Puede utilizar los TuningDataS3Uri parámetros S3Uri y para buscar los prefijos de Amazon S3 que ha utilizado como datos de entrenamiento o datos de ajuste. Esto BaseModelName le indica si ha utilizado un modelo de lenguaje o un NarrowBand WideBand modelo para crear un modelo de lenguaje personalizado. Puede transcribir audio con una frecuencia de muestreo inferior a 16 kHz con un modelo de lenguaje personalizado utilizando un modelo NarrowBand base. Puede transcribir 16 kHz o más audios con un modelo de idioma personalizado utilizando un modelo WideBand base. El ModelStatus parámetro muestra si puede utilizar el modelo de idioma personalizado en un trabajo de transcripción. Si el valor esCOMPLETED, puede usarlo en un trabajo de transcripción.

aws transcribe list-language-models

Salida:

{ "Models": [ { "ModelName": "cli-clm-2", "CreateTime": "2020-09-25T17:57:38.504000+00:00", "LastModifiedTime": "2020-09-25T17:57:48.585000+00:00", "LanguageCode": "language-code", "BaseModelName": "WideBand", "ModelStatus": "IN_PROGRESS", "UpgradeAvailability": false, "InputDataConfig": { "S3Uri": "s3://DOC-EXAMPLE-BUCKET/clm-training-data/", "TuningDataS3Uri": "s3://DOC-EXAMPLE-BUCKET/clm-tuning-data/", "DataAccessRoleArn": "arn:aws:iam::AWS-account-number:role/IAM-role-used-to-create-the-custom-language-model" } }, { "ModelName": "cli-clm-1", "CreateTime": "2020-09-25T17:16:01.835000+00:00", "LastModifiedTime": "2020-09-25T17:16:15.555000+00:00", "LanguageCode": "language-code", "BaseModelName": "WideBand", "ModelStatus": "IN_PROGRESS", "UpgradeAvailability": false, "InputDataConfig": { "S3Uri": "s3://DOC-EXAMPLE-BUCKET/clm-training-data/", "DataAccessRoleArn": "arn:aws:iam::AWS-account-number:role/IAM-role-used-to-create-the-custom-language-model" } }, { "ModelName": "clm-console-1", "CreateTime": "2020-09-24T19:26:28.076000+00:00", "LastModifiedTime": "2020-09-25T04:25:22.271000+00:00", "LanguageCode": "language-code", "BaseModelName": "NarrowBand", "ModelStatus": "COMPLETED", "UpgradeAvailability": false, "InputDataConfig": { "S3Uri": "s3://DOC-EXAMPLE-BUCKET/clm-training-data/", "DataAccessRoleArn": "arn:aws:iam::AWS-account-number:role/IAM-role-used-to-create-the-custom-language-model" } } ] }

Para obtener más información, consulte Mejora de la precisión de la transcripción específica de dominios con modelos de idiomas personalizados en la Guía para desarrolladores de Amazon Transcribe.

  • Para API obtener más información, consulte ListLanguageModelsla Referencia de AWS CLI comandos.

En el siguiente ejemplo de código se muestra cómo usar list-medical-transcription-jobs.

AWS CLI

Para enumerar los trabajos de transcripción médica

En el siguiente list-medical-transcription-jobs ejemplo, se enumeran los trabajos de transcripción médica asociados a su AWS cuenta y región. Para obtener más información sobre un trabajo de transcripción concreto, copie el valor de un MedicalTranscriptionJobName parámetro en el resultado de la transcripción y especifique ese valor en la MedicalTranscriptionJobName opción del get-medical-transcription-job comando. Para ver más trabajos de transcripción, copie el valor del NextToken parámetro, vuelva a ejecutar el list-medical-transcription-jobs comando y especifique ese valor en la --next-token opción.

aws transcribe list-medical-transcription-jobs

Salida:

{ "NextToken": "3/PblzkiGhzjER3KHuQt2fmbPLF7cDYafjFMEoGn44ON/gsuUSTIkGyanvRE6WMXFd/ZTEc2EZj+P9eii/z1O2FDYli6RLI0WoRX4RwMisVrh9G0Kie0Y8ikBCdtqlZB10Wa9McC+ebOl+LaDtZPC4u6ttoHLRlEfzqstHXSgapXg3tEBtm9piIaPB6MOM5BB6t86+qtmocTR/qrteHZBBudhTfbCwhsxaqujHiiUvFdm3BQbKKWIW06yV9b+4f38oD2lVIan+vfUs3gBYAl5VTDmXXzQPBQOHPjtwmFI+IWX15nSUjWuN3TUylHgPWzDaYT8qBtu0Z+3UG4V6b+K2CC0XszXg5rBq9hYgNzy4XoFh/6s5DoSnzq49Q9xHgHdT2yBADFmvFK7myZBsj75+2vQZOSVpWUPy3WT/32zFAcoELHR4unuWhXPwjbKU+mFYfUjtTZ8n/jq7aQEjQ42A+X/7K6JgOcdVPtEg8PlDr5kgYYG3q3OmYXX37U3FZuJmnTI63VtIXsNnOU5eGoYObtpk00Nq9UkzgSJxqj84ZD5n+S0EGy9ZUYBJRRcGeYUM3Q4DbSJfUwSAqcFdLIWZdp8qIREMQIBWy7BLwSdyqsQo2vRrd53hm5aWM7SVf6pPq6X/IXR5+1eUOOD8/coaTT4ES2DerbV6RkV4o0VT1d0SdVX/MmtkNG8nYj8PqU07w7988quh1ZP6D80veJS1q73tUUR9MjnGernW2tAnvnLNhdefBcD+sZVfYq3iBMFY7wTy1P1G6NqW9GrYDYoX3tTPWlD7phpbVSyKrh/PdYrps5UxnsGoA1b7L/FfAXDfUoGrGUB4N3JsPYXX9D++g+6gV1qBBs/WfF934aKqfD6UTggm/zV3GAOWiBpfvAZRvEb924i6yGHyMC7y54O1ZAwSBupmI+FFd13CaPO4kN1vJlth6aM5vUPXg4BpyUhtbRhwD/KxCvf9K0tLJGyL1A==", "MedicalTranscriptionJobSummaries": [ { "MedicalTranscriptionJobName": "vocabulary-dictation-medical-transcription-job", "CreationTime": "2020-09-21T21:17:27.016000+00:00", "StartTime": "2020-09-21T21:17:27.045000+00:00", "CompletionTime": "2020-09-21T21:17:59.561000+00:00", "LanguageCode": "en-US", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "CUSTOMER_BUCKET", "Specialty": "PRIMARYCARE", "Type": "DICTATION" }, { "MedicalTranscriptionJobName": "alternatives-dictation-medical-transcription-job", "CreationTime": "2020-09-21T21:01:14.569000+00:00", "StartTime": "2020-09-21T21:01:14.592000+00:00", "CompletionTime": "2020-09-21T21:01:43.606000+00:00", "LanguageCode": "en-US", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "CUSTOMER_BUCKET", "Specialty": "PRIMARYCARE", "Type": "DICTATION" }, { "MedicalTranscriptionJobName": "alternatives-conversation-medical-transcription-job", "CreationTime": "2020-09-21T19:09:18.171000+00:00", "StartTime": "2020-09-21T19:09:18.199000+00:00", "CompletionTime": "2020-09-21T19:10:22.516000+00:00", "LanguageCode": "en-US", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "CUSTOMER_BUCKET", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION" }, { "MedicalTranscriptionJobName": "speaker-id-conversation-medical-transcription-job", "CreationTime": "2020-09-21T18:43:37.157000+00:00", "StartTime": "2020-09-21T18:43:37.265000+00:00", "CompletionTime": "2020-09-21T18:44:21.192000+00:00", "LanguageCode": "en-US", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "CUSTOMER_BUCKET", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION" }, { "MedicalTranscriptionJobName": "multichannel-conversation-medical-transcription-job", "CreationTime": "2020-09-20T23:46:44.053000+00:00", "StartTime": "2020-09-20T23:46:44.081000+00:00", "CompletionTime": "2020-09-20T23:47:35.851000+00:00", "LanguageCode": "en-US", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "CUSTOMER_BUCKET", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION" } ] }

Para obtener más información, consulte https://docs.aws.amazon.com/transcribe/ latest/dg/batch -med-transcription.html> en la Guía para desarrolladores de Amazon Transcribe.

En el siguiente ejemplo de código se muestra cómo usar list-medical-vocabularies.

AWS CLI

Para enumerar sus vocabularios médicos personalizados

En el siguiente list-medical-vocabularies ejemplo, se enumeran los vocabularios médicos personalizados asociados a tu AWS cuenta y región. Para obtener más información sobre un trabajo de transcripción concreto, copie el valor de un MedicalTranscriptionJobName parámetro en el resultado de la transcripción y especifique ese valor para la MedicalTranscriptionJobName opción del get-medical-transcription-job comando. Para ver más trabajos de transcripción, copie el valor del NextToken parámetro, vuelva a ejecutar el list-medical-transcription-jobs comando y especifique ese valor en la --next-token opción.

aws transcribe list-medical-vocabularies

Salida:

{ "Vocabularies": [ { "VocabularyName": "cli-medical-vocab-2", "LanguageCode": "en-US", "LastModifiedTime": "2020-09-21T21:44:59.521000+00:00", "VocabularyState": "READY" }, { "VocabularyName": "cli-medical-vocab-1", "LanguageCode": "en-US", "LastModifiedTime": "2020-09-19T23:59:04.349000+00:00", "VocabularyState": "READY" } ] }

Para obtener más información, consulte Vocabularios médicos personalizados en la Guía para desarrolladores de Amazon Transcribe.

En el siguiente ejemplo de código se muestra cómo usar list-transcription-jobs.

AWS CLI

Para enumerar los trabajos de transcripción

En el siguiente list-transcription-jobs ejemplo, se enumeran los trabajos de transcripción asociados a su AWS cuenta y región.

aws transcribe list-transcription-jobs

Salida:

{ "NextToken": "NextToken", "TranscriptionJobSummaries": [ { "TranscriptionJobName": "speak-id-job-1", "CreationTime": "2020-08-17T21:06:15.391000+00:00", "StartTime": "2020-08-17T21:06:15.416000+00:00", "CompletionTime": "2020-08-17T21:07:05.098000+00:00", "LanguageCode": "language-code", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "SERVICE_BUCKET" }, { "TranscriptionJobName": "job-1", "CreationTime": "2020-08-17T20:50:24.207000+00:00", "StartTime": "2020-08-17T20:50:24.230000+00:00", "CompletionTime": "2020-08-17T20:52:18.737000+00:00", "LanguageCode": "language-code", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "SERVICE_BUCKET" }, { "TranscriptionJobName": "sdk-test-job-4", "CreationTime": "2020-08-17T20:32:27.917000+00:00", "StartTime": "2020-08-17T20:32:27.956000+00:00", "CompletionTime": "2020-08-17T20:33:15.126000+00:00", "LanguageCode": "language-code", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "SERVICE_BUCKET" }, { "TranscriptionJobName": "Diarization-speak-id", "CreationTime": "2020-08-10T22:10:09.066000+00:00", "StartTime": "2020-08-10T22:10:09.116000+00:00", "CompletionTime": "2020-08-10T22:26:48.172000+00:00", "LanguageCode": "language-code", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "SERVICE_BUCKET" }, { "TranscriptionJobName": "your-transcription-job-name", "CreationTime": "2020-07-29T17:45:09.791000+00:00", "StartTime": "2020-07-29T17:45:09.826000+00:00", "CompletionTime": "2020-07-29T17:46:20.831000+00:00", "LanguageCode": "language-code", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "SERVICE_BUCKET" } ] }

Para obtener más información, consulte Introducción (interfaz de línea de AWS comandos) en la Guía para desarrolladores de Amazon Transcribe.

En el siguiente ejemplo de código se muestra cómo usar list-vocabularies.

AWS CLI

Para enumerar los vocabularios personalizados

En el siguiente list-vocabularies ejemplo, se enumeran los vocabularios personalizados asociados a su AWS cuenta y región.

aws transcribe list-vocabularies

Salida:

{ "NextToken": "NextToken", "Vocabularies": [ { "VocabularyName": "ards-test-1", "LanguageCode": "language-code", "LastModifiedTime": "2020-04-27T22:00:27.330000+00:00", "VocabularyState": "READY" }, { "VocabularyName": "sample-test", "LanguageCode": "language-code", "LastModifiedTime": "2020-04-24T23:04:11.044000+00:00", "VocabularyState": "READY" }, { "VocabularyName": "CRLF-to-LF-test-3-1", "LanguageCode": "language-code", "LastModifiedTime": "2020-04-24T22:12:22.277000+00:00", "VocabularyState": "READY" }, { "VocabularyName": "CRLF-to-LF-test-2", "LanguageCode": "language-code", "LastModifiedTime": "2020-04-24T21:53:50.455000+00:00", "VocabularyState": "READY" }, { "VocabularyName": "CRLF-to-LF-1-1", "LanguageCode": "language-code", "LastModifiedTime": "2020-04-24T21:39:33.356000+00:00", "VocabularyState": "READY" } ] }

Para obtener más información, consulte Vocabularios personalizados en la Guía para desarrolladores de Amazon Transcribe.

  • Para API obtener más información, consulte ListVocabulariesla Referencia de AWS CLI comandos.

En el siguiente ejemplo de código se muestra cómo usar list-vocabulary-filters.

AWS CLI

Para enumerar tus filtros de vocabulario

El siguiente list-vocabulary-filters ejemplo muestra los filtros de vocabulario asociados a tu AWS cuenta y región.

aws transcribe list-vocabulary-filters

Salida:

{ "NextToken": "NextToken": [ { "VocabularyFilterName": "testFilter", "LanguageCode": "language-code", "LastModifiedTime": "2020-05-07T22:39:32.147000+00:00" }, { "VocabularyFilterName": "testFilter2", "LanguageCode": "language-code", "LastModifiedTime": "2020-05-21T23:29:35.174000+00:00" }, { "VocabularyFilterName": "filter2", "LanguageCode": "language-code", "LastModifiedTime": "2020-05-08T20:18:26.426000+00:00" }, { "VocabularyFilterName": "filter-review", "LanguageCode": "language-code", "LastModifiedTime": "2020-06-03T18:52:30.448000+00:00" }, { "VocabularyFilterName": "crlf-filt", "LanguageCode": "language-code", "LastModifiedTime": "2020-05-22T19:42:42.737000+00:00" } ] }

Para obtener más información, consulte Filtrar palabras no deseadas en la Guía para desarrolladores de Amazon Transcribe.

En el siguiente ejemplo de código se muestra cómo usar start-medical-transcription-job.

AWS CLI

Ejemplo 1: para transcribir un dictado médico almacenado como un archivo de audio

En el siguiente ejemplo de start-medical-transcription-job se transcribe un archivo de audio. Especifique la ubicación del resultado de la transcripción en el parámetro OutputBucketName.

aws transcribe start-medical-transcription-job \ --cli-input-json file://myfile.json

Contenidos de myfile.json:

{ "MedicalTranscriptionJobName": "simple-dictation-medical-transcription-job", "LanguageCode": "language-code", "Specialty": "PRIMARYCARE", "Type": "DICTATION", "OutputBucketName":"DOC-EXAMPLE-BUCKET", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" } }

Salida:

{ "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "simple-dictation-medical-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "StartTime": "2020-09-20T00:35:22.256000+00:00", "CreationTime": "2020-09-20T00:35:22.218000+00:00", "Specialty": "PRIMARYCARE", "Type": "DICTATION" } }

Para obtener más información, consulte Información general de la transcripción por lotes en la Guía para desarrolladores de Amazon Transcribe.

Ejemplo 2: para transcribir un diálogo entre el médico y el paciente almacenado como un archivo de audio

En el siguiente ejemplo de start-medical-transcription-job se transcribe un archivo de audio que contiene un diálogo entre el médico y el paciente. La ubicación del resultado de la transcripción se especifica en el OutputBucketName parámetro.

aws transcribe start-medical-transcription-job \ --cli-input-json file://mysecondfile.json

Contenidos de mysecondfile.json:

{ "MedicalTranscriptionJobName": "simple-dictation-medical-transcription-job", "LanguageCode": "language-code", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION", "OutputBucketName":"DOC-EXAMPLE-BUCKET", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" } }

Salida:

{ "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "simple-conversation-medical-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "StartTime": "2020-09-20T23:19:49.965000+00:00", "CreationTime": "2020-09-20T23:19:49.941000+00:00", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION" } }

Para obtener más información, consulte Información general de la transcripción por lotes en la Guía para desarrolladores de Amazon Transcribe.

Ejemplo 3: para transcribir un archivo de audio multicanal de un diálogo entre el médico y el paciente

En el siguiente ejemplo de start-medical-transcription-job se transcribe el audio de cada canal del archivo de audio y se combinan las transcripciones independientes de cada canal en un único resultado de transcripción. Especifique la ubicación del resultado de la transcripción en el parámetro OutputBucketName.

aws transcribe start-medical-transcription-job \ --cli-input-json file://mythirdfile.json

Contenidos de mythirdfile.json:

{ "MedicalTranscriptionJobName": "multichannel-conversation-medical-transcription-job", "LanguageCode": "language-code", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION", "OutputBucketName":"DOC-EXAMPLE-BUCKET", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "Settings":{ "ChannelIdentification": true } }

Salida:

{ "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "multichannel-conversation-medical-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "StartTime": "2020-09-20T23:46:44.081000+00:00", "CreationTime": "2020-09-20T23:46:44.053000+00:00", "Settings": { "ChannelIdentification": true }, "Specialty": "PRIMARYCARE", "Type": "CONVERSATION" } }

Para obtener más información, consulte Identificación de canales en la Guía para desarrolladores de Amazon Transcribe.

Ejemplo 4: para transcribir un archivo de audio de un diálogo entre el médico y el paciente e identificar a los interlocutores en el resultado de la transcripción

En el siguiente ejemplo de start-medical-transcription-job se transcribe un archivo de audio y se etiqueta la voz de cada interlocutor en el resultado de la transcripción. Especifique la ubicación del resultado de la transcripción en el parámetro OutputBucketName.

aws transcribe start-medical-transcription-job \ --cli-input-json file://myfourthfile.json

Contenidos de myfourthfile.json:

{ "MedicalTranscriptionJobName": "speaker-id-conversation-medical-transcription-job", "LanguageCode": "language-code", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION", "OutputBucketName":"DOC-EXAMPLE-BUCKET", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "Settings":{ "ShowSpeakerLabels": true, "MaxSpeakerLabels": 2 } }

Salida:

{ "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "speaker-id-conversation-medical-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "StartTime": "2020-09-21T18:43:37.265000+00:00", "CreationTime": "2020-09-21T18:43:37.157000+00:00", "Settings": { "ShowSpeakerLabels": true, "MaxSpeakerLabels": 2 }, "Specialty": "PRIMARYCARE", "Type": "CONVERSATION" } }

Para obtener más información, consulte Identificación de interlocutores en la Guía para desarrolladores de Amazon Transcribe.

Ejemplo 5: para transcribir una conversación médica almacenada como un archivo de audio con hasta dos alternativas de transcripción

En el siguiente ejemplo de start-medical-transcription-job crea hasta dos transcripciones alternativas a partir de un único archivo de audio. Cada transcripción tiene un nivel de confianza asociado. De forma predeterminada, Amazon Transcribe devuelve la transcripción con el nivel de confianza más alto. Puede especificar que Amazon Transcribe devuelva otras transcripciones con niveles de confianza más bajos. Especifique la ubicación del resultado de la transcripción en el parámetro OutputBucketName.

aws transcribe start-medical-transcription-job \ --cli-input-json file://myfifthfile.json

Contenidos de myfifthfile.json:

{ "MedicalTranscriptionJobName": "alternatives-conversation-medical-transcription-job", "LanguageCode": "language-code", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION", "OutputBucketName":"DOC-EXAMPLE-BUCKET", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "Settings":{ "ShowAlternatives": true, "MaxAlternatives": 2 } }

Salida:

{ "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "alternatives-conversation-medical-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "StartTime": "2020-09-21T19:09:18.199000+00:00", "CreationTime": "2020-09-21T19:09:18.171000+00:00", "Settings": { "ShowAlternatives": true, "MaxAlternatives": 2 }, "Specialty": "PRIMARYCARE", "Type": "CONVERSATION" } }

Para obtener más información, consulte Transcripciones alternativas en la Guía para desarrolladores de Amazon Transcribe.

Ejemplo 6: para transcribir un archivo de audio de un dictado médico con hasta dos transcripciones alternativas

En el siguiente ejemplo de start-medical-transcription-job se transcribe un archivo de audio y se utiliza un filtro de vocabulario para ocultar las palabras no deseadas. La ubicación del resultado de la transcripción se especifica en el OutputBucketName parámetro.

aws transcribe start-medical-transcription-job \ --cli-input-json file://mysixthfile.json

Contenidos de mysixthfile.json:

{ "MedicalTranscriptionJobName": "alternatives-conversation-medical-transcription-job", "LanguageCode": "language-code", "Specialty": "PRIMARYCARE", "Type": "DICTATION", "OutputBucketName":"DOC-EXAMPLE-BUCKET", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "Settings":{ "ShowAlternatives": true, "MaxAlternatives": 2 } }

Salida:

{ "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "alternatives-dictation-medical-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "StartTime": "2020-09-21T21:01:14.592000+00:00", "CreationTime": "2020-09-21T21:01:14.569000+00:00", "Settings": { "ShowAlternatives": true, "MaxAlternatives": 2 }, "Specialty": "PRIMARYCARE", "Type": "DICTATION" } }

Para obtener más información, consulte Transcripciones alternativas en la Guía para desarrolladores de Amazon Transcribe.

Ejemplo 7: para transcribir un archivo de audio de un dictado médico con mayor precisión mediante un vocabulario personalizado

En el siguiente ejemplo de start-medical-transcription-job se transcribe un archivo de audio y se utiliza un vocabulario médico personalizado que haya creado anteriormente para aumentar la precisión de la transcripción. Especifique la ubicación del resultado de la transcripción en el parámetro OutputBucketName.

aws transcribe start-transcription-job \ --cli-input-json file://myseventhfile.json

Contenidos de mysixthfile.json:

{ "MedicalTranscriptionJobName": "vocabulary-dictation-medical-transcription-job", "LanguageCode": "language-code", "Specialty": "PRIMARYCARE", "Type": "DICTATION", "OutputBucketName":"DOC-EXAMPLE-BUCKET", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "Settings":{ "VocabularyName": "cli-medical-vocab-1" } }

Salida:

{ "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "vocabulary-dictation-medical-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "StartTime": "2020-09-21T21:17:27.045000+00:00", "CreationTime": "2020-09-21T21:17:27.016000+00:00", "Settings": { "VocabularyName": "cli-medical-vocab-1" }, "Specialty": "PRIMARYCARE", "Type": "DICTATION" } }

Para obtener más información, consulte Vocabularios médicos personalizados en la Guía para desarrolladores de Amazon Transcribe.

En el siguiente ejemplo de código se muestra cómo usar start-transcription-job.

AWS CLI

Ejemplo 1: para transcribir un archivo de audio

En el siguiente ejemplo de start-transcription-job se transcribe un archivo de audio.

aws transcribe start-transcription-job \ --cli-input-json file://myfile.json

Contenidos de myfile.json:

{ "TranscriptionJobName": "cli-simple-transcription-job", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" } }

Para obtener más información, consulte Introducción (interfaz de línea de AWS comandos) en la Guía para desarrolladores de Amazon Transcribe.

Ejemplo 2: para transcribir un archivo de audio multicanal

En el siguiente ejemplo de start-transcription-job se transcribe un archivo de audio multicanal.

aws transcribe start-transcription-job \ --cli-input-json file://mysecondfile.json

Contenidos de mysecondfile.json:

{ "TranscriptionJobName": "cli-channelid-job", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "Settings":{ "ChannelIdentification":true } }

Salida:

{ "TranscriptionJob": { "TranscriptionJobName": "cli-channelid-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "StartTime": "2020-09-17T16:07:56.817000+00:00", "CreationTime": "2020-09-17T16:07:56.784000+00:00", "Settings": { "ChannelIdentification": true } } }

Para obtener más información, consulte Transcripción de audio multicanal en la Guía para desarrolladores de Amazon Transcribe.

Ejemplo 3: para transcribir un archivo de audio e identificar a los distintos interlocutores

En el siguiente ejemplo de start-transcription-job se transcribe un archivo de audio y se identifica la voz de los interlocutores en el resultado de la transcripción.

aws transcribe start-transcription-job \ --cli-input-json file://mythirdfile.json

Contenidos de mythirdfile.json:

{ "TranscriptionJobName": "cli-speakerid-job", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "Settings":{ "ShowSpeakerLabels": true, "MaxSpeakerLabels": 2 } }

Salida:

{ "TranscriptionJob": { "TranscriptionJobName": "cli-speakerid-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "StartTime": "2020-09-17T16:22:59.696000+00:00", "CreationTime": "2020-09-17T16:22:59.676000+00:00", "Settings": { "ShowSpeakerLabels": true, "MaxSpeakerLabels": 2 } } }

Para obtener más información, consulte Identificación de interlocutores en la Guía para desarrolladores de Amazon Transcribe.

Ejemplo 4: para transcribir un archivo de audio y ocultar las palabras no deseadas en el resultado de la transcripción

En el siguiente ejemplo de start-transcription-job se transcribe un archivo de audio y se utiliza un filtro de vocabulario que ha creado anteriormente para ocultar las palabras no deseadas.

aws transcribe start-transcription-job \ --cli-input-json file://myfourthfile.json

Contenidos de myfourthfile.json:

{ "TranscriptionJobName": "cli-filter-mask-job", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "Settings":{ "VocabularyFilterName": "your-vocabulary-filter", "VocabularyFilterMethod": "mask" } }

Salida:

{ "TranscriptionJob": { "TranscriptionJobName": "cli-filter-mask-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://Amazon-S3-Prefix/your-media-file.file-extension" }, "StartTime": "2020-09-18T16:36:18.568000+00:00", "CreationTime": "2020-09-18T16:36:18.547000+00:00", "Settings": { "VocabularyFilterName": "your-vocabulary-filter", "VocabularyFilterMethod": "mask" } } }

Para obtener más información, consulte Filtrado de transcripciones en la Guía para desarrolladores de Amazon Transcribe.

Ejemplo 5: para transcribir un archivo de audio y eliminar las palabras no deseadas en el resultado de la transcripción

En el siguiente ejemplo de start-transcription-job se transcribe un archivo de audio y se utiliza un filtro de vocabulario que ha creado anteriormente para ocultar las palabras no deseadas.

aws transcribe start-transcription-job \ --cli-input-json file://myfifthfile.json

Contenidos de myfifthfile.json:

{ "TranscriptionJobName": "cli-filter-remove-job", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "Settings":{ "VocabularyFilterName": "your-vocabulary-filter", "VocabularyFilterMethod": "remove" } }

Salida:

{ "TranscriptionJob": { "TranscriptionJobName": "cli-filter-remove-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "StartTime": "2020-09-18T16:36:18.568000+00:00", "CreationTime": "2020-09-18T16:36:18.547000+00:00", "Settings": { "VocabularyFilterName": "your-vocabulary-filter", "VocabularyFilterMethod": "remove" } } }

Para obtener más información, consulte Filtrado de transcripciones en la Guía para desarrolladores de Amazon Transcribe.

Ejemplo 6: para transcribir un archivo de audio con mayor precisión mediante un vocabulario personalizado

En el siguiente ejemplo de start-transcription-job se transcribe un archivo de audio y se utiliza un filtro de vocabulario que ha creado anteriormente para ocultar las palabras no deseadas.

aws transcribe start-transcription-job \ --cli-input-json file://mysixthfile.json

Contenidos de mysixthfile.json:

{ "TranscriptionJobName": "cli-vocab-job", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "Settings":{ "VocabularyName": "your-vocabulary" } }

Salida:

{ "TranscriptionJob": { "TranscriptionJobName": "cli-vocab-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "StartTime": "2020-09-18T16:36:18.568000+00:00", "CreationTime": "2020-09-18T16:36:18.547000+00:00", "Settings": { "VocabularyName": "your-vocabulary" } } }

Para obtener más información, consulte Filtrado de transcripciones en la Guía para desarrolladores de Amazon Transcribe.

Ejemplo 7: para identificar el idioma de un archivo de audio y transcribirlo

En el siguiente ejemplo de start-transcription-job se transcribe un archivo de audio y se utiliza un filtro de vocabulario que ha creado anteriormente para ocultar las palabras no deseadas.

aws transcribe start-transcription-job \ --cli-input-json file://myseventhfile.json

Contenidos de myseventhfile.json:

{ "TranscriptionJobName": "cli-identify-language-transcription-job", "IdentifyLanguage": true, "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" } }

Salida:

{ "TranscriptionJob": { "TranscriptionJobName": "cli-identify-language-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "StartTime": "2020-09-18T22:27:23.970000+00:00", "CreationTime": "2020-09-18T22:27:23.948000+00:00", "IdentifyLanguage": true } }

Para obtener más información, consulte Identificación del idioma en la Guía para desarrolladores de Amazon Transcribe.

Ejemplo 8: para transcribir un archivo de audio con información de identificación personal redactada

En el siguiente ejemplo de start-transcription-job se transcribe un archivo de audio y se redacta la información de identificación personal en el resultado de la transcripción.

aws transcribe start-transcription-job \ --cli-input-json file://myeighthfile.json

Contenidos de myeigthfile.json:

{ "TranscriptionJobName": "cli-redaction-job", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://Amazon-S3-Prefix/your-media-file.file-extension" }, "ContentRedaction": { "RedactionOutput":"redacted", "RedactionType":"PII" } }

Salida:

{ "TranscriptionJob": { "TranscriptionJobName": "cli-redaction-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://Amazon-S3-Prefix/your-media-file.file-extension" }, "StartTime": "2020-09-25T23:49:13.195000+00:00", "CreationTime": "2020-09-25T23:49:13.176000+00:00", "ContentRedaction": { "RedactionType": "PII", "RedactionOutput": "redacted" } } }

Para obtener más información, consulte Redacción automática de contenido en la Guía para desarrolladores de Amazon Transcribe.

Ejemplo 9: Para generar una transcripción con información de identificación personal (PII) redactada y una transcripción sin editar

En el siguiente ejemplo de start-transcription-job se generan dos transcripciones del archivo de audio, una con la información de identificación personal redactada y la otra sin ninguna redacción.

aws transcribe start-transcription-job \ --cli-input-json file://myninthfile.json

Contenidos de myninthfile.json:

{ "TranscriptionJobName": "cli-redaction-job-with-unredacted-transcript", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://Amazon-S3-Prefix/your-media-file.file-extension" }, "ContentRedaction": { "RedactionOutput":"redacted_and_unredacted", "RedactionType":"PII" } }

Salida:

{ "TranscriptionJob": { "TranscriptionJobName": "cli-redaction-job-with-unredacted-transcript", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://Amazon-S3-Prefix/your-media-file.file-extension" }, "StartTime": "2020-09-25T23:59:47.677000+00:00", "CreationTime": "2020-09-25T23:59:47.653000+00:00", "ContentRedaction": { "RedactionType": "PII", "RedactionOutput": "redacted_and_unredacted" } } }

Para obtener más información, consulte Redacción automática de contenido en la Guía para desarrolladores de Amazon Transcribe.

Ejemplo 10: para usar un modelo de idioma personalizado que haya creado previamente para transcribir un archivo de audio

En el siguiente ejemplo de start-transcription-job se transcribe un archivo de audio con un modelo de idioma personalizado que haya creado anteriormente.

aws transcribe start-transcription-job \ --cli-input-json file://mytenthfile.json

Contenidos de mytenthfile.json:

{ "TranscriptionJobName": "cli-clm-2-job-1", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.file-extension" }, "ModelSettings": { "LanguageModelName":"cli-clm-2" } }

Salida:

{ "TranscriptionJob": { "TranscriptionJobName": "cli-clm-2-job-1", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.file-extension" }, "StartTime": "2020-09-28T17:56:01.835000+00:00", "CreationTime": "2020-09-28T17:56:01.801000+00:00", "ModelSettings": { "LanguageModelName": "cli-clm-2" } } }

Para obtener más información, consulte Mejora de la precisión de la transcripción específica de dominios con modelos de idiomas personalizados en la Guía para desarrolladores de Amazon Transcribe.

En el siguiente ejemplo de código se muestra cómo usar update-medical-vocabulary.

AWS CLI

Para actualizar un vocabulario médico personalizado con nuevos términos.

En el siguiente update-medical-vocabulary ejemplo, se sustituyen los términos utilizados en un vocabulario médico personalizado por otros nuevos. Requisito previo: para sustituir los términos de un vocabulario médico personalizado, se necesita un archivo con términos nuevos.

aws transcribe update-medical-vocabulary \ --vocabulary-file-uri s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix/medical-custom-vocabulary.txt \ --vocabulary-name medical-custom-vocabulary \ --language-code language

Salida:

{ "VocabularyName": "medical-custom-vocabulary", "LanguageCode": "en-US", "VocabularyState": "PENDING" }

Para obtener más información, consulte Vocabularios médicos personalizados en la Guía para desarrolladores de Amazon Transcribe.

En el siguiente ejemplo de código se muestra cómo usar update-vocabulary-filter.

AWS CLI

Para reemplazar las palabras de un filtro de vocabulario

En el siguiente update-vocabulary-filter ejemplo, se sustituyen las palabras de un filtro de vocabulario por otras nuevas. Requisito previo: para actualizar un filtro de vocabulario con las nuevas palabras, debe guardarlas como un archivo de texto.

aws transcribe update-vocabulary-filter \ --vocabulary-filter-file-uri s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix/your-text-file-to-update-your-vocabulary-filter.txt \ --vocabulary-filter-name vocabulary-filter-name

Salida:

{ "VocabularyFilterName": "vocabulary-filter-name", "LanguageCode": "language-code", "LastModifiedTime": "2020-09-23T18:40:35.139000+00:00" }

Para obtener más información, consulte Filtrar palabras no deseadas en la Guía para desarrolladores de Amazon Transcribe.

En el siguiente ejemplo de código se muestra cómo usar update-vocabulary.

AWS CLI

Para actualizar un vocabulario personalizado con términos nuevos

En el siguiente ejemplo de update-vocabulary se sobrescriben los términos utilizados para crear un vocabulario personalizado con los nuevos que proporcione. Requisito previo: para sustituir los términos de un vocabulario personalizado, necesita un archivo con términos nuevos.

aws transcribe update-vocabulary \ --vocabulary-file-uri s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix/custom-vocabulary.txt \ --vocabulary-name custom-vocabulary \ --language-code language-code

Salida:

{ "VocabularyName": "custom-vocabulary", "LanguageCode": "language", "VocabularyState": "PENDING" }

Para obtener más información, consulte Vocabularios personalizados en la Guía para desarrolladores de Amazon Transcribe.

  • Para API obtener más información, consulte UpdateVocabularyla Referencia de AWS CLI comandos.