

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Identificación de la PHI en un archivo de audio
<a name="phi-id-batch"></a>

Utilice un trabajo de transcripción por lotes para transcribir archivos de audio e identificar la información médica protegida (PHI) que contienen. Cuando activa la identificación de información de salud personal (PHI), Amazon Transcribe Medical etiqueta la PHI que identificó en los resultados de la transcripción. Para obtener información sobre la PHI que Amazon Transcribe Medical puede identificar, consulte[Identificación de información médica protegida (PHI) en una transcripción](phi-id.md).

Puede iniciar un trabajo de transcripción por lotes en la API de [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html) o en Consola de administración de AWS.

## Consola de administración de AWS
<a name="batch-med-phi-console"></a>

**Para usar el Consola de administración de AWS para transcribir un diálogo entre el médico y el paciente, cree un trabajo de transcripción y seleccione **Conversación** como tipo de entrada de audio.**

**Para transcribir un archivo de audio e identificar su PHI (Consola de administración de AWS)**

1. Inicie sesión en la [Consola de administración de AWS](https://console.aws.amazon.com/transcribe/).

1. **En el panel de navegación, en Amazon Transcribe Medicina, selecciona Trabajos de transcripción.**

1. Seleccione **Crear trabajo**.

1. En la página **Especificar detalles del trabajo**, en **Configuración del trabajo**, especifique lo siguiente.

   1. **Nombre**: el nombre del trabajo de transcripción que es exclusivo para usted Cuenta de AWS.

   1. **Tipo de entrada de audio**: **conversación** o **Dictado.**

1. Para el resto de los campos, especifique la Amazon S3 ubicación del archivo de audio y dónde desea almacenar el resultado del trabajo de transcripción.

1. Elija **Siguiente**.

1. En **Configuración de audio**, seleccione **Identificación PHI**.

1. Seleccione **Crear**.

## API
<a name="batch-med-phi-api"></a>

**Para transcribir un archivo de audio e identificar su PHI mediante un trabajo de transcripción por lotes (API)**
+ Para la API [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html), especifique lo siguiente.

  1. Para `MedicalTranscriptionJobName`, especifique un nombre que sea exclusivo de su Cuenta de AWS.

  1. Para `LanguageCode`, especifique el código de idioma que corresponda al idioma hablado en el archivo de audio.

  1. En el parámetro `MediaFileUri` del objeto `Media`, especifique el nombre del archivo multimedia que desea transcribir.

  1. Para `Specialty`, especifique la especialidad médica del profesional que habla en el archivo de audio como `PRIMARYCARE`.

  1. En `Type`, especifique `CONVERSATION` o `DICTATION`.

  1. Para `OutputBucketName`, especifique el bucket de Amazon S3 en el que desee almacenar los resultados de la transcripción.

  El siguiente es un ejemplo de solicitud que utiliza el AWS SDK para Python (Boto3) para transcribir un archivo de audio e identificar la PHI de un paciente.

  ```
  from __future__ import print_function
  import time
  import boto3
  transcribe = boto3.client('transcribe')
  job_name = "{{my-first-transcription-job}}"
  job_uri = "s3://{{amzn-s3-demo-bucket}}/{{my-input-files}}/{{my-audio-file}}.{{flac}}"
  transcribe.start_medical_transcription_job(
        MedicalTranscriptionJobName = job_name,
        Media = {'MediaFileUri': job_uri},
        LanguageCode = 'en-US',
        ContentIdentificationType = 'PHI',
        Specialty = 'PRIMARYCARE',
        Type = '{{type}}', # Specify 'CONVERSATION' for a medical conversation. Specify 'DICTATION' for a medical dictation.
        OutputBucketName = '{{amzn-s3-demo-bucket}}'
    )
  while True:
      status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name)
      if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
          break
      print("Not ready yet...")
      time.sleep(5)
  print(status)
  ```

El siguiente código de ejemplo muestra los resultados de la transcripción con la PHI del paciente identificada.

```
{
    "jobName": "my-medical-transcription-job-name",
    "accountId": "111122223333",
    "results": {
        "transcripts": [{
            "transcript": "The patient's name is Bertrand."
        }],
        "items": [{
                "id": 0,
            "start_time": "0.0",
            "end_time": "0.37",
            "alternatives": [{
                "confidence": "0.9993",
                "content": "The"
            }],
            "type": "pronunciation"
        }, {
                "id": 1,
            "start_time": "0.37",
            "end_time": "0.44",
            "alternatives": [{
                "confidence": "0.9981",
                "content": "patient's"
            }],
            "type": "pronunciation"
        }, {
                "id": 2,
            "start_time": "0.44",
            "end_time": "0.52",
            "alternatives": [{
                "confidence": "1.0",
                "content": "name"
            }],
            "type": "pronunciation"
        }, {
                "id": 3,
            "start_time": "0.52",
            "end_time": "0.92",
            "alternatives": [{
                "confidence": "1.0",
                "content": "is"
            }],
            "type": "pronunciation"
        }, {
                "id": 4,
            "start_time": "0.92",
            "end_time": "0.9989",
            "alternatives": [{
                "confidence": "1.0",
                "content": "Bertrand"
            }],
            "type": "pronunciation"
        }, {
                "id": 5,
            "alternatives": [{
                "confidence": "0.0",
                "content": "."
            }],
            "type": "punctuation"
        }],
        "entities": [{
            "content": "Bertrand",
            "category": "PHI*-Personal*",
            "startTime": 0.92,
            "endTime": 1.2,
            "confidence": 0.9989
        }],
        "audio_segments": [
            {
                "id": 0,
                "transcript": "The patient's name is Bertrand.",
                "start_time": "0.0",
                "end_time": "0.9989",
                "items": [
                    0,
                    1,
                    2,
                    3,
                    4,
                    5
                ]
            }
        ]
    },
    "status": "COMPLETED"
}
```

## AWS CLI
<a name="batch-med-conversation-cli"></a>

**Para transcribir un archivo de audio e identificar su PHI mediante un trabajo de transcripción por lotes (AWS CLI)**
+ Ejecute el siguiente código.

  ```
  aws transcribe start-medical-transcription-job \
  --medical-transcription-job-name {{my-medical-transcription-job-name}}\
  --language-code en-US \
  --media MediaFileUri="s3://{{amzn-s3-demo-bucket}}/{{my-input-files}}/{{my-audio-file}}.{{flac}}" \
  --output-bucket-name {{amzn-s3-demo-bucket}} \
  --specialty PRIMARYCARE \
  --type {{type}} \ # Choose CONVERSATION to transcribe a medical conversation. Choose DICTATION to transcribe a medical dictation.
  --content-identification-type PHI
  ```