Seleccione sus preferencias de cookies

Usamos cookies esenciales y herramientas similares que son necesarias para proporcionar nuestro sitio y nuestros servicios. Usamos cookies de rendimiento para recopilar estadísticas anónimas para que podamos entender cómo los clientes usan nuestro sitio y hacer mejoras. Las cookies esenciales no se pueden desactivar, pero puede hacer clic en “Personalizar” o “Rechazar” para rechazar las cookies de rendimiento.

Si está de acuerdo, AWS y los terceros aprobados también utilizarán cookies para proporcionar características útiles del sitio, recordar sus preferencias y mostrar contenido relevante, incluida publicidad relevante. Para aceptar o rechazar todas las cookies no esenciales, haga clic en “Aceptar” o “Rechazar”. Para elegir opciones más detalladas, haga clic en “Personalizar”.

Lagos de datos de volantes

Modo de enfoque
Lagos de datos de volantes - Amazon Comprehend

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Al crear un volante, Amazon Comprehend crea un lago de datos en su cuenta para almacenar todos los datos que el volante necesita, como los datos de entrada y de salida para cada versión del modelo.

Amazon Comprehend crea el lago de datos en la ubicación de Amazon S3 que usted especifica al crear el volante. Puede especificar la ubicación como bucket de Amazon S3 o como carpeta nueva de bucket de Amazon S3.

Estructura de carpetas de los lagos de datos

Cuando Amazon Comprehend crea el lago de datos, configura la siguiente estructura de carpetas en la ubicación de Amazon S3.

aviso

Amazon Comprehend administra la organización y el contenido de las carpetas del lago de datos. Utilice siempre las operaciones de la API de Amazon Comprehend para modificar las carpetas del lago de datos; de lo contrario, es posible que el volante no funcione correctamente.

Document Pool Annotations Pool Staging Model Datasets (data for each version of the model) VersionID-1 Training Test ModelStats VersionID-2 Training Test ModelStats

Para ver la evaluación del entrenamiento de una versión del modelo, lleve a cabo estos pasos:

  1. Abra la carpeta denominada Conjunto de datos del modelo en el nivel raíz del lago de datos. Esta carpeta contiene una subcarpeta para cada versión del modelo.

  2. Abra la carpeta de la versión del modelo que le interese.

  3. Abra la carpeta denominada ModelStatspara ver las estadísticas del modelo.

Gestión de lagos de datos

Amazon Comprehend realiza en su nombre las siguientes tareas de administración del lago de datos:

  • Define la estructura de carpetas del lago de datos e incorpora los conjuntos de datos en las carpetas correspondientes.

  • Administra los documentos de entrada (como archivos de texto y archivos de anotaciones) necesarios para entrenar el modelo.

  • Administra los datos de salida de entrenamiento y evaluación asociados a cada versión del modelo.

  • Administra el cifrado de los archivos almacenados en el lago de datos.

Amazon Comprehend realiza todas las operaciones de creación y actualización de datos del lago de datos. Usted conserva el acceso total a los datos del lago de datos. Por ejemplo:

  • Tiene acceso completo al contenido del lago de datos.

  • El lago de datos permanece disponible después de eliminar el volante.

  • Puede configurar registros de acceso para el bucket de Amazon S3 que contiene el lago de datos.

  • Puede proporcionar claves de cifrado para los datos. Puede especificarlos al crear un volante.

Recomendamos que siga las siguientes prácticas recomendadas:

  • No añada manualmente sus propias carpetas o archivos al lago de datos. No modifique ni elimine ningún archivo del lago de datos.

  • Utilice siempre las operaciones de creación y actualización de Amazon Comprehend para añadir o modificar datos en el lago de datos. Por ejemplo, utilice CreateDataset para proporcionar datos de entrenamiento o pruebas y StartFlywheelIteration para generar datos de evaluación para las versiones del modelo.

  • La estructura del lago de datos puede evolucionar con el tiempo. No cree scripts o programas posteriores que se basen explícitamente en la estructura del lago de datos.

  • Al proporcionar una ubicación de lago de datos para el volante, le recomendamos crear un prefijo común para los datos relacionados con todos los volantes o utilizar un prefijo diferente para cada volante. No recomendamos utilizar la ruta completa del lago de datos de un volante como prefijo de otro volante.

PrivacidadTérminos del sitioPreferencias de cookies
© 2025, Amazon Web Services, Inc o sus afiliados. Todos los derechos reservados.