Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Al crear un volante, Amazon Comprehend crea un lago de datos en su cuenta para almacenar todos los datos que el volante necesita, como los datos de entrada y de salida para cada versión del modelo.
Amazon Comprehend crea el lago de datos en la ubicación de Amazon S3 que usted especifica al crear el volante. Puede especificar la ubicación como bucket de Amazon S3 o como carpeta nueva de bucket de Amazon S3.
Estructura de carpetas de los lagos de datos
Cuando Amazon Comprehend crea el lago de datos, configura la siguiente estructura de carpetas en la ubicación de Amazon S3.
aviso
Amazon Comprehend administra la organización y el contenido de las carpetas del lago de datos. Utilice siempre las operaciones de la API de Amazon Comprehend para modificar las carpetas del lago de datos; de lo contrario, es posible que el volante no funcione correctamente.
Document Pool Annotations Pool Staging Model Datasets (data for each version of the model) VersionID-1 Training Test ModelStats VersionID-2 Training Test ModelStats
Para ver la evaluación del entrenamiento de una versión del modelo, lleve a cabo estos pasos:
Abra la carpeta denominada Conjunto de datos del modelo en el nivel raíz del lago de datos. Esta carpeta contiene una subcarpeta para cada versión del modelo.
Abra la carpeta de la versión del modelo que le interese.
Abra la carpeta denominada ModelStatspara ver las estadísticas del modelo.
Gestión de lagos de datos
Amazon Comprehend realiza en su nombre las siguientes tareas de administración del lago de datos:
Define la estructura de carpetas del lago de datos e incorpora los conjuntos de datos en las carpetas correspondientes.
-
Administra los documentos de entrada (como archivos de texto y archivos de anotaciones) necesarios para entrenar el modelo.
-
Administra los datos de salida de entrenamiento y evaluación asociados a cada versión del modelo.
Administra el cifrado de los archivos almacenados en el lago de datos.
Amazon Comprehend realiza todas las operaciones de creación y actualización de datos del lago de datos. Usted conserva el acceso total a los datos del lago de datos. Por ejemplo:
Tiene acceso completo al contenido del lago de datos.
El lago de datos permanece disponible después de eliminar el volante.
Puede configurar registros de acceso para el bucket de Amazon S3 que contiene el lago de datos.
Puede proporcionar claves de cifrado para los datos. Puede especificarlos al crear un volante.
Recomendamos que siga las siguientes prácticas recomendadas:
-
No añada manualmente sus propias carpetas o archivos al lago de datos. No modifique ni elimine ningún archivo del lago de datos.
Utilice siempre las operaciones de creación y actualización de Amazon Comprehend para añadir o modificar datos en el lago de datos. Por ejemplo, utilice
CreateDataset
para proporcionar datos de entrenamiento o pruebas yStartFlywheelIteration
para generar datos de evaluación para las versiones del modelo.-
La estructura del lago de datos puede evolucionar con el tiempo. No cree scripts o programas posteriores que se basen explícitamente en la estructura del lago de datos.
-
Al proporcionar una ubicación de lago de datos para el volante, le recomendamos crear un prefijo común para los datos relacionados con todos los volantes o utilizar un prefijo diferente para cada volante. No recomendamos utilizar la ruta completa del lago de datos de un volante como prefijo de otro volante.