Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
La función Amazon Bedrock de automatización de datos (BDA) proporciona un flujo de trabajo de API simplificado para procesar sus datos. Para todas las modalidades, este flujo de trabajo consta de tres pasos principales: crear un proyecto, invocar el análisis y recuperar los resultados. Para recuperar una salida personalizada de los datos procesados, debe proporcionar el ARN del plan al invocar la operación de análisis.
Cree un proyecto de automatización de datos
Para empezar a procesar archivos con BDA, primero debe crear un proyecto de automatización de datos. Esto se puede hacer de dos formas, con la CreateDataAutomationProject operación o con la Amazon Amazon Bedrock Console.
Uso de la API
Cuando se utiliza la API para crear un proyecto, se invoca la CreateDataAutomationProject. Al crear un proyecto, debe definir sus ajustes de configuración para el tipo de archivo que tiende a procesar (la modalidad que pretende utilizar). A continuación, se muestra un ejemplo de cómo se puede configurar la salida estándar para las imágenes:
{
"standardOutputConfiguration": {
"image": {
"state": "ENABLED",
"extraction": {
"category": {
"state": "ENABLED",
"types": ["CONTENT_MODERATION", "TEXT_DETECTION"]
},
"boundingBox": {
"state": "ENABLED"
}
},
"generativeField": {
"state": "ENABLED",
"types": ["IMAGE_SUMMARY", "IAB"]
}
}
}
}
La API valida la configuración de entrada. Crea un nuevo proyecto con un ARN único. La configuración del proyecto se guarda para utilizarla en el futuro. Si se crea un proyecto sin parámetros, se aplicará la configuración predeterminada. Por ejemplo, al procesar imágenes, el resumen de imágenes y la detección de texto estarán habilitadas de forma predeterminada.
Hay un límite en la cantidad de proyectos que se pueden crear por AWS cuenta. Es posible que no se permitan determinadas combinaciones de ajustes o que requieran permisos adicionales.
Invoque Data Automation Async
Tiene un proyecto configurado, puede empezar a procesar imágenes mediante la operación. InvokeDataAutomationAsync Si utiliza una salida personalizada, solo puede enviar un único ARN de blueprint por solicitud.
Esta llamada a la API inicia el procesamiento asíncrono de los archivos en un bucket de S3 específico. La API acepta el ARN del proyecto y la ubicación de los archivos que se van a procesar y, a continuación, inicia el trabajo de procesamiento asíncrono. Se devuelve un identificador de trabajo para realizar un seguimiento del proceso. Se generarán errores si el proyecto no existe, si la persona que llama tiene los permisos necesarios o si los archivos de entrada no están en un formato compatible.
La siguiente es la estructura de la solicitud JSON:
{
"InputConfiguration" : { "s3Uri": "string"}, // required
"DataAutomationConfiguration" : {
"DataAutomationARN": "",
"stage": LIVE | DEV
}, // optional
"BlueprintArn": [], // optional
"OutputConfiguration" : {
"s3Uri": "string"
}, // required
"EncryptionConfiguration": { // optional
"KmsKeyId": "string",
"KmsEncryptionContext": { "key" : "string" },
},
"NotificationConfiguration": { // optional
"EventBridgeConfiguration": {"EventBridgeEnabled" : Boolean },
}
"ClientToken": "string",
"JobTags": { "string" : "string" }
}
Obtenga el estado de la automatización de datos
Para comprobar el estado de su trabajo de procesamiento y recuperar los resultados, utilice GetDataAutomationStatus.
La GetDataAutomationStatus API le permite supervisar el progreso de su trabajo y acceder a los resultados una vez finalizado el procesamiento. La API acepta el identificador de trabajo devuelto por InvokeDataAutomationAsync. Comprueba el estado actual del trabajo y devuelve la información relevante. Una vez finalizado el trabajo, proporciona la ubicación de los resultados en S3.
Si el trabajo aún está en curso, devuelve el estado actual (por ejemplo, «EN EJECUCIÓN», «EN COLA»). Si el trabajo está completo, devuelve «COMPLETADO» junto con la ubicación S3 de los resultados. Si se ha producido un error, devuelve «FALLIDO» con los detalles del error.
El siguiente es el formato de la solicitud JSON:
{
"InvocationArn": "string" // Arn
}
Respuesta de salida asíncrona
Los resultados del procesamiento de archivos se almacenan en el depósito S3 configurado para las imágenes de entrada. La salida incluye estructuras únicas que dependen tanto de la modalidad del archivo como de los tipos de operación especificados en la llamada a InvokeDataAutomationAsync.
Para obtener información sobre las salidas estándar para una modalidad determinada, consulte. Salida estándar en Bedrock Data Automation
Por ejemplo, en el caso de las imágenes, puede incluir información sobre lo siguiente:
Resumen de la imagen: resumen descriptivo o título de la imagen.
Clasificación de la IAB: categorización basada en la taxonomía de la IAB.
Detección de texto de imagen: texto extraído con información sobre el cuadro delimitador.
Moderación de contenido: detecta contenido inapropiado, no deseado u ofensivo en una imagen.
A continuación, se muestra un ejemplo de un fragmento del resultado para el procesamiento de imágenes:
{
"metadata": {
"id": "image_123",
"semantic_modality": "IMAGE",
"s3_bucket": "my-s3-bucket",
"s3_prefix": "images/",
"image_width_pixels": 1920,
"image_height_pixels": 1080
},
"image": {
"summary": "A lively party scene with colorful decorations and supplies",
"iab_categories": [
{
"category": "Party Supplies",
"confidence": 0.9,
"parent_name": "Events & Attractions"
}
],
"content_moderation": [
{
"category": "Drugs & Tobacco Paraphernalia & Use",
"confidence": 0.7
}
],
"text_words": [
{
"id": "word_1",
"text": "lively",
"confidence": 0.9,
"line_id": "line_1",
"locations": [
{
"bounding_box": {
"left": 100,
"top": 200,
"width": 50,
"height": 20
},
"polygon": [
{"x": 100, "y": 200},
{"x": 150, "y": 200},
{"x": 150, "y": 220},
{"x": 100, "y": 220}
]
}
]
}
],
}
}
Esta salida estructurada permite una fácil integración con las aplicaciones posteriores y un análisis posterior.