Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Opciones de análisis para su fuente de datos
El análisis se refiere a la comprensión y extracción del contenido de los datos sin procesar. Amazon Bedrock Knowledge Bases ofrece las siguientes opciones para analizar la fuente de datos durante la ingesta:
-
Analizador predeterminado de Amazon Bedrock: solo analiza el texto de los archivos de texto, incluidos los archivos.txt, .md, .html, .doc/.docx, .xls/.xlsx y.pdf. Este analizador no conlleva ningún cargo por uso.
nota
Como el analizador predeterminado solo genera texto, recomendamos utilizar Amazon Bedrock Data Automation o un modelo básico como analizador en lugar del analizador predeterminado si sus documentos incluyen figuras, gráficos, tablas o imágenes. Amazon Bedrock Data Automation y los modelos básicos pueden extraer estos elementos de sus documentos y devolverlos como salida.
-
Amazon Bedrock Knowledge Bases ofrece los siguientes analizadores para analizar datos multimodales, incluidas figuras, gráficos y tablas en archivos.pdf, además de archivos de imagen.jpeg y.png. Estos analizadores también pueden extraer estas figuras, gráficos, tablas e imágenes y almacenarlas como archivos en un destino S3 que especifique durante la creación de la base de conocimientos. Durante la recuperación de la base de conocimientos, estos archivos se pueden devolver en la respuesta o en la atribución de la fuente.
-
Amazon Bedrock Data Automation: un servicio totalmente gestionado que procesa datos multimodales de forma eficaz, sin necesidad de proporcionar ningún aviso adicional. El coste de este analizador depende del número de páginas del documento o del número de imágenes que se van a procesar. Para obtener más información sobre este servicio, consulte Amazon Bedrock Data Automation.
-
Modelos básicos: procesa datos multimodales mediante un modelo básico. Este analizador ofrece la opción de personalizar la solicitud predeterminada que se utiliza para la extracción de datos. El coste de este analizador depende del número de señales de entrada y salida procesadas por el modelo básico. Para obtener una lista de los modelos que admiten el análisis de los datos de las bases de conocimiento de Amazon Bedrock, consulte. Modelos y regiones compatibles para el análisis
-
importante
Si elige Amazon Bedrock Data Automation o Foundation Models como analizador, el método que elija se utilizará para analizar todos los archivos.pdf de la fuente de datos, incluso si los archivos.pdf contienen solo texto. El analizador predeterminado no se utilizará para analizar estos archivos.pdf. Su cuenta incurre en cargos por el uso de Amazon Bedrock Data Automation o el modelo básico al analizar estos archivos.
Al seleccionar cómo analizar sus datos, tenga en cuenta lo siguiente:
-
Tanto si sus datos son exclusivamente textuales como si contienen datos multimodales, como imágenes, gráficos y tablas, que desee que la base de conocimientos pueda consultar.
-
Si desea tener la opción de personalizar la solicitud que se utiliza para indicar al modelo cómo analizar los datos.
-
El costo del analizador. Amazon Bedrock Data Automation utiliza precios por página, mientras que los analizadores de modelos básicos cobran en función de los tokens de entrada y salida. Para obtener más información, consulte Precios de Amazon Bedrock
.
Para obtener información sobre cómo configurar el modo en que se analiza su base de conocimientos, consulte la configuración de conexión de su fuente de datos en. Conecta una fuente de datos a tu base de conocimientos