Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Conexión de una base de conocimiento a un origen de datos personalizado
<a name="custom-data-source-connector"></a>

En lugar de elegir un servicio de origen de datos compatible, puede conectarse a un origen de datos personalizado para disfrutar de las siguientes ventajas:
+ Flexibilidad y control sobre los tipos de datos a los que desea que tenga acceso su base de conocimiento
+ La capacidad de utilizar las operaciones de la API `KnowledgeBaseDocuments` para ingerir o eliminar documentos directamente sin necesidad de sincronizar los cambios
+ La capacidad de ver los documentos de su origen de datos directamente a través de la consola o la API de Amazon Bedrock
+ La posibilidad de cargar documentos en la fuente de datos directamente en la fuente de datos Consola de administración de AWS o agregarlos en línea.
+ La capacidad de añadir metadatos directamente a cada documento para añadir o actualizar un documento en el origen de datos Para obtener más información sobre cómo utilizar los metadatos para filtrar al recuperar información de un origen de datos, consulte la pestaña **Metadatos y filtrado** en [Configuración y personalización de las consultas y la generación de respuestas](kb-test-config.md).

**Soporte de contenido multimodal**  
Las fuentes de datos personalizadas admiten contenido multimodal, incluidos archivos de imágenes, audio y vídeo de hasta 10 MB codificados en base64. Para obtener una guía completa sobre cómo trabajar con contenido multimodal, consulte. [Cree una base de conocimientos para contenido multimodal](kb-multimodal.md)

Para conectar una base de conocimientos a una fuente de datos personalizada, envíe una [CreateDataSource](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateDataSource.html)solicitud a un punto límite de tiempo de [compilación de Agents for Amazon Bedrock](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-bt). Especifique el `knowledgeBaseId` de la base de conocimiento a la que desea conectarse, asigne un `name` al origen de datos y especifique el campo `type` en `dataSourceConfiguration` como `CUSTOM`. A continuación, se muestra un ejemplo mínimo para crear este origen de datos:

```
PUT /knowledgebases/KB12345678/datasources/ HTTP/1.1
Content-type: application/json

{
    "name": "MyCustomDataSource",
    "dataSourceConfiguration": {
        "type": "CUSTOM"
    }
}
```

Puede incluir cualquiera de los siguientes campos opcionales para configurar el origen de datos:


****  

| Campo | Caso de uso | 
| --- | --- | 
| description | Proporcionar una descripción del origen de datos. | 
| clientToken | Para garantizar que la solicitud de la API se complete solo una vez. Para obtener más información, consulte [Ensuring idempotency](https://docs.aws.amazon.com/ec2/latest/devguide/ec2-api-idempotency.html). | 
| serverSideEncryptionConfiguración | Especificar una clave de KMS personalizada para el almacenamiento de datos transitorios y, al mismo tiempo, convertir los datos en incrustaciones. Para obtener más información, consulte [Cifrado del almacenamiento de datos transitorios durante la ingesta de datos](encryption-kb.md#encryption-kb-ingestion) | 
| dataDeletionPolicy | Configurar lo que se debe hacer con las incrustaciones vectoriales del origen de datos en el almacén de vectores si se elimina el origen de datos. Especifique RETAIN si desea conservar los datos en el almacén de vectores o la opción predeterminada DELETE para eliminarlos. | 
| vectorIngestionConfiguration | Configurar las opciones de ingesta del origen de datos. Para obtener más información, consulte las secciones siguientes. | 

El `vectorIngestionConfiguration` campo se asigna a un [VectorIngestionConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_VectorIngestionConfiguration.html)objeto que contiene los siguientes campos:
+ chunkingConfiguration: para configurar la estrategia que se utilizará para fragmentar los documentos del origen de datos. Para obtener más información sobre las estrategias de fragmentación, consulte [Funcionamiento de la fragmentación de contenido para las bases de conocimiento](kb-chunking.md).
+ parsingConfiguration: para configurar la estrategia que se utilizará para analizar el origen de datos. Para obtener más información sobre las opciones de análisis, consulte [Opciones de análisis del origen de datos](kb-advanced-parsing.md).
+ customTransformationConfiguration — Para personalizar la forma en que se transforman los datos y aplicar una función Lambda para una mayor personalización. Para obtener más información acerca de cómo personalizar la fragmentación de datos y el procesamiento de los metadatos con una función de Lambda, consulte [Uso de una función de Lambda de transformación personalizada para definir cómo se ingieren los datos](kb-custom-transformation.md).

Tras configurar el origen de datos personalizado, puede añadirle documentos e ingerirlos directamente en la base de conocimiento. A diferencia de otros orígenes de datos, no es necesario sincronizar un origen de datos personalizado. Para obtener información sobre cómo ingerir documentos directamente, consulte [Ingesta de cambios directamente en una base de conocimiento](kb-direct-ingestion.md).