Ingérez les modifications directement dans une base de connaissances - Amazon Bedrock

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Ingérez les modifications directement dans une base de connaissances

Les bases de connaissances Amazon Bedrock vous permettent de modifier votre source de données et de synchroniser les modifications en une seule étape. Vous pouvez tirer parti de cette fonctionnalité si votre base de connaissances est connectée à l'un des types de sources de données suivants :

  • Amazon S3

  • Personnalisé

Grâce à l'ingestion directe, vous pouvez directement ajouter, mettre à jour ou supprimer des fichiers dans une base de connaissances en une seule action et votre base de connaissances peut accéder aux documents sans avoir besoin de les synchroniser. L'ingestion directe utilise les opérations de l'KnowledgeBaseDocumentsAPI pour indexer les documents que vous soumettez directement dans le magasin vectoriel configuré pour la base de connaissances. Vous pouvez également consulter les documents de votre base de connaissances directement à l'aide de ces opérations, sans avoir à accéder à la source de données connectée pour les consulter.

Différences par rapport à la synchronisation d'une source de données

Les bases de connaissances Amazon Bedrock proposent également un ensemble d'opérations d'IngestionJobAPI liées à la synchronisation de votre source de données. Lorsque vous synchronisez votre source de données avec une StartIngestionJobdemande, les bases de connaissances Amazon Bedrock scanne chaque document de la source de données connectée et vérifie s'il a déjà été indexé dans le magasin vectoriel configuré pour la base de connaissances. Si ce n'est pas le cas, il est indexé dans le magasin vectoriel.

Avec une IngestKnowledgeBaseDocumentsdemande, vous soumettez un ensemble de documents à indexer directement dans le magasin vectoriel. Vous sautez donc l'étape d'ajout de documents dans la source de données. Consultez les paragraphes suivants pour comprendre le cas d'utilisation de ces deux ensembles d'opérations d'API :

Si vous utilisez une source de données personnalisée

Vous n'avez pas besoin de synchroniser ou d'utiliser les IngestionJob opérations. Les documents que vous ajoutez, modifiez ou supprimez lors des KnowledgeBaseDocuments opérations ou dans le cadre des opérations AWS Management Console font partie à la fois de la source de données personnalisée et de votre base de connaissances.

Si vous utilisez une source de données Amazon S3

Vous utilisez les deux ensembles d'opérations dans différents cas d'utilisation :

  • Après avoir connecté la base de connaissances à la source de données S3 pour la première fois, vous devez synchroniser votre source de données dans le AWS Management Console ou en soumettant une StartIngestionJobdemande via l'API Amazon Bedrock.

  • Indexez les documents dans le magasin vectoriel configuré pour votre base de connaissances ou supprimez les documents indexés de la manière suivante :

    1. Ajoutez des documents dans votre emplacement S3 ou supprimez-en des documents. Synchronisez ensuite votre source de données dans l'API AWS Management Console ou soumettez une StartIngestionJob demande dans l'API. Pour plus de détails sur la synchronisation et son StartIngestionJob fonctionnement, consultezSynchronisez vos données avec votre base de connaissances Amazon Bedrock.

    2. Ingérez des documents S3 dans la base de connaissances directement avec une IngestKnowledgeBaseDocuments demande. Pour plus de détails sur l'ingestion directe de documents, consultezIngérez des documents directement dans une base de connaissances.

      Avertissement

      Pour les sources de données S3, les modifications que vous indexez dans la base de connaissances directement dans AWS Management Console ou avec les opérations d'KnowledgeBaseDocumentsAPI ne sont pas reflétées dans l'emplacement S3. Vous pouvez utiliser ces opérations d'API pour rendre les modifications apportées à votre base de connaissances immédiatement disponibles en une seule étape. Cependant, vous devez effectuer les mêmes modifications dans votre emplacement S3 afin qu'elles ne soient pas remplacées la prochaine fois que vous synchroniserez votre source de données dans AWS Management Console ou avecStartIngestionJob.

      Ne soumettez pas IngestKnowledgeBaseDocuments de StartIngestionJob demande et en même temps.

Sélectionnez une rubrique pour savoir comment procéder à l'ingestion directe des documents contenus dans vos sources de données :