Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Pour stocker les intégrations vectorielles vers lesquelles vos documents sont convertis, vous utilisez un magasin vectoriel. Si vous préférez qu'Amazon Bedrock crée automatiquement un index vectoriel dans Amazon OpenSearch Serverless pour vous, ignorez cette condition préalable et passez à. Créez une base de connaissances en vous connectant à une source de données dans les bases de connaissances Amazon Bedrock
Si vous souhaitez stocker des intégrations vectorielles binaires au lieu des intégrations vectorielles à virgule flottante standard (float32), vous devez utiliser un magasin de vecteurs qui prend en charge les vecteurs binaires. Amazon OpenSearch Serverless est actuellement le seul magasin de vecteurs qui prend en charge le stockage de vecteurs binaires.
Vous pouvez configurer votre propre magasin de vecteurs pris en charge pour indexer la représentation vectorielle incorporée de vos données. Vous créez des champs pour les données suivantes :
-
Champ pour les vecteurs générés à partir du texte de votre source de données par le modèle d'intégration que vous avez choisi.
-
Champ pour les fragments de texte extraits des fichiers de votre source de données.
-
Champs pour les métadonnées des fichiers source gérés par Amazon Bedrock.
-
(Si vous utilisez une base de données Amazon Aurora et que vous souhaitez configurer le filtrage des métadonnées) Champs pour les métadonnées que vous associez à vos fichiers source. Si vous envisagez de configurer le filtrage dans d'autres magasins de vecteurs, il n'est pas nécessaire de configurer ces champs pour le filtrage.
Vous pouvez chiffrer des magasins de vecteurs tiers à l'aide d'une clé KMS. Pour plus d'informations, consultez la section Chiffrement des ressources de la base de connaissances.
Sélectionnez l'onglet correspondant au service de magasin vectoriel que vous utiliserez pour créer votre index vectoriel.
-
Pour configurer les autorisations et créer une collection de recherche vectorielle dans Amazon OpenSearch Serverless dans le AWS Management Console, suivez les étapes 1 et 2 de la section Utilisation des collections de recherche vectorielle dans le manuel Amazon OpenSearch Service Developer Guide. Tenez compte des considérations suivantes lors de la configuration de votre collection :
-
Donnez à la collection un nom et une description de votre choix.
-
Pour rendre votre collection privée, sélectionnez Création standard dans la section Sécurité. Ensuite, dans la section Paramètres d'accès au réseau, sélectionnez VPC comme type d'accès et choisissez un point de terminaison VPC. Pour plus d'informations sur la configuration d'un point de terminaison VPC pour une collection Amazon Serverless, consultez Access Amazon OpenSearch OpenSearch Serverless à l'aide d'un point de terminaison d'interface ()AWS PrivateLink dans le manuel Amazon OpenSearch Service Developer Guide.
-
-
Une fois la collection créée, prenez note de l'ARN de la collection lorsque vous créez la base de connaissances.
-
Dans le volet de navigation de gauche, sélectionnez Collections sous Serverless. Sélectionnez ensuite votre collection de recherche vectorielle.
-
Sélectionnez l'onglet Indexes. Choisissez ensuite Créer un index vectoriel.
-
Dans la section Détails de l'index vectoriel, entrez le nom de votre index dans le champ Nom de l'index vectoriel.
-
Dans la section Champs vectoriels, choisissez Ajouter un champ vectoriel. Amazon Bedrock stocke les intégrations vectorielles de votre source de données dans ce champ. Fournissez les configurations suivantes :
-
Nom du champ vectoriel — Donnez un nom au champ (par exemple,
embeddings
). -
Moteur — Le moteur vectoriel utilisé pour la recherche. Sélectionnez Faiss.
-
Dimensions : nombre de dimensions du vecteur. Reportez-vous au tableau suivant pour déterminer le nombre de dimensions que le vecteur doit contenir :
Modèle Dimensions Titan Intégrations G1 - Texte 1 536 Titan Embeddings V2 - Texte 1,024 Cohere Embed Anglais 1,024 Cohere Embed Multilingue 1,024 -
Métrique de distance : métrique utilisée pour mesurer la similarité entre les vecteurs. Nous vous recommandons d'utiliser Euclidean.
-
-
Développez la section Gestion des métadonnées et ajoutez deux champs pour configurer l'index vectoriel afin de stocker des métadonnées supplémentaires qu'une base de connaissances peut récupérer à l'aide de vecteurs. Le tableau suivant décrit les champs et les valeurs à spécifier pour chaque champ :
Description du champ Champ de mappage Type de données Filtrable Amazon Bedrock découpe le texte brut de vos données et stocke les fragments dans ce champ. Nom de votre choix (par exemple, text
)Chaîne True Amazon Bedrock stocke les métadonnées relatives à votre base de connaissances dans ce domaine. Nom de votre choix (par exemple, bedrock-metadata
)Chaîne False -
Prenez note des noms que vous choisissez pour le nom de l'index vectoriel, le nom du champ vectoriel et les noms des champs de mappage de gestion des métadonnées lorsque vous créez votre base de connaissances. Ensuite, choisissez Créer.
Une fois l'index vectoriel créé, vous pouvez créer votre base de connaissances. Le tableau suivant indique où vous allez entrer chaque information dont vous avez pris note.
Champ | Champ correspondant dans la configuration de la base de connaissances (console) | Champ correspondant dans la configuration de la base de connaissances (API) | Description |
---|---|---|---|
ARN de collecte | ARN de collecte | Collection Arn | Le nom de ressource Amazon (ARN) de la collection de recherche vectorielle. |
Nom de l'index vectoriel | Nom de l'index vectoriel | vectorIndexName | Nom de l'index vectoriel. |
Nom du champ vectoriel | Champ vectoriel | Champ vectoriel | Nom du champ dans lequel vous souhaitez stocker les intégrations vectorielles pour vos sources de données. |
Gestion des métadonnées (premier champ de mappage) | Champ de texte | Champ de texte | Nom du champ dans lequel vous souhaitez stocker le texte brut issu de vos sources de données. |
Gestion des métadonnées (deuxième champ de mappage) | Champ de métadonnées géré par Bedrock | Champ de métadonnées | Nom du champ dans lequel stocker les métadonnées gérées par Amazon Bedrock. |
Pour une documentation plus détaillée sur la configuration d'un magasin vectoriel dans Amazon OpenSearch Serverless, consultez la section Utilisation des collections de recherche vectorielle dans le manuel Amazon OpenSearch Service Developer Guide.