Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
L'analyse syntaxique fait référence à la compréhension et à l'extraction du contenu à partir de données brutes. Les bases de connaissances Amazon Bedrock proposent les options suivantes pour analyser votre source de données lors de l'ingestion :
-
Analyseur par défaut Amazon Bedrock : analyse uniquement le texte des fichiers texte, y compris les fichiers .txt, .md, .html, .doc/.docx, .xls/.xlsx et .pdf. Cet analyseur n'entraîne aucun frais d'utilisation.
Note
Étant donné que l'analyseur par défaut ne produit que du texte, nous vous recommandons d'utiliser Amazon Bedrock Data Automation ou un modèle de base comme analyseur plutôt que l'analyseur par défaut si vos documents incluent des figures, des graphiques, des tableaux ou des images. Amazon Bedrock Data Automation et les modèles de base peuvent extraire ces éléments de vos documents et les renvoyer en sortie.
-
Les bases de connaissances Amazon Bedrock proposent les analyseurs suivants pour analyser des données multimodales, notamment des figures, des graphiques et des tableaux dans des fichiers .pdf, en plus des fichiers image .jpeg et .png. Ces analyseurs peuvent également extraire ces figures, graphiques, tableaux et images et les stocker sous forme de fichiers dans une destination S3 que vous spécifiez lors de la création de la base de connaissances. Lors de la récupération de la base de connaissances, ces fichiers peuvent être renvoyés dans la réponse ou dans l'attribution de la source.
-
Amazon Bedrock Data Automation : un service entièrement géré qui traite efficacement les données multimodales, sans qu'il soit nécessaire de fournir des instructions supplémentaires. Le coût de cet analyseur dépend du nombre de pages du document ou du nombre d'images à traiter. Pour plus d'informations sur ce service, consultez Amazon Bedrock Data Automation.
-
Modèles de base — Traite les données multimodales à l'aide d'un modèle de base. Cet analyseur vous permet de personnaliser l'invite par défaut utilisée pour l'extraction des données. Le coût de cet analyseur dépend du nombre de jetons d'entrée et de sortie traités par le modèle de base. Pour obtenir la liste des modèles prenant en charge l'analyse des données des bases de connaissances Amazon Bedrock, consultez. Modèles et régions pris en charge pour l'analyse
-
Important
Si vous choisissez Amazon Bedrock Data Automation ou Foundation Models comme analyseur, la méthode choisie sera utilisée pour analyser tous les fichiers .pdf de votre source de données, même si les fichiers .pdf contiennent uniquement du texte. L'analyseur par défaut ne sera pas utilisé pour analyser ces fichiers .pdf. Votre compte est facturé pour l'utilisation d'Amazon Bedrock Data Automation ou du modèle de base pour l'analyse de ces fichiers.
Lorsque vous choisissez le mode d'analyse de vos données, tenez compte des points suivants :
-
Que vos données soient purement textuelles ou qu'elles contiennent des données multimodales, telles que des images, des graphiques et des diagrammes, que vous souhaitez que la base de connaissances puisse interroger.
-
Si vous souhaitez avoir la possibilité de personnaliser l'invite utilisée pour indiquer au modèle comment analyser vos données.
-
Le coût de l'analyseur. Amazon Bedrock Data Automation utilise une tarification par page, tandis que les analyseurs du modèle de base facturent en fonction des jetons d'entrée et de sortie. Pour plus d’informations, consultez Tarification d’Amazon Bedrock
.
Pour savoir comment configurer le mode d'analyse de votre base de connaissances, consultez la configuration de connexion de votre source de données dansConnect une source de données à votre base de connaissances.