Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Options d'analyse pour votre source de données
L'analyse syntaxique fait référence à l'interprétation des documents et de leurs composants significatifs. Les bases de connaissances Amazon Bedrock proposent les options suivantes pour analyser votre source de données lors de l'ingestion :
-
Analyseur par défaut d'Amazon Bedrock : analyse uniquement le texte de vos documents. Cet analyseur n'entraîne aucun frais d'utilisation.
-
Amazon Bedrock Data Automation (version préliminaire) : un service entièrement géré qui traite efficacement les données multimodales, y compris le texte et les images, sans qu'il soit nécessaire de fournir des instructions supplémentaires. Pour plus d'informations sur ce service, consultez Amazon Bedrock Data Automation.
-
Modèles de base : traite les données multimodales, y compris le texte et les images, à l'aide d'un modèle de base ou d'un profil d'inférence. Cet analyseur vous permet de personnaliser l'invite utilisée pour l'extraction des données. Le coût de cet analyseur dépend du nombre de jetons traités par le modèle de base. Pour obtenir la liste des modèles qui prennent en charge l'analyse des données des bases de connaissances Amazon Bedrock, consultez. Modèles et régions pris en charge pour l'analyse
Note
Si vous choisissez un modèle de base ou Amazon Bedrock Data Automation pour l'analyse et qu'il ne parvient pas à analyser un fichier, l'analyseur par défaut d'Amazon Bedrock est utilisé à la place.
Le tableau suivant récapitule la prise en charge des types de fichiers pour chaque type d'analyseur syntaxique :
Types de fichiers | Extension | Analyseur par défaut | Automatisation des données Amazon Bedrock | Modèle de fondation |
---|---|---|---|---|
Texte brut (ASCIIuniquement) | .txt | Oui | Oui | Oui |
Markdown | .md | Oui | Oui | Oui |
HyperText Langage de balisage | .html | Oui | Oui | Oui |
Documents Microsoft Word | .doc/.docx | Oui | Oui | Oui |
Valeurs séparées par des virgules | .csv | Oui | Oui | Oui |
Feuille de calcul Microsoft Excel | .xls/.xlsx | Oui | Oui | Oui |
Format de document portable (PDF) | Oui | Oui | Oui | |
Images —JPEG/PNGformat | .jpeg, .png | Non | Oui | Oui |
Lorsque vous choisissez le mode d'analyse de vos données, tenez compte des points suivants :
-
Que vos données soient purement textuelles ou qu'elles contiennent des données multimodales, telles que des images, des graphiques et des diagrammes, que vous souhaitez que la base de connaissances puisse interroger.
-
Si vous souhaitez avoir la possibilité de personnaliser l'invite utilisée pour indiquer au modèle comment analyser vos données.
-
Le coût de l'analyseur. Pour plus d’informations, consultez Tarification d’Amazon Bedrock
.
Il existe des limites quant aux types de fichiers et au nombre total de données pouvant être analysés à l'aide d'une analyse avancée. Pour plus d'informations sur les types de fichiers pour l'analyse avancée, consultezFormats de document pris en charge et limites pour les données de la base de connaissances. Pour plus d'informations sur le total des données pouvant être analysées à l'aide d'une analyse avancée, consultez la section Points de terminaison et quotas Amazon Bedrock dans le. Références générales AWS
Pour savoir comment configurer le mode d'analyse de votre base de connaissances, consultez la configuration de connexion pour une source de données prise en charge dansConnect une source de données à votre base de connaissances.