Ajouter des documents dans des langues autres que l'anglais - Amazon Kendra

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Ajouter des documents dans des langues autres que l'anglais

Vous pouvez indexer des documents dans plusieurs langues. Si vous ne spécifiez aucune langue, Amazon Kendra indexe les documents en anglais par défaut. Vous incluez le code de langue d'un document dans les métadonnées du document sous forme de champ. Voir Mappages de champs et Attributs personnalisés pour plus d'informations sur le _language_code champ d'un document.

Vous pouvez spécifier le code de langue pour tous les documents de votre source de données lorsque vous appelez CreateDataSource. Si aucun code de langue n'est spécifié dans un champ de métadonnées, le document est indexé à l'aide du code de langue spécifié pour tous les documents au niveau de la source de données. Dans la console, vous pouvez indexer des documents dans une langue prise en charge uniquement au niveau de la source de données. Accédez à Sources de données, puis à la page Spécifier les détails de la source de données, puis choisissez une langue dans la liste déroulante Langue.

Vous pouvez également rechercher ou interroger des documents dans une langue prise en charge. Pour plus d'informations, consultez la section Recherche dans les langues.

Les langues suivantes et leurs codes sont pris en charge (anglais ou en pris en charge par défaut si vous ne spécifiez aucune langue). Ce tableau inclut les langues qui prennent Amazon Kendra en charge la recherche sémantique complète, ainsi que les langues qui ne prennent en charge que la correspondance de mots clés simples. Les langues qui prennent en charge la recherche sémantique complète sont signalées par un astérisque et le texte en gras apparaît dans le tableau suivant. L'anglais (langue par défaut) est également pris en charge avec la recherche sémantique complète.

Nom de langue Code de langue
Arabe ar
Arménien hy
Basque eu
Bengali bn
Bulgare bg
Catalan ca
Chinois : simplifié et traditionnel* zh
Tchèque cs
Danois da
Néerlandais nl
Finnois fi
Français — y compris le français (Canada) * fr
Galicien gl
Allemand* de
Grec el
Hindi hi
Hongrois hu
Indonésien id
Irlandais ga
Italien it
Japonais* ja
Coréen* ko
Letton lv
Lituanien lt
Norvégien no
Persan fa
Portugais pt
Portugais (Brésil) * pt-BR
Roumain ro
Russe ru
Sorani ckb
Espagnol — inclut l'espagnol (Mexique) * es
Suédois sv
Turc tr

*La recherche sémantique est prise en charge pour la langue.

Pour les langues qui prennent en charge la recherche sémantique, les fonctionnalités suivantes sont prises en charge.

  • La pertinence du document va au-delà de la simple correspondance de mots clés.

  • FAQs au-delà de la simple correspondance de mots clés.

  • Extraire des réponses à partir de documents en fonction Amazon Kendra de sa compréhension écrite.

  • Tranches de confiance (très élevée, élevée, moyenne et faible) des résultats de recherche.

Pour les langues qui ne prennent pas en charge la recherche sémantique, la simple correspondance de mots clés est prise en charge pour la pertinence du document et FAQs.

Les synonymes (y compris les synonymes personnalisés), l'apprentissage progressif et les commentaires, ainsi que les suggestions de requêtes ne sont pris en charge qu'en anglais (langue par défaut).