Adición de documentos en idiomas distintos del inglés - Amazon Kendra

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Adición de documentos en idiomas distintos del inglés

Puede indexar documentos en varios idiomas. Si no especificas un idioma, Amazon Kendra indexa los documentos en inglés de forma predeterminada. El código de idioma de un documento se incluye en los metadatos del documento como un campo. Consulte Asignaciones de campos y Atributos personalizados para obtener más información sobre el campo _language_code de un documento.

Cuando llame CreateDataSource, puede especificar el código de idioma de todos los documentos de la fuente de datos. Si un documento no contiene un código de idioma especificado en un campo de metadatos, el documento se indexa utilizando el código de idioma especificado para todos los documentos en el nivel de origen de datos. En la consola, solo puede indexar documentos en un idioma compatible en el nivel del origen de datos. Vaya a Orígenes de datos, luego a la página Especificar detalles del origen de datos y elija un idioma en el menú desplegable Idioma.

También puede buscar o consultar documentos en un idioma compatible. Para obtener más información, consulte Buscar en idiomas.

Se admiten los siguientes idiomas y sus códigos (el inglés o en se admite de forma predeterminada si no especifica un idioma). En esta tabla se incluyen los idiomas que Amazon Kendra es compatible con la búsqueda semántica completa, así como con los idiomas que solo admiten la coincidencia simple de palabras clave. Los idiomas que admiten la búsqueda semántica completa se marcan con un asterisco y aparecen en negrita en la tabla siguiente. La búsqueda semántica completa también admite el inglés (idioma predeterminado).

nota

Consultas de búsqueda avanzada que utilizan palabras clave de búsqueda, como el japonés AND y OR no son compatibles con este idioma.

Nombre del idioma Código de idioma
Árabe ar
Armenio hy
Euskera eu
Bengalí bn
Búlgaro bg
Catalán ca
Chino: simplificado y tradicional* zh
Checo cs
Danés da
Neerlandés nl
Finés fi
Francés: incluye francés (Canadá)* fr
Gallego gl
Alemán* de
Griego el
Hindi hi
Húngaro hu
Indonesio id
Irlandés ga
Italiano it
Japonés* ja
Coreano* ko
Letón lv
Lituano lt
Noruego no
Persa fa
Portugués pt
Portugués (Brasil)* pt-BR
Rumano ro
Ruso ru
Sorani ckb
Español: incluye español (México)* es
Sueco sv
Turco tr

*Se admite la búsqueda semántica en este idioma.

Para los idiomas que admiten la búsqueda semántica, se admiten las siguientes características.

  • La relevancia del documento va más allá de la simple coincidencia de palabras clave.

  • FAQsmás allá de la simple coincidencia de palabras clave.

  • Extraer respuestas de documentos en función de Amazon Kendra es la comprensión lectora.

  • Buckets de confianza (muy alta, alta, media y baja) de los resultados de búsqueda.

En el caso de los idiomas que no admiten la búsqueda semántica, se admite la búsqueda simple de palabras clave para determinar la relevancia del documento y. FAQs

Los sinónimos (incluidos los sinónimos personalizados), el aprendizaje gradual y los comentarios y las sugerencias de consultas solo se admiten en inglés (idioma predeterminado).