本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
添加非英语语言的文档
您可以为多种语言的文档编制索引。如果未指定语言,则在默认情况下, Amazon Kendra 会使用英语为文档编制索引。您可以将文档的语言代码作为字段包含在文档元数据中。有关文档的 字段的更多信息,请参阅_language_code
字段映射和自定义属性。
在调用时,您可以为数据源中的所有文档指定语言代码CreateDataSource。如果文档没有在元数据字段中指定语言代码,则使用为数据来源级别的所有文档指定的语言代码为该文档编制索引。在控制台中,您只能在数据来源级别使用支持的语言对文档进行索引。转到数据来源,然后进入指定数据来源详细信息页面,然后从语言下拉列表中选择一种语言。
您也可以用支持的语言搜索或查询文档。有关更多信息,请参阅搜索语言。
支持以下语言及其代码(如果不指定语言,则默认支持英语或 en
)。此表包括 Amazon Kendra 支持完整语义搜索的语言,以及仅支持简单关键字匹配的语言。在下表中,支持完全语义搜索的语言用星号标记,并以粗体文本显示。完全语义搜索还支持英语(默认语言)。
语言名称 | 语言代码 |
---|---|
阿拉伯语 | ar |
亚美尼亚语 | hy |
巴斯克语 | eu |
孟加拉语 | bn |
保加利亚语 | bg |
加泰罗尼亚语 | ca |
中文 - 简体和繁体* | zh |
捷克语 | cs |
丹麦语 | da |
荷兰语 | nl |
芬兰语 | fi |
法语 - 包括法语(加拿大)* | fr |
加利西亚语 | gl |
德语* | de |
希腊语 | el |
印地语 | hi |
匈牙利语 | hu |
印度尼西亚语 | id |
爱尔兰语 | ga |
意大利语 | it |
日语* | ja |
韩语* | ko |
拉脱维亚语 | lv |
立陶宛语 | lt |
挪威语 | no |
波斯语 | fa |
葡萄牙语 | pt |
葡萄牙语(巴西)* | pt-BR |
罗马尼亚语 | ro |
俄语 | ru |
中库尔德语 | ckb |
西班牙语 - 包括西班牙语(墨西哥)* | es |
瑞典语 | sv |
土耳其语 | tr |
*该语言支持语义搜索。
对于支持语义搜索的语言,支持以下功能。
-
文档相关性不仅仅是简单的关键字匹配。
-
FAQs 不仅仅是简单的关键字匹配。
-
根据阅读理解从文档中提取答案。 Amazon Kendra
-
搜索结果的置信分段(非常高、高、中和低)。
对于不支持语义搜索的语言,支持简单的关键字匹配以提高文档相关性和 FAQs。
仅英语(默认语言)支持同义词(包括自定义同义词)、增量学习和反馈以及查询建议。