选择您的 Cookie 首选项

我们使用必要 Cookie 和类似工具提供我们的网站和服务。我们使用性能 Cookie 收集匿名统计数据,以便我们可以了解客户如何使用我们的网站并进行改进。必要 Cookie 无法停用,但您可以单击“自定义”或“拒绝”来拒绝性能 Cookie。

如果您同意,AWS 和经批准的第三方还将使用 Cookie 提供有用的网站功能、记住您的首选项并显示相关内容,包括相关广告。要接受或拒绝所有非必要 Cookie,请单击“接受”或“拒绝”。要做出更详细的选择,请单击“自定义”。

创建 Amazon S3 数据源 - Amazon Kendra

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

创建 Amazon S3 数据源

以下示例演示如何创建 Amazon S3 数据源。这些示例假设您已经创建了一个索引和一个有权从索引中读取数据的 IAM 角色。有关该 IAM 角色的更多信息,请参阅IAM 访问角色。有关创建索引的更多信息,请参阅创建索引

CLI
aws kendra create-data-source \ --index-id index ID \ --name example-data-source \ --type S3 \ --configuration '{"S3Configuration":{"BucketName":"bucket name"}}' --role-arn 'arn:aws:iam::account id:role:/role name
Python

以下 Python 代码片段创建了一个 Amazon S3 数据源。有关完整示例,请参阅入门 (适用于 Python (Boto3) 的 AWS SDK)

print("Create an Amazon S3 data source.") # Provide a name for the data source name = "getting-started-data-source" # Provide an optional description for the data source description = "Getting started data source." # Provide the IAM role ARN required for data sources role_arn = "arn:aws:iam::${accountID}:role/${roleName}" # Provide the data soource connection information s3_bucket_name = "S3-bucket-name" type = "S3" # Configure the data source configuration = {"S3DataSourceConfiguration": { "BucketName": s3_bucket_name } } data_source_response = kendra.create_data_source( Configuration = configuration, Name = name, Description = description, RoleArn = role_arn, Type = type, IndexId = index_id )
aws kendra create-data-source \ --index-id index ID \ --name example-data-source \ --type S3 \ --configuration '{"S3Configuration":{"BucketName":"bucket name"}}' --role-arn 'arn:aws:iam::account id:role:/role name

创建数据来源可能需要一些时间。您可以使用 DescribeDataSourceAPI 监控进度。当数据来源状态为 ACTIVE 时,数据来源就已准备就绪。

以下示例演示如何获取数据来源的状态。

CLI
aws kendra describe-data-source \ --index-id index ID \ --id data source ID
Python

以下 Python 代码片段用于获取有关 S3 数据来源的信息。有关完整示例,请参阅入门 (适用于 Python (Boto3) 的 AWS SDK)

print("Wait for Amazon Kendra to create the data source.") while True: data_source_description = kendra.describe_data_source( Id = "data-source-id", IndexId = "index-id" ) status = data_source_description["Status"] print(" Creating data source. Status: "+status) time.sleep(60) if status != "CREATING": break
aws kendra describe-data-source \ --index-id index ID \ --id data source ID

此数据来源没有计划,因此不会自动运行。要为数据源编制索引,StartDataSourceSyncJob需要调用将索引与数据源同步。

以下示例演示如何同步数据来源。

CLI
aws kendra start-data-source-sync-job \ --index-id index ID \ --id data source ID
Python

以下 Python 代码片段同步了一个 Amazon S3 数据来源。有关完整示例,请参阅入门 (适用于 Python (Boto3) 的 AWS SDK)

print("Synchronize the data source.") sync_response = kendra.start_data_source_sync_job( Id = "data-source-id", IndexId = "index-id" )
aws kendra start-data-source-sync-job \ --index-id index ID \ --id data source ID
隐私网站条款Cookie 首选项
© 2025, Amazon Web Services, Inc. 或其附属公司。保留所有权利。