As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Criação de uma fonte Amazon S3 de dados
Os exemplos a seguir demonstram a criação de uma fonte de Amazon S3 dados. Os exemplos pressupõem que você já tenha criado um índice e uma IAM função com permissão para ler os dados do índice. Para obter mais informações sobre a IAM função, consulte funções de IAM acesso. Para obter mais informações sobre como criar um índice, consulte Como criar um índice.
- CLI
-
aws kendra create-data-source \
--index-id index ID
\
--name example-data-source \
--type S3 \
--configuration '{"S3Configuration":{"BucketName":"bucket name
"}}'
--role-arn 'arn:aws:iam::account id
:role:/role name
- Python
-
O trecho de código Python a seguir cria uma fonte de dados. Amazon S3 Para um exemplo completo, consulte Conceitos básicos (AWS SDK for Python (Boto3)).
print("Create an Amazon S3 data source.")
# Provide a name for the data source
name = "getting-started-data-source"
# Provide an optional description for the data source
description = "Getting started data source."
# Provide the IAM role ARN required for data sources
role_arn = "arn:aws:iam::${accountID}:role/${roleName}"
# Provide the data soource connection information
s3_bucket_name = "S3-bucket-name"
type = "S3"
# Configure the data source
configuration = {"S3DataSourceConfiguration":
{
"BucketName": s3_bucket_name
}
}
data_source_response = kendra.create_data_source(
Configuration = configuration,
Name = name,
Description = description,
RoleArn = role_arn,
Type = type,
IndexId = index_id
)
Pode levar algum tempo para criar sua fonte de dados. Você pode monitorar o progresso usando a DescribeDataSourceAPI. Quando o status da fonte de dados é ACTIVE
, a fonte de dados está pronta para uso.
Os exemplos a seguir demonstram como obter o status de uma fonte de dados.
- CLI
-
aws kendra describe-data-source \
--index-id index ID
\
--id data source ID
- Python
-
O trecho de código Python a seguir obtém informações sobre uma fonte de dados do S3. Para um exemplo completo, consulte Conceitos básicos (AWS SDK for Python (Boto3)).
print("Wait for Amazon Kendra to create the data source.")
while True:
data_source_description = kendra.describe_data_source(
Id = "data-source-id
",
IndexId = "index-id
"
)
status = data_source_description["Status"]
print(" Creating data source. Status: "+status)
time.sleep(60)
if status != "CREATING":
break
Essa fonte de dados não tem um agendamento e, portanto, não é executada automaticamente. Para indexar a fonte de dados, você chama StartDataSourceSyncJobpara sincronizar o índice com a fonte de dados.
Os exemplos a seguir demonstram a sincronização de uma fonte de dados.
- CLI
-
aws kendra start-data-source-sync-job \
--index-id index ID
\
--id data source ID
- Python
-
O trecho de código Python a seguir sincroniza uma fonte de dados do Amazon S3
. Para um exemplo completo, consulte Conceitos básicos (AWS SDK for Python (Boto3)).
print("Synchronize the data source.")
sync_response = kendra.start_data_source_sync_job(
Id = "data-source-id
",
IndexId = "index-id
"
)