기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
데이터 소스 커넥터 생성
용 데이터 소스 커넥터를 생성 Amazon Kendra 하여 문서에 연결하고 인덱싱할 수 있습니다. Amazon Kendra 는 Microsoft SharePoint, Google Drive 및 기타 여러 공급자에 연결할 수 있습니다. 데이터 소스 커넥터를 생성할 때 소스 Amazon Kendra 리포지토리에 연결하는 데 필요한 구성 정보를 제공합니다. 인덱스에 직접 문서를 추가하는 것과 달리, 데이터 소스를 정기적으로 스캔하여 인덱스를 업데이트할 수 있습니다.
예를 들어 Amazon S3 버킷에 저장된 세금 문서 리포지토리가 있다고 가정해 보겠습니다. 수시로, 기존 문서가 변경되고 새 문서가 리포지토리에 추가됩니다. 리포지토리를 데이터 소스 Amazon Kendra 로 추가하는 경우 데이터 소스와 인덱스 간의 주기적 동기화를 설정하여 인덱스를 최신 상태로 유지할 수 있습니다.
콘솔 또는 StartDataSourceSyncJob API를 사용하여 인덱스를 수동으로 업데이트하도록 선택할 수 있습니다. 그렇지 않으면, 인덱스를 업데이트하고 데이터 소스와 동기화하도록 일정을 설정합니다.
인덱스에는 데이터 소스가 둘 이상 있을 수 있습니다. 각 데이터 소스에는 고유한 업데이트 일정이 있을 수 있습니다. 예를 들어 작업 문서의 인덱스를 매일 또는 매시간 업데이트하고 아카이브가 변경될 때마다 보관된 문서를 수동으로 업데이트할 수 있습니다.
문서 수집 프로세스 중에 문서 메타데이터나 속성 및 콘텐츠를 변경하려면 Amazon Kendra 사용자 지정 문서 보강을 참조하세요.
참고
각 문서 ID는 인덱스별로 고유해야 합니다. 고유한 ID로 문서를 인덱싱하는 데이터 소스를 만든 다음 BatchPutDocument
API를 사용하여 동일한 문서를 인덱싱할 수 없으며 그 반대의 경우도 마찬가지입니다. 데이터 소스를 삭제한 다음 BatchPutDocument
API를 사용하여 동일한 문서를 인덱싱하거나 그 반대로 할 수 있습니다. BatchPutDocument
및 BatchDeleteDocument
APIs를 동일한 문서 세트에 대한 Amazon Kendra 데이터 소스 커넥터와 함께 사용하면 데이터와 불일치가 발생할 수 있습니다. 대신, Amazon Kendra 사용자 지정 데이터 소스 커넥터를 사용하는 것이 좋습니다.
참고
인덱스에 추가된 파일은 UTF-8 인코딩된 바이트 스트림에 있어야 합니다. 의 문서에 대한 자세한 내용은 문서를 Amazon Kendra참조하세요.
업데이트 일정 설정
콘솔에서 정기적으로 업데이트하거나, 데이터 소스를 만들거나 업데이트할 때 Schedule
파라미터를 사용하여 데이터 소스를 구성합니다. 파라미터의 내용은 cron
형식 일정 문자열이나 필요에 따라 인덱스가 업데이트됨을 나타내는 빈 문자열을 포함하는 문자열입니다. cron 표현식의 형식은 Amazon CloudWatch Events 사용 설명서의 규칙에 대한 스케줄 표현식을 참조하세요.는 cron 표현식만 Amazon Kendra 지원합니다. rate 표현식은 지원하지 않습니다.
언어 설정
지원되는 언어로 데이터 소스의 모든 문서를 인덱싱할 수 있습니다. CreateDataSource를 호출할 때 데이터 소스의 모든 문서에 대한 언어 코드를 지정합니다. 메타데이터 필드에 지정된 언어 코드가 없는 문서의 경우, 데이터 소스 수준에서 모든 문서에 지정된 언어 코드를 사용하여 문서가 인덱싱됩니다. 언어를 지정하지 않으면 Amazon Kendra 는 기본적으로 데이터 소스의 문서를 영어로 인덱싱합니다. 코드를 포함하여 지원되는 언어에 대한 자세한 내용은 영어 이외의 언어로 문서 추가를 참조하세요.
콘솔을 사용하여 지원되는 언어로 데이터 소스의 모든 문서를 인덱싱하세요. 데이터 소스로 이동하여 데이터 소스를 편집하거나, 데이터 소스 추가를 통해 새 데이터 소스를 추가합니다. 데이터 소스 세부 정보 지정 페이지의 언어 드롭다운에서 언어를 선택합니다. 업데이트를 선택하거나 구성 정보를 계속 입력하여 데이터 소스에 연결합니다.