기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
Amazon Bedrock 지식 기반을 사용하면 한 번에 데이터 소스를 수정하고 변경 사항을 동기화할 수 있습니다. 지식 기반이 다음 유형의 데이터 소스 중 하나에 연결된 경우이 기능을 활용할 수 있습니다.
-
Amazon S3
-
사용자 지정(Custom)
직접 수집을 사용하면 단일 작업으로 지식 기반에서 파일을 직접 추가, 업데이트 또는 삭제할 수 있으며 지식 기반은 동기화할 필요 없이 문서에 액세스할 수 있습니다. 직접 수집은 KnowledgeBaseDocuments
API 작업을 사용하여 지식 기반에 대해 설정된 벡터 스토어에 직접 제출하는 문서를 인덱싱합니다. 또한 이러한 작업을 통해 연결된 데이터 소스로 이동하여 문서를 볼 필요 없이 지식 기반에서 문서를 직접 볼 수도 있습니다.
데이터 소스 동기화의 차이점
Amazon Bedrock 지식 기반은 데이터 소스 동기화와 관련된 IngestionJob
API 작업 세트도 제공합니다. 데이터 소스를 StartIngestionJob 요청과 동기화하면 Amazon Bedrock 지식 기반은 연결된 데이터 소스의 각 문서를 스캔하고 지식 기반에 대해 설정된 벡터 스토어에 이미 인덱싱되었는지 확인합니다. 그렇지 않으면 벡터 스토어로 인덱싱됩니다.
IngestKnowledgeBaseDocuments 요청을 사용하면 벡터 스토어에 직접 인덱싱할 문서 배열을 제출합니다. 따라서 데이터 소스에 문서를 추가하는 단계를 건너뜁니다. 이 두 API 작업 세트의 사용 사례를 이해하려면 다음 단락을 참조하세요.
사용자 지정 데이터 소스를 사용하는 경우
IngestionJob
작업을 동기화하거나 사용할 필요가 없습니다. KnowledgeBaseDocuments
작업을 통해 또는에서 추가, 수정 또는 삭제하는 문서는 사용자 지정 데이터 소스와 지식 기반의 AWS Management Console 일부가 됩니다.
Amazon S3 데이터 소스를 사용하는 경우
서로 다른 사용 사례에서 두 가지 작업 세트를 사용합니다.
-
지식 기반을 S3 데이터 소스에 처음 연결한 후 Amazon Bedrock API를 통해 StartIngestionJob 요청을 제출하여 AWS Management Console 또는에서 데이터 소스를 동기화해야 합니다.
-
지식 기반을 위해 설정된 벡터 스토어로 문서를 인덱싱하거나 다음과 같은 방법으로 인덱싱된 문서를 제거합니다.
-
S3 위치에 문서를 추가하거나 해당 위치에서 문서를 삭제합니다. 그런 다음에서 데이터 소스를 동기화 AWS Management Console 하거나 API에서
StartIngestionJob
요청을 제출합니다. 동기화 및StartIngestionJob
작업에 대한 자세한 내용은 섹션을 참조하세요Amazon Bedrock 지식 기반으로 데이터 동기화. -
IngestKnowledgeBaseDocuments
요청과 함께 S3 문서를 지식 기반에 직접 수집합니다. 문서 직접 수집에 대한 자세한 내용은 섹션을 참조하세요문서를 지식 기반에 직접 수집.주의
S3 데이터 소스의 경우에서 직접 AWS Management Console 또는
KnowledgeBaseDocuments
API 작업을 사용하여 지식 기반으로 인덱싱하는 변경 사항은 S3 위치에 반영되지 않습니다. 이러한 API 작업을 사용하여 지식 기반을 한 번에 즉시 변경할 수 있습니다. 그러나 다음에 AWS Management Console 또는에서 데이터 소스를 동기화할 때 S3 위치를 덮어쓰지 않도록 S3 위치를 동일하게 변경하여 후속 조치를 취해야 합니다StartIngestionJob
.IngestKnowledgeBaseDocuments
와StartIngestionJob
요청을 동시에 제출하지 마세요.
-
주제를 선택하여 데이터 소스에서 문서를 직접 수집하는 방법을 알아봅니다.