기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
Amazon Bedrock 지식 기반으로 데이터 동기화
지식 기반을 만든 후에는 데이터를 수집하거나 동기화하여 데이터를 쿼리할 수 있습니다. 수집을 통해 지정한 벡터 임베딩 모델 및 구성을 기반으로 데이터 소스의 원시 데이터를 벡터 임베딩으로 변환할 수 있습니다.
수집을 시작하기 전에 데이터 소스가 다음 조건을 충족하는지 확인합니다.
-
데이터 소스에 대한 연결 정보를 구성했습니다. 데이터 소스 커넥터가 데이터 소스 리포지토리에서 데이터를 크롤링하도록 구성하려면 Supported data source connectors 섹션을 참조하세요. 지식 기반을 만드는 과정에서 데이터 소스를 구성하게 됩니다.
-
선택한 벡터 임베딩 모델 및 벡터 저장소를 구성했습니다. 지원되는 벡터 임베딩 모델 및 지식 기반에 대한 벡터 저장소를 참조하세요. 지식 기반을 만드는 과정에서 벡터 임베딩을 구성하게 됩니다.
-
파일이 지원되는 형식입니다. 자세한 내용은 지원되는 문서 형식을 참조하세요.
-
파일이 AWS 일반 참조의 Amazon Bedrock endpoints and quotas에 지정된 Ingestion job file size를 초과하지 않습니다.
-
데이터 소스에 메타데이터 파일이 포함된 경우, 다음 조건을 확인하여 메타데이터 파일이 무시되지 않도록 하세요.
-
각
.metadata.json
파일은 연결된 소스 파일과 동일한 파일 이름과 확장자를 공유합니다. -
지식 기반에 대한 벡터 인덱스가 Amazon OpenSearch Serverless 벡터 스토어에 있는 경우 벡터 인덱스가
faiss
엔진으로 구성되어 있는지 확인합니다. 벡터 인덱스가nmslib
엔진으로 구성되어 있다면 다음 중 하나를 수행해야 합니다.-
콘솔에서 새 지식 기반을 생성하고 Amazon Bedrock이 Amazon OpenSearch Serverless에서 벡터 인덱스를 자동으로 생성하도록 합니다.
-
벡터 저장소에서 또 다른 벡터 인덱스를 만들고 엔진으로
faiss
를 선택합니다. 그런 다음 새 지식 기반을 만들고 새 벡터 인덱스를 지정합니다.
-
-
지식 기반에 대한 벡터 인덱스가 Amazon Aurora 데이터베이스 클러스터에 있는 경우, 수집을 시작하기 전에 인덱스의 테이블에 메타데이터 파일의 각 메타데이터 속성에 대한 열이 포함되어 있는지 확인합니다.
-
데이터 소스에서 파일을 추가, 수정 또는 제거할 때마다 데이터 소스를 동기화하여 지식 기반에 다시 인덱싱해야 합니다. 동기화는 증분적으로 이루어지므로 Amazon Bedrock은 마지막 동기화 이후에 추가, 수정 또는 삭제된 문서만 처리합니다.
데이터를 지식 기반에 수집하고 최신 데이터와 동기화하는 방법을 알아보려면 원하는 방법의 탭을 선택한 다음 다음 단계를 따릅니다.