Amazon Bedrock 지식 기반의 데이터 소스 수정 - Amazon Bedrock

Amazon Bedrock 지식 기반의 데이터 소스 수정

데이터 소스 구성을 변경하는 등 지식 기반의 데이터 소스를 업데이트할 수 있습니다.

다음과 같은 방법으로 데이터 소스를 업데이트할 수 있습니다.

  • 데이터 소스에서 파일 또는 콘텐츠를 추가, 변경 또는 제거합니다.

  • 데이터 수집 중에 임시 데이터를 암호화하는 데 사용할 데이터 소스 구성 또는 KMS 키를 변경합니다. 소스 또는 엔드포인트 구성 세부 정보를 변경하는 경우, 필요한 액세스 권한과 Secrets Manager 보안 암호(해당하는 경우)를 사용하여 새 IAM 역할을 업데이트하거나 생성해야 합니다.

  • 데이터 소스 삭제 정책을 'Delete' 또는 'Retain'으로 설정합니다. 지식 기반 또는 데이터 소스 리소스를 삭제하면 벡터 임베딩으로 변환되는 데이터 소스의 모든 데이터를 삭제할 수 있습니다. 지식 기반 또는 데이터 소스 리소스를 삭제하면 벡터 임베딩으로 변환되는 데이터 소스의 모든 데이터를 유지할 수 있습니다. 지식 기반 또는 데이터 소스 리소스를 삭제한다고 해서 벡터 저장소 자체가 삭제되지는 않습니다.

데이터 소스에서 파일을 추가, 수정 또는 제거할 때마다 데이터 소스를 동기화하여 지식 기반에 다시 인덱싱해야 합니다. 동기화는 증분적으로 이루어지므로 Amazon Bedrock은 마지막 동기화 이후에 추가, 수정 또는 삭제된 문서만 처리합니다. 수집을 시작하기 전에 데이터 소스가 다음 조건을 충족하는지 확인합니다.

  • 파일이 지원되는 형식입니다. 자세한 내용은 지원되는 문서 형식을 참조하세요.

  • 파일이 AWS 일반 참조의 Amazon Bedrock endpoints and quotas에 지정된 Ingestion job file size를 초과하지 않습니다.

  • 데이터 소스에 메타데이터 파일이 포함된 경우, 다음 조건을 확인하여 메타데이터 파일이 무시되지 않도록 하세요.

    • .metadata.json 파일은 연결된 소스 파일과 동일한 파일 이름과 확장자를 공유합니다.

    • 지식 기반에 대한 벡터 인덱스가 Amazon OpenSearch Serverless 벡터 저장소에 있는 경우, 벡터 인덱스가 faiss 엔진으로 구성되어 있는지 확인합니다. 벡터 인덱스가 nmslib 엔진으로 구성되어 있다면 다음 중 하나를 수행해야 합니다.

    • 지식 기반에 대한 벡터 인덱스가 Amazon Aurora 데이터베이스 클러스터에 있는 경우, 수집을 시작하기 전에 인덱스의 테이블에 메타데이터 파일의 각 메타데이터 속성에 대한 열이 포함되어 있는지 확인합니다.

데이터 소스를 업데이트하는 방법을 알아보려면 선택한 방법에 해당하는 탭을 선택하고 안내된 단계를 따릅니다.

Console
데이터 소스를 업데이트하는 방법
  1. Amazon Bedrock 권한이 있는 IAM 역할을 사용하여 AWS Management Console에 로그인하고 https://console.aws.amazon.com/bedrock/에서 Amazon Bedrock 콘솔을 엽니다.

  2. 왼쪽 탐색 창에서 지식 기반을 선택합니다.

  3. 지식 기반 이름을 선택합니다.

  4. 데이터 소스 섹션에서 편집 및 동기화하려는 데이터 소스 옆의 라디오 버튼을 선택합니다.

  5. (선택 사항) 편집을 선택하고 구성을 변경한 다음 제출을 선택합니다. 소스 또는 엔드포인트 구성 세부 정보를 변경하는 경우, 필요한 액세스 권한과 Secrets Manager 보안 암호(해당하는 경우)를 사용하여 새 IAM 역할을 업데이트하거나 생성해야 합니다. 수집된 원본 데이터를 기반으로 하는 청킹 구성을 변경할 수 없다는 점에도 유의하세요. 데이터 소스를 다시 만들어야 합니다.

    참고

    청킹 구성은 변경할 수 없습니다. 데이터 소스를 다시 만들어야 합니다.

  6. (선택 사항) 고급 설정 과정에서 데이터 소스 데이터 삭제 정책을 편집할 수 있습니다.

    데이터 삭제 정책 설정에서 다음 중 하나를 선택할 수 있습니다.

    • 삭제: 지식 기반 또는 데이터 소스 리소스 삭제 시 벡터 임베딩으로 변환된 모든 데이터를 데이터 소스에서 삭제합니다. 벡터 저장소 자체는 삭제되지 않고 데이터만 삭제된다는 점에 유의하세요. AWS 계정이 삭제되면 이 플래그는 무시됩니다.

    • 유지: 지식 기반 또는 데이터 소스 리소스 삭제 시 벡터 임베딩으로 변환되는 데이터 소스의 모든 데이터를 유지합니다. 지식 기반 또는 데이터 소스 리소스를 삭제한다고 해서 벡터 저장소 자체가 삭제되지는 않습니다.

  7. 동기화를 선택합니다.

  8. 동기화가 완료되고 상태준비로 바뀌면 녹색 배너가 나타납니다.

API
데이터 소스를 업데이트하는 방법
  1. (선택 사항) Agents for Amazon Bedrock 빌드 타임 엔드포인트를 사용하여 UpdateDataSource 요청을 전송하고, 모든 구성을 변경하고, 변경하지 않으려는 동일한 구성을 지정합니다. 소스 또는 엔드포인트 구성 세부 정보를 변경하는 경우, 필요한 액세스 권한과 Secrets Manager 보안 암호(해당하는 경우)를 사용하여 새 IAM 역할을 업데이트하거나 생성해야 합니다.

    참고

    chunkingConfiguration은 변경할 수 없습니다. 기존 chunkingConfiguration으로 요청을 보내거나 데이터 소스를 다시 만드세요.

  2. (선택 사항) 데이터 소스의 dataDeletionPolicy를 변경합니다. 지식 기반 또는 데이터 소스 리소스를 삭제하면 벡터 임베딩으로 변환되는 데이터 소스의 모든 데이터를 DELETE할 수 있습니다. AWS 계정이 삭제되면 이 플래그는 무시됩니다. 지식 기반 또는 데이터 소스 리소스를 삭제하면 벡터 임베딩으로 변환되는 데이터 소스의 모든 데이터를 RETAIN할 수 있습니다. 지식 기반 또는 데이터 소스 리소스를 삭제한다고 해서 벡터 저장소 자체가 삭제되지는 않습니다.

  3. dataSourceIdknowledgeBaseId를 지정하여 Agents for Amazon Bedrock 빌드 타임 엔드포인트를 사용해 StartIngestionJob 요청을 전송합니다.