기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
스트리밍 데이터 벡터화 블루프린트 배포
이 주제에서는 스트리밍 데이터 벡터화 블루프린트를 배포하는 방법을 설명합니다.
스트리밍 데이터 벡터화 블루프린트 배포
-
다음 리소스가 올바르게 설정되었는지 확인합니다.
-
데이터가 포함된 주제가 하나 이상 있는 프로비저닝된 클러스터 또는 서버리스 MSK 클러스터입니다.
-
-
Bedrock 설정: 원하는 Bedrock 모델에 액세스합니다. 현재 지원되는 Bedrock 모델은 다음과 같습니다.
Amazon Titan Embeddings G1 - Text
Amazon Titan 텍스트 임베딩 V2
Amazon Titan Multimodal Embeddings G1
Cohere Embed English
Cohere Embed Multilingual
-
AWS OpenSearch 컬렉션:
프로비저닝된 또는 서버리스 OpenSearch 서비스 컬렉션을 사용할 수 있습니다.
OpenSearch 서비스 컬렉션에는 인덱스가 하나 이상 있어야 합니다.
OpenSearch Serverless 컬렉션을 사용하려면 벡터 검색 컬렉션을 생성해야 합니다. 벡터 인덱스를 설정하는 방법에 대한 자세한 내용은 지식 기반에 대한 자체 벡터 스토어의 사전 조건을 참조하세요. 벡터화에 대한 자세한 내용은 설명된 Amazon OpenSearch Service의 벡터 데이터베이스 기능을 참조하세요
. 참고
벡터 인덱스를 생성할 때 벡터 필드 이름을 사용해야 합니다
embedded_data
.OpenSearch 프로비저닝된 컬렉션을 사용하려면 블루프린트에서 생성한 MSF 애플리케이션 역할(Opensearch 액세스 정책 포함)을 OpenSearch 컬렉션에 마스터 사용자로 추가해야 합니다. 또한의 액세스 정책 OpenSearch 이 “허용” 작업으로 설정되어 있는지 확인합니다. 이는 세분화된 액세스 제어를 활성화하는 데 필요합니다.
선택적으로 OpenSearch 대시보드에 대한 액세스를 활성화하여 결과를 볼 수 있습니다. 를 참조하여 세분화된 액세스 제어를 활성화합니다.
MSF 콘솔 대시보드로 이동하여 스트리밍 애플리케이션 생성을 선택합니다.
스트림 처리 애플리케이션을 설정하는 방법 선택에서 청사진 사용을 선택합니다.
블루프린트 드롭다운 메뉴에서 실시간 AI 애플리케이션 블루프린트를 선택합니다.
원하는 구성을 제공합니다. 페이지 구성 생성을 참조하세요.
배포 블루프린트를 선택하여 CloudFormation 배포를 시작합니다.
CloudFormation 배포가 완료되면 배포된 Flink 애플리케이션으로 이동합니다. 애플리케이션의 런타임 속성을 확인합니다.
애플리케이션에 런타임 속성을 변경/추가하도록 선택할 수 있습니다. 이러한 속성을 구성하는 자세한 내용은 런타임 속성 구성을 참조하세요.
참고
참고:
OpenSearch 프로비저닝된를 사용하는 경우 세분화된 액세스 제어를 활성화했는지 확인하세요.
프로비저닝된 클러스터가 프라이빗인 경우 OpenSearch 프로비저닝된 VPC 엔드포인트
https://
에를 추가URL하고이 엔드포인트를 가리키sink.os.endpoint
도록를 변경합니다.프로비저닝된 클러스터가 퍼블릭인 경우 MSF 애플리케이션이 인터넷에 액세스할 수 있는지 확인합니다. 자세한 내용은 Apache Flink용 VPC연결 관리형 서비스에 대한 인터넷 및 서비스 액세스를 참조하세요.
모든 구성에 만족하면를 선택합니다
Run
. 애플리케이션이 실행되기 시작합니다.MSK 클러스터에 메시지를 펌프합니다.
Opensearch 클러스터로 이동하여 OpenSearch 대시보드로 이동합니다.
대시보드의 왼쪽 메뉴에서 검색을 선택합니다. 벡터 임베딩과 함께 지속 문서가 표시됩니다.
인덱스에 저장된 벡터를 사용하는 방법을 알아보려면 벡터 검색 컬렉션 작업을 참조하세요.
페이지 구성 생성
이 주제에서는 실시간 AI 애플리케이션 블루프린트에 대한 구성을 지정할 때 참조할 페이지 구성 생성에 대해 설명합니다.
- 애플리케이션 이름
-
의 기존 필드에서 애플리케이션에 이름을 MSF지정합니다.
- MSK 클러스터
-
드롭다운 목록에서 설정 중에 생성한 MSK 클러스터를 선택합니다.
- 주제
-
설정에서 생성한 주제(들)의 이름을 추가합니다.
- 입력 스트림 데이터 유형
-
MSK 스트림에 문자열 입력을 제공하려면 문자열을 선택합니다.
MSK 스트림의 입력이 JSON인지 선택합니다JSON. JSON 임베디드 키에 임베딩 생성을 위해 Bedrock에 JSON 값을 보내려는 입력의 필드 이름을 작성합니다.
- Bedrock 임베딩 모델
목록에서 하나를 선택합니다. 선택한 모델에 대한 모델 액세스 권한이 있는지 확인합니다. 그렇지 않으면 스택이 실패할 수 있습니다. Amazon Bedrock 파운데이션 모델에 대한 액세스 추가 또는 제거를 참조하세요.
- OpenSearch 클러스터
드롭다운에서 생성한 클러스터를 선택합니다.
- OpenSearch 벡터 인덱스 이름
위 단계에서 생성한 벡터 인덱스를 선택합니다.