기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# Amazon DocumentDB 생성형 인공 지능
<a name="generative-ai"></a>

Amazon DocumentDB는 기계 학습(ML) 및 생성형 인공 지능(AI) 모델이 Amazon DocumentDB에 저장된 데이터를 실시간으로 사용할 수 있는 기능을 제공합니다. 고객은 더 이상 별도의 인프라를 관리하고, 다른 서비스와 연결하기 위한 코드를 작성하고, 기본 데이터베이스에서 데이터를 복제하는 데 시간을 소비할 필요가 없습니다.

인공 지능과가 AI 요구 사항을 AWS 지원하는 방법에 대한 자세한 내용은이 ["What-is"](https://aws.amazon.com/what-is/artificial-intelligence/) 문서를 참조하세요.

**Topics**
+ [

# Amazon SageMaker AI Canvas를 사용한 코드 없는 기계 학습
](no-code-machine-learning.md)
+ [

# Amazon DocumentDB에 대한 벡터 검색
](vector-search.md)

# Amazon SageMaker AI Canvas를 사용한 코드 없는 기계 학습
<a name="no-code-machine-learning"></a>

[Amazon SageMaker AI Canvas](https://docs.aws.amazon.com/sagemaker/latest/dg/canvas.html)를 사용하면 한 줄의 코드를 작성하지 않고도 자체 AI/ML 모델을 구축할 수 있습니다. 회귀 및 예측과 같은 일반적인 사용 사례를 위한 ML 모델을 구축하고 Amazon Bedrock에서 파운데이션 모델(FM) 액세스하고 평가할 수 있습니다. 콘텐츠 생성, 텍스트 추출 및 텍스트 요약을 위해 Amazon SageMaker AI JumpStart에서 퍼블릭 FM에 액세스하여 생성형 AI 솔루션을 지원할 수도 있습니다.

## SageMaker AI Canvas를 사용하여 코드 없는 ML 모델을 빌드하는 방법
<a name="w2aac21b9b5"></a>

Amazon DocumentDB는 이제 Amazon SageMaker AI Canvas와 통합되어 Amazon DocumentDB에 저장된 데이터와 함께 코드 없는 기계 학습(ML)을 활성화합니다. 이제 회귀 및 예측 요구 사항을 위한 ML 모델을 구축하고 단일 코드 줄을 작성하지 않고도 Amazon DocumentDB에 저장된 데이터를 사용하여 콘텐츠 요약 및 생성을 위한 파운데이션 모델을 사용할 수 있습니다.

SageMaker AI Canvas는 Amazon DocumentDB 고객이 AI/ML 전문 지식 없이 예측을 생성하거나 단일 코드 줄을 작성할 수 있는 시각적 인터페이스를 제공합니다. 이제 고객은에서 SageMaker AI Canvas 워크스페이스를 시작하고 데이터 준비 및 모델 훈련을 위해 Amazon DocumentDB 데이터를 AWS Management Console가져오고 조인할 수 있습니다. 이제 SageMaker AI Canvas에서 Amazon DocumentDB의 데이터를 사용하여 모델을 구축 및 보강하여 고객 이탈을 예측하고, 사기를 감지하고, 유지 관리 실패를 예측하고, 비즈니스 지표를 예측하고, 콘텐츠를 생성할 수 있습니다. 이제 고객은 SageMaker AI Canvas와 Quick의 기본 통합을 사용하여 팀 간에 ML 기반 인사이트를 게시하고 공유할 수 있습니다. SageMaker AI Canvas의 데이터 수집 파이프라인은 기본적으로 Amazon DocumentDB 보조 인스턴스에서 실행되므로 애플리케이션 및 SageMaker AI Canvas 수집 워크로드의 성능이 저하되지 않습니다.

Amazon DocumentDB 고객은 새 Amazon DocumentDB 코드 없는 ML 콘솔 페이지로 이동하여 새 SageMaker AI Canvas 워크스페이스 또는 사용 가능한 SageMaker AI Canvas 워크스페이스에 연결하여 SageMaker AI Canvas를 시작할 수 있습니다.

## SageMaker AI 도메인 및 사용자 프로필 구성
<a name="sagemaker-domain"></a>

VPC 전용 모드에서 실행 중인 SageMaker AI 도메인에서 Amazon DocumentDB 클러스터에 연결할 수 있습니다. VPC에서 SageMaker AI 도메인을 시작하면 SageMaker AI Studio 및 Canvas 환경에서 데이터 흐름을 제어할 수 있습니다. 이를 통해 인터넷 액세스를 제한하고, 표준 AWS 네트워킹 및 보안 기능을 사용하여 트래픽을 모니터링 및 검사하고, VPC 엔드포인트를 통해 다른 AWS 리소스에 연결할 수 있습니다. [Amazon SageMaker AI Canvas 시작하기](https://docs.aws.amazon.com/sagemaker/latest/dg/canvas-getting-started.html) 및 *Amazon SageMaker AI 개발자 안내서*에 위치한 [인터넷 액세스 없이 VPC에서 Amazon SageMaker AI Canvas 구성](https://docs.aws.amazon.com/sagemaker/latest/dg/canvas-vpc.html)을 참조하여 Amazon DocumentDB 클러스터에 연결할 SageMaker AI 도메인을 생성합니다.

## Amazon DocumentDB 및 SageMaker AI Canvas에 대한 IAM 액세스 권한 구성
<a name="iam-access-canvas"></a>

연결된 역할 및 자격 증명에 `AmazonDocDBConsoleFullAccess`가 연결된 Amazon DocumentDB 사용자는 AWS Management Console에 액세스할 수 있습니다. 앞서 언급한 역할 또는 자격 증명에 다음 작업을 추가하여 Amazon SageMaker AI Canvas를 사용한 코드 없는 기계 학습에 대한 액세스를 제공합니다.

```
"sagemaker:CreatePresignedDomainUrl",
"sagemaker:DescribeDomain",
"sagemaker:ListDomains",
"sagemaker:ListUserProfiles"
```

## SageMaker AI Canvas에 대한 데이터베이스 사용자 및 역할 생성
<a name="w2aac21b9c11"></a>

Amazon DocumentDB의 역할 기반 액세스 제어(RBAC)를 사용하여 데이터베이스에서 사용자가 수행할 수 있는 작업에 대한 액세스를 제한할 수 있습니다. RBAC는 사용자에게 하나 이상의 역할을 부여하여 작동합니다. 이러한 역할은 사용자가 데이터베이스 리소스에서 수행할 수 있는 작업을 결정합니다.

Canvas 사용자는 사용자 이름과 암호 자격 증명을 사용하여 Amazon DocumentDB 데이터베이스에 연결합니다. Amazon DocumentDB RBAC 기능을 사용하여 특정 데이터베이스에 대한 읽기 액세스 권한이 있는 Canvas 사용자의 데이터베이스 사용자/역할을 생성할 수 있습니다.

예를 들어 `createUser`를 사용합니다.

```
db.createUser({
user: "canvas_user", 
pwd: "<insert-password>", 
roles: [{role: "read", db: "sample-database-1"}]
})
```

이렇게 하면 `sample-database-1` 데이터베이스에 대한 읽기 권한이 있는 `canvas_user`가 생성됩니다. Canvas 분석가는 이 자격 증명을 사용하여 Amazon DocumentDB 클러스터의 데이터에 액세스할 수 있습니다. 자세한 내용은 [역할 기반 액세스 제어를 사용한 데이터베이스 액세스](role_based_access_control.md) 섹션을 참조하세요.

## 사용 가능한 리전
<a name="available-regions"></a>

코드 없는 통합은 Amazon DocumentDB와 Amazon SageMaker AI Canvas가 모두 지원되는 리전에서 사용할 수 있습니다. 리전은 다음과 같습니다.
+ us-east-1(버지니아 북부)
+ us-east-2(오하이오)
+ us-west-2(오리건)
+ ap-northeast-1(도쿄)
+ ap-northeast-2(서울)
+ ap-south-1(뭄바이)
+ ap-southeast-1(싱가포르)
+ ap-southeast-2(시드니)
+ eu-central-1(프랑크푸르트)
+ eu-west-1(아일랜드)

최신 리전 가용성은 *Amazon SageMaker AI 개발자 안내서*의 [Amazon SageMaker AI Canvas](https://docs.aws.amazon.com/sagemaker/latest/dg/canvas.html)를 참조하세요.

# Amazon DocumentDB에 대한 벡터 검색
<a name="vector-search"></a>

벡터 검색은 기계 학습에서 거리 또는 유사성 지표를 사용하여 벡터 표현을 비교하여 지정된 데이터 포인트와 유사한 데이터 포인트를 찾는 데 사용되는 방법입니다. 벡터 공간에 두 벡터가 가까울수록 기본 항목이 더 유사한 것으로 간주됩니다. 이 기법은 데이터의 의미 체계적 의미를 캡처하는 데 도움이 됩니다. 이 접근 방식은 추천 시스템, 자연어 처리 및 이미지 인식과 같은 다양한 애플리케이션에 유용합니다.

Amazon DocumentDB에 대한 벡터 검색은 JSON 기반 문서 데이터베이스의 유연성과 풍부한 쿼리 기능을 벡터 검색 기능과 결합합니다. 기존 Amazon DocumentDB 데이터 또는 유연한 문서 데이터 구조를 사용하여 의미 검색 경험, 제품 권장 사항, 개인화, 챗봇, 사기 탐지 및 이상 탐지와 같은 기계 학습 및 생성형 AI 사용 사례를 구축하려는 경우 Amazon DocumentDB에 대한 벡터 검색이 이상적인 선택입니다. 벡터 검색은 Amazon DocumentDB 5.0 인스턴스 기반 클러스터에서 사용할 수 있습니다.

**Topics**
+ [

## 벡터 삽입
](#w2aac21c11b9)
+ [

## 벡터 인덱스 생성
](#w2aac21c11c11)
+ [

## 인덱스 정의 가져오기
](#w2aac21c11c13)
+ [

## 벡터 쿼리
](#w2aac21c11c15)
+ [

## 특성 및 제한 사항
](#vector-limitations)
+ [

## 모범 사례
](#w2aac21c11c19)

## 벡터 삽입
<a name="w2aac21c11b9"></a>

Amazon DocumentDB 데이터베이스에 벡터를 삽입하려면 기존 삽입 방법을 사용할 수 있습니다.

**예제**

다음 예제에서는 테스트 데이터베이스 내에 5개의 문서 모음이 생성됩니다. 각 문서에는 제품 이름과 해당 벡터 임베딩의 두 필드가 포함되어 있습니다.

```
db.collection.insertMany([
  {"product_name": "Product A", "vectorEmbedding": [0.2, 0.5, 0.8]},
  {"product_name": "Product B", "vectorEmbedding": [0.7, 0.3, 0.9]},
  {"product_name": "Product C", "vectorEmbedding": [0.1, 0.2, 0.5]},
  {"product_name": "Product D", "vectorEmbedding": [0.9, 0.6, 0.4]},
  {"product_name": "Product E", "vectorEmbedding": [0.4, 0.7, 0.2]}
]);
```

## 벡터 인덱스 생성
<a name="w2aac21c11c11"></a>

Amazon DocumentDB는 계층적 탐색 가능 스몰 월드(HNSW) 인덱싱과 플랫 압축을 사용한 역 파일(IVFFlat) 인덱싱 방법을 모두 지원합니다. IVFFlat 인덱스는 벡터를 목록으로 분리한 다음 쿼리 벡터에 가장 가까운 해당 목록의 선택된 하위 집합을 검색합니다. 반면 HNSW 인덱스는 벡터 데이터를 다층 그래프로 구성합니다. HNSW는 IVFFlat 에 비해 구축 시간이 느리지만 쿼리 성능 및 리콜을 개선합니다. IVFFlat과 달리 HNSW에는 훈련 단계가 포함되어 있지 않으므로 초기 데이터 로드 없이 인덱스를 생성할 수 있습니다. 대부분의 사용 사례에서는 벡터 검색에 HNSW 인덱스 유형을 사용하는 것이 좋습니다.

벡터 인덱스를 생성하지 않으면 Amazon DocumentDB가 정확히 가장 가까운 이웃 검색을 수행하여 완벽한 호출을 보장합니다. 그러나 프로덕션 시나리오에서는 속도가 중요합니다. 속도 향상을 위해 일부 리콜을 처리할 수 있는 벡터 인덱스를 사용하는 것이 좋습니다. 벡터 인덱스를 추가하면 쿼리 결과가 달라질 수 있다는 점에 유의해야 합니다.

**템플릿**

다음 `createIndex` 또는 `runCommand` 템플릿을 사용하여 벡터 필드에 벡터 인덱스를 빌드할 수 있습니다.

------
#### [ Using createIndex ]

mongosh 및 Java와 같은 특정 드라이버에서 `createIndex`의`vectorOptions` 파라미터를 사용하면 오류가 발생할 수 있습니다. 이러한 경우 `runCommand`를 사용하는 것이 좋습니다.

```
db.collection.createIndex(
  { "<vectorField>": "vector" },
  { "name": "<indexName>",
    "vectorOptions": {
      "type": " <hnsw> | <ivfflat> ",
      "dimensions": <number_of_dimensions>,
      "similarity": " <euclidean> | <cosine> | <dotProduct> ",
      "lists": <number_of_lists> [applicable for IVFFlat],
      "m": <max number of connections> [applicable for HNSW],
      "efConstruction": <size of the dynamic list for index build> [applicable for HNSW]
    }
  }
);
```

------
#### [ Using runCommand ]

mongosh 및 Java와 같은 특정 드라이버에서 `createIndex`의`vectorOptions` 파라미터를 사용하면 오류가 발생할 수 있습니다. 이러한 경우 `runCommand`를 사용하는 것이 좋습니다.

```
db.runCommand(
  { "createIndexes": "<collection>", 
  "indexes": [{
      key: { "<vectorField>": "vector" },
      vectorOptions: {
          type: " <hnsw> | <ivfflat> ",
          dimensions: <number of dimensions>,
          similarity: " <euclidean> | <cosine> | <dotProduct> ",
          lists: <number_of_lists> [applicable for IVFFlat],
          m: <max number of connections> [applicable for HNSW],
          efConstruction: <size of the dynamic list for index build> [applicable for HNSW]
          },
      name: "myIndex" 
      }] 
  }
);
```

------


| 파라미터 | 요구 사항 | 데이터 유형 | 설명 | 값 | 
| --- | --- | --- | --- | --- | 
|  **name**  |  선택 사항  |  문자열  |  인덱스의 이름을 지정합니다.  |  영숫자  | 
|  **type**  |  선택 사항  |    |  인덱스의 유형을 지정합니다.  |  지원: hnsw 또는 ivfflat 기본값: HNSW(엔진 패치 3.0.4574 이상)  | 
|  **dimensions**  |  필수  |  정수  |  벡터 데이터의 차원 수를 지정합니다.  |  최대 2,000개의 차원.  | 
|  **similarity**  |  필수  |  문자열  |  유사성 계산에 사용되는 거리 지표를 지정합니다.  |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/ko_kr/documentdb/latest/developerguide/vector-search.html)  | 
|  **lists**  |  IVFFlat에 필요  |  정수  |  IVFFlat 인덱스가 벡터 데이터를 그룹화하는 데 사용하는 클러스터 수를 지정합니다. 권장 설정은 최대 100만 개 문서의 경우 문서 수/1000, 그리고 100만 개가 넘는 문서의 경우 `sqrt(# of documents)`입니다.  |  최소: 1 최대: [특성 및 제한 사항](#vector-limitations) 아래의 인스턴스 유형별 목록 표를 참조하세요.  | 
|  **m**  |  선택 사항  |  정수  |  HNSW 인덱스의 최대 연결 수를 지정합니다.  |  기본값: 16 범위 [2, 100]  | 
|  **efConstruction**  |  선택 사항  |  정수  |  HNSW 인덱스에 대한 그래프를 구성할 동적 후보 목록의 크기를 지정합니다. `efConstruction`은 (2 \$1 m)보다 크거나 같아야 합니다.  |  기본값: 64 범위 [4, 1000]  | 

검색의 정확도/리콜, 빌드 시간 및 성능에 영향을 미치므로 IVFFlat `lists`, `m` 및 HNSW `efConstruction`과 같은 하위 파라미터의 값을 적절하게 설정하는 것이 중요합니다. 목록 값이 높을수록 각 목록의 벡터 수가 줄어들어 리전이 작아지므로 쿼리 속도가 증가합니다. 그러나 리전 크기가 작을수록 더 많은 리콜 오류가 발생하여 정확도가 낮아질 수 있습니다. HNSW의 경우 `m` 및 `efConstruction` 값을 늘리면 정확도가 높아지지만 인덱스 구축 시간과 크기도 증가합니다. 다음 예를 참조하세요.

**예시**

------
#### [ HNSW ]

```
db.collection.createIndex(
  { "vectorEmbedding": "vector" },
  { "name": "myIndex",
    "vectorOptions": {
      "type": "hnsw",
      "dimensions": 3,
      "similarity": "euclidean",
      "m": 16,
      "efConstruction": 64
    }
  }
);
```

------
#### [ IVFFlat ]

```
db.collection.createIndex(
  { "vectorEmbedding": "vector" },
  { "name": "myIndex",
    "vectorOptions": {
      "type": "ivfflat",
      "dimensions": 3,
      "similarity": "euclidean",
      "lists":1
    }
  }
)
```

------

## 인덱스 정의 가져오기
<a name="w2aac21c11c13"></a>

다음 `getIndexes` 명령을 사용하여 벡터 인덱스를 포함한 인덱스의 세부 정보를 볼 수 있습니다.

**예제**

```
db.collection.getIndexes()
```

**출력 예**

```
[
 {
  "v" : 4,
  "key" : {
   "_id" : 1
  },
  "name" : "_id_",
  "ns" : "test.collection"
 },
 {
  "v" : 4,
  "key" : {
   "vectorEmbedding" : "vector"
  },
  "name" : "myIndex",
  "vectorOptions" : {
   "type" : "ivfflat",
   "dimensions" : 3,
   "similarity" : "euclidean",
   "lists" : 1
  },
  "ns" : "test.collection"
 }
]
```

## 벡터 쿼리
<a name="w2aac21c11c15"></a>

Amazon DocumentDB는 벡터 쿼리를 위해 두 개의 벡터 검색 연산자를 지원합니다.

### 클래식 벡터 검색 연산자
<a name="w2aac21c11c15b5"></a>

다음 템플릿을 사용하여 벡터를 쿼리합니다.

```
db.collection.aggregate([
  {
    $search: {
      "vectorSearch": {
        "vector": <query vector>, 
        "path": "<vectorField>", 
        "similarity": "<distance metric>",
        "k": <number of results>,
        "probes":<number of probes> [applicable for IVFFlat],
        "efSearch":<size of the dynamic list during search> [applicable for HNSW]
      }
    }
  }
]);
```


| 파라미터 | 요구 사항 | Type | 설명 | 값 | 
| --- | --- | --- | --- | --- | 
|  **vectorSearch**  |  필수  |  연산자  |  \$1search 명령 내에서 벡터를 쿼리하는 데 사용됩니다.  |    | 
|  **vector**  |  필수  |  배열  |  유사한 벡터를 찾는 데 사용할 쿼리 벡터를 나타냅니다.  |    | 
|  **path**  |  필수  |  문자열  |  벡터 필드의 이름을 정의합니다.  |    | 
|  **k**  |  필수  |  정수  |  검색에서 반환하는 결과의 수를 지정합니다.  |    | 
|  **similarity**  |  필수  |  문자열  |  유사성 계산에 사용되는 거리 지표를 지정합니다.  |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/ko_kr/documentdb/latest/developerguide/vector-search.html)  | 
|  **probes**  |  선택 사항  |  정수  |  벡터 검색에서 검사할 클러스터 수입니다. 값이 높을수록 속도 비용으로 더 나은 리콜을 제공합니다. 정확히 가장 가까운 이웃 검색을 위한 목록 수로 설정할 수 있습니다(실행 계획기가 인덱스를 사용하지 않는 시점). 미세 조정을 시작하기 위한 권장 설정은 `sqrt(# of lists)`입니다.  |  기본값: 1  | 
|  **efSearch**  |  선택 사항  |  정수  |  검색 중에 HNSW 인덱스가 사용하는 동적 후보 목록의 크기를 지정합니다. `efSearch` 값이 높을수록 속도 비용으로 더 나은 리콜을 제공합니다.  |  기본값: 40 범위 [1, 1000]  | 

원하는 성능과 정확도를 달성하려면 `efSearch`(HNSW) 또는 `probes`(IVFFlat)의 값을 미세 조정하는 것이 중요합니다. 다음 예제 작업을 참조하세요.

------
#### [ HNSW ]

```
db.collection.aggregate([
  {
    $search: {
      "vectorSearch": {
        "vector": [0.2, 0.5, 0.8], 
        "path": "vectorEmbedding", 
        "similarity": "euclidean",
        "k": 2,
        "efSearch": 40
      }
    }
  }
]);
```

------
#### [ IVFFlat ]

```
db.collection.aggregate([
  {
    $search: {
      "vectorSearch": {
        "vector": [0.2, 0.5, 0.8], 
        "path": "vectorEmbedding", 
        "similarity": "euclidean",
        "k": 2,
        "probes": 1
      }
    }
  }
]);
```

------

**출력 예**

이 작업의 출력은 다음과 같이 표시됩니다.

```
{ "_id" : ObjectId("653d835ff96bee02cad7323c"), "product_name" : "Product A", "vectorEmbedding" : [ 0.2, 0.5, 0.8 ] }
{ "_id" : ObjectId("653d835ff96bee02cad7323e"), "product_name" : "Product C", "vectorEmbedding" : [ 0.1, 0.2, 0.5 ] }
```

### `$vectorSearch` 연산자(Amazon DocumentDB 8.0 이상에서 사용 가능)
<a name="w2aac21c11c15b7"></a>

다음 템플릿을 사용하여 벡터를 쿼리합니다.

```
db.collection.aggregate([
{
  "$vectorSearch": {
    "exact": true | false,
    "index": "<index-name>" [supports only HNSW index],
    "limit": <number-of-results> [same as k],
    "path": "<vector field-to-search>",
    "queryVector": <array-of-numbers>,
    "numCandidates": <number-of-candidates> [same as efSearch], 
  }
}])
```

## 특성 및 제한 사항
<a name="vector-limitations"></a>

**버전 호환성**
+ Amazon DocumentDB에 대한 벡터 검색은 Amazon DocumentDB 5.0\$1 인스턴스 기반 클러스터에서만 사용할 수 있습니다.

**벡터**
+ Amazon DocumentDB는 최대 2,000개의 차원으로 벡터를 인덱싱할 수 있습니다. 하지만 인덱스 없이 최대 16,000개의 차원을 저장할 수 있습니다.

**인덱스**
+ IVFFlat 인덱스 생성의 경우 목록 파라미터의 권장 설정은 최대 100만 개의 문서의 경우 문서 수/1000 및 100만 개가 넘는 문서의 경우 `sqrt(# of documents)`입니다. 작동 메모리 제한으로 인해 Amazon DocumentDB는 차원 수에 따라 목록 파라미터의 특정 최대값을 지원합니다. 참고로 다음 표에서는 500, 1,000 및 2,000 차원의 벡터에 대한 목록 파라미터의 최대값을 제공합니다.    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/ko_kr/documentdb/latest/developerguide/vector-search.html)
+ `compound`, `sparse` 또는 `partial`과 같은 다른 인덱스 옵션은 벡터 인덱스에서 지원되지 않습니다.
+ Amazon DocumentDB 5.0의 HNSW 인덱스에는 병렬 인덱스 빌드가 지원되지 않습니다.

**벡터 쿼리**
+ 벡터 검색 쿼리의 경우 최적의 결과를 위해 `probes` 또는 `efSearch`와 같은 파라미터를 미세 조정하는 것이 중요합니다. `probes` 또는 `efSearch` 파라미터의 값이 높을수록 재호출이 높고 속도가 낮아집니다. 프로브 파라미터 미세 조정을 시작하기 위한 권장 설정은 `sqrt(# of lists)`입니다.

## 모범 사례
<a name="w2aac21c11c19"></a>

Amazon DocumentDB의 벡터 검색을 사용한 작업 모범 사례에 대해서 알아봅니다. 이 섹션은 새로운 모범 사례가 확인되는 대로 지속적으로 업데이트됩니다.
+ 플랫 압축(IVFFlat) 인덱스 생성이 포함된 반전된 파일에는 유사성을 기반으로 데이터 포인트를 클러스터링하고 구성하는 작업이 포함됩니다. 따라서 인덱스가 더 효과적이려면 인덱스를 생성하기 전에 최소한 일부 데이터를 로드하는 것이 좋습니다.
+ 벡터 검색 쿼리의 경우 최적의 결과를 위해 `probes` 또는 `efSearch`와 같은 파라미터를 미세 조정하는 것이 중요합니다. `probes` 또는 `efSearch` 파라미터의 값이 높을수록 재호출이 높고 속도가 낮아집니다. `probes` 파라미터 미세 조정을 시작하기 위한 권장 설정은 `sqrt(lists)`입니다.

**리소스**
+ [새 블로그 게시물 내용 벡터 검색](https://aws.amazon.com/blogs/aws/vector-search-for-amazon-documentdb-with-mongodb-compatibility-is-now-generally-available)
+ [의미 검색 코드 샘플](https://github.com/aws-samples/amazon-documentdb-samples/tree/master/blogs/semanticsearch-docdb)
+ [Amazon DocumentDB 벡터 검색 코드 샘플](https://github.com/aws-samples/amazon-documentdb-samples/tree/master/samples/vector-search)