

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 自動最佳化
<a name="serverless-auto-optimize"></a>

自動最佳化是一項服務，可自動化向量索引最佳化，讓使用者在搜尋品質、速度和成本之間取得平衡，而不需要數週的手動專家調校。它會根據使用者定義的延遲和召回需求評估索引組態，並產生最佳化建議，因此需要最少的專業知識。建議通常會在 30-60 分鐘內交付。

傳統向量索引組態需要豐富的專業知識和實驗，才能達到最佳效能。`ef_construction` （控制索引建置品質）、 `m` （決定圖形連線數）、 `ef_search` （控制 HNSW 搜尋） 和量化方法 （二進位量化 (32x、16x、8x)、純量量化 (4x)) 等參數會大幅影響搜尋準確性和資源使用率。自動最佳化使用超參數最佳化演算法來探索索引組態，這些組態在您定義的延遲和召回需求內，最適合您的資料集。

## 優勢
<a name="auto-optimize-benefits"></a>

OpenSearch 的自動最佳化提供下列優點：
+ **自動化參數調校** - 消除對演算法 (HNSW)、量化、重新評分和引擎參數的手動實驗，節省時間並減少向量搜尋最佳化的學習曲線。
+ **最佳化搜尋速度** - 根據預設，OpenSearch 已設定為記憶體內效能。自動最佳化可探索有利的權衡，改善搜尋品質並節省成本，同時維持可接受的搜尋速度。
+ **成本最佳化** - 透過尋找可降低索引記憶體需求的選項來降低成本，同時將搜尋品質和速度權衡降至最低。
+ **最佳化搜尋品質** - 可能提供比預設設定更高的召回率，或發現有利的權衡，可大幅節省成本並降低召回損失。

自動最佳化可與其他 OpenSearch 功能搭配使用，例如 [向量索引的 GPU 加速](gpu-acceleration-vector-index.md)，為向量搜尋工作負載提供全面的效能最佳化。

## 運作方式
<a name="auto-optimize-how-it-works"></a>

自動最佳化透過以任務為基礎的架構運作，可分析向量資料並提供最佳化建議。重點：
+ 使用者在 Amazon S3 儲存貯體中以 Parquet 或 JSONL 格式共用其資料集。
+ 他們透過設定可接受的召回和延遲閾值來設定無伺服器自動最佳化任務。更寬鬆的閾值可讓服務探索更顯著的成本最佳化。
+ 在由 Amazon OpenSearch Service 完全管理的基礎設施上執行的自動最佳化任務。任務不會在您的網域或集合上使用資源。工作者會平行執行以評估索引組態，並在大型資料集上使用取樣，通常在 30-60 分鐘內交付結果。
+ 每個任務都會以可預測的固定費率計費。如需定價資訊，請參閱 [Amazon OpenSearch Service 定價](https://aws.amazon.com/opensearch-service/pricing/)。

## 先決條件
<a name="auto-optimize-prerequisites"></a>
+ **資料集格式和許可** - 您的資料集必須是 Amazon S3 儲存貯體資料夾中的一或多個 Parquet 或 JSONL 檔案。例如：
  + Parquet： `s3://dataset-bucket-us-east-1/dataset_folder/first_half.parquet` 和 `s3://dataset-bucket-us-east-1/dataset_folder/second_half.parquet`
  + JSONL： `s3://dataset-bucket-us-east-1/dataset_folder/data.jsonl`

  提供封裝資料夾 URI （例如 `s3://dataset-bucket-us-east-1/dataset_folder/`)。資料夾必須包含單一格式的檔案 — 請勿在相同的資料夾中混合 Parquet 和 JSONL 檔案。此資料集將用於產生建議。確保您的聯合角色對該資源具有下列 Amazon S3 許可：`"s3:Get*", "s3:List*", "s3:Describe*"`。
+ **指定正確的資料集中繼資料** - 提供的資料集必須包含浮點數列。每個資料欄的名稱和每個向量的維度必須符合 主控台中提供的選項。例如，如果資料集包含名為`train_data`每個`768`維度的向量，則這些值必須符合自動最佳化主控台。
+ **（如果使用向量擷取功能）** - 如果您計劃使用擷取功能 （接受自動最佳化建議以自動建立索引和擷取資料），您必須設定 OpenSearch 叢集，以授予自動最佳化許可，以將資料集擷取至 OpenSearch 叢集。對於具有網域存取政策的 OpenSearch 網域，請透過該政策授予新建立的角色存取。對於具有精細存取控制的 OpenSearch 網域，請將管道角色新增為後端角色。對於 OpenSearch Serverless 集合，將管道角色新增至資料存取政策。
+ **IAM 許可** - 您需要下列 IAM 許可才能使用自動最佳化：
  + `opensearch:SubmitAutoOptimizeJob`
  + `opensearch:GetAutoOptimizeJob`
  + `opensearch:DeleteAutoOptimizeJob`
  + `opensearch:CancelAutoOptimizeJob`
  + `opensearch:ListAutoOptimizeJobs`
**注意**  
這些是身分型政策。自動最佳化不支援以資源為基礎的政策。
+ **登入資料過期** - 將聯合身分使用者工作階段設定為至少 1 小時的登入資料過期時間。對於非常大型的資料集或高維度，請考慮將過期持續時間增加至 3 小時。

## 自動最佳化的使用案例
<a name="serverless-auto-optimize-use-cases"></a>

在下列案例中，自動最佳化特別有價值：

**初始組態最佳化**  
第一次部署向量搜尋應用程式時，判斷最佳 HNSW 參數通常需要廣泛的測試和領域專業知識。自動最佳化可分析您的資料和工作負載特性，以建議生產就緒組態，藉此消除此trial-and-error程序。

此使用案例非常適合初次搜尋向量的團隊，或從需要快速建立基準組態的其他向量資料庫平台遷移的團隊。

**擴展最佳化**  
隨著向量資料集從數千個向量成長到數百萬個向量，一開始運作良好的參數可能會變得不理想。自動最佳化建議調整以大規模維持效能。

**降低成本**  
向量索引可能會耗用大量的運算和儲存資源，尤其是在高維度內嵌的情況下。透過尋找更有效率的參數組態來維持所需的效能等級，同時使用較少的資源，自動最佳化可找出降低成本的機會。

例如，自動最佳化可能會發現您目前的`m`值 （圖形連線能力） 高於準確性需求所需的值，可讓您減少索引時間和儲存體，而不會影響搜尋品質。

**效能故障診斷**  
在向量搜尋操作中遇到緩慢的查詢效能或高延遲時，自動最佳化可以分析資料集並識別更理想的組態。此服務提供特定建議來解決效能瓶頸，例如調整圖形連線或搜尋參數。

## 限制
<a name="auto-optimize-limitations"></a>
+ **區域可用性** - 自動最佳化僅適用於下列 AWS 區域：
  + ap-south-1
  + eu-west-1
  + us-west-2
  + us-east-2
  + us-east-1
  + eu-central-1
  + ap-southeast-2
  + ap-northeast-1
  + ap-southeast-1
+ **集合類型** - 僅向量搜尋集合和 OpenSearch 網域 (2.19、3.1 和 3.3) 支援自動最佳化。
+ **引擎支援**  
**依部署類型的引擎支援**    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_tw/opensearch-service/latest/developerguide/serverless-auto-optimize.html)
+ **演算法支援** - 自動最佳化僅支援 HNSW 型向量索引。
+ **並行任務** - 每個區域每個帳戶最多可以執行 10 個並行最佳化任務。如果達到限制，則無法接受任何新任務。
+ **任務持續時間** - 最佳化任務可能需要 15 分鐘到數小時，具體取決於資料集大小、維度和所需的效能指標。
+ **建議** - 自動最佳化建議最多 3 個建議。
+ **資料集**
  + 支援的格式：Parquet、JSONL
  + 資料存放區：Amazon S3

## 帳單與成本
<a name="auto-optimize-billing"></a>

無論資料集大小和最佳化組態為何，自動最佳化都會使用每項工作的定價模型，讓您為每項成功的最佳化任務付費。您不需要為失敗或取消的任務付費。此外，自動最佳化會在與受管或無伺服器 OpenSearch 叢集不同的基礎設施上執行，因此不會影響現有叢集的資源使用率。

**定價方式**  
自動最佳化成本會與標準 OpenSearch Serverless 或 OpenSearch 受管網域運算和儲存成本分開計費。

如需定價資訊，請參閱 [Amazon OpenSearch Service 定價](https://aws.amazon.com/opensearch-service/pricing/)。

## 支援的資料格式
<a name="auto-optimize-data-formats"></a>

自動最佳化支援下列存放在 Amazon S3 中的向量資料集資料格式：

### Parquet 格式
<a name="auto-optimize-parquet-format"></a>

Parquet 是針對分析工作負載最佳化的單欄式儲存格式。每個 Parquet 檔案都應包含代表向量資料的浮點數陣列資料欄。

Parquet 檔案結構範例 （檢視為資料表）：

```
| id  | train_data                     |
|-----|--------------------------------|
| 1   | [0.12, 0.45, 0.78, ..., 0.33] |
| 2   | [0.56, 0.89, 0.12, ..., 0.67] |
| 3   | [0.34, 0.67, 0.90, ..., 0.11] |
```

### JSONL 格式
<a name="auto-optimize-jsonl-format"></a>

JSONL (JSON Lines) 是文字格式，其中每一行都是有效的 JSON 物件。每一行都應包含一個欄位，其中包含代表向量資料的浮點數陣列。

範例 JSONL 檔案：

```
{"id": 1, "train_data": [0.12, 0.45, 0.78, 0.33]}
{"id": 2, "train_data": [0.56, 0.89, 0.12, 0.67]}
{"id": 3, "train_data": [0.34, 0.67, 0.90, 0.11]}
```

### 在格式之間轉換
<a name="auto-optimize-convert-formats"></a>

如果您的資料格式不同，您可以使用下列 Python 指令碼進行轉換。

**將 JSON 或 JSONL 轉換為 Parquet**  


```
#!/usr/bin/env python3
import json
import pyarrow as pa
import pyarrow.parquet as pq
from pathlib import Path
from typing import Any, Dict, List


def load_json_any(path: Path) -> List[Dict[str, Any]]:
    """
    Load JSON that can be:
      - a list of objects
      - a single object
      - JSON Lines (one object per line)
    Returns list[dict].
    """
    text = path.read_text().strip()

    # Try full JSON file
    try:
        obj = json.loads(text)
        if isinstance(obj, list):
            return obj
        if isinstance(obj, dict):
            return [obj]
    except json.JSONDecodeError:
        pass

    # Fallback → JSON Lines
    records = []
    for i, line in enumerate(text.splitlines(), start=1):
        line = line.strip()
        if not line:
            continue
        try:
            rec = json.loads(line)
        except json.JSONDecodeError as e:
            raise ValueError(f"Invalid JSON on line {i}: {e}")
        if not isinstance(rec, dict):
            raise ValueError(f"Line {i} must contain a JSON object")
        records.append(rec)

    return records


def json_to_parquet(json_path: str, parquet_path: str, compression: str = "snappy"):
    """Convert ANY JSON to Parquet (schema inferred)."""
    records = load_json_any(Path(json_path))
    table = pa.Table.from_pylist(records)
    pq.write_table(table, parquet_path, compression=compression)
    print(f"Wrote {len(records)} rows to {parquet_path}")


if __name__ == "__main__":
    INPUT_JSON = "vectors.jsonl"
    OUTPUT_PARQUET = "vectors.parquet"
    json_to_parquet(INPUT_JSON, OUTPUT_PARQUET)
```

**將 Parquet 轉換為 JSONL**  


```
#!/usr/bin/env python3
import json
import pyarrow.parquet as pq


def parquet_to_jsonl(parquet_path: str, jsonl_path: str):
    """Convert a Parquet file to JSONL format."""
    table = pq.read_table(parquet_path)
    rows = table.to_pylist()
    with open(jsonl_path, "w") as f:
        for row in rows:
            f.write(json.dumps(row) + "\n")
    print(f"Wrote {len(rows)} rows to {jsonl_path}")


if __name__ == "__main__":
    INPUT_PARQUET = "vectors.parquet"
    OUTPUT_JSONL = "vectors.jsonl"
    parquet_to_jsonl(INPUT_PARQUET, OUTPUT_JSONL)
```

## 相關功能
<a name="auto-optimize-related-features"></a>

自動最佳化可與其他 Amazon OpenSearch Service 功能搭配使用，協助您建置和最佳化向量搜尋應用程式：
+ [向量索引的 GPU 加速](gpu-acceleration-vector-index.md) - 使用 GPU 加速加速向量索引建置，以減少索引時間和成本。
+ [向量擷取](serverless-vector-ingestion.md) - 快速將向量資料從 Amazon S3 擷取並編製索引到您的網域或集合。