

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Accelerazione GPU per l'indicizzazione vettoriale
<a name="gpu-acceleration-vector-index"></a>

L'accelerazione GPU consente di creare database vettoriali su larga scala in modo più rapido ed efficiente. Puoi abilitare questa funzionalità su domini e raccolte Serverless nuovi o esistenti. OpenSearch OpenSearch Questa funzionalità utilizza l'accelerazione GPU per ridurre il tempo necessario per indicizzare i dati in indici vettoriali.

Con l'accelerazione GPU, puoi aumentare la velocità di indicizzazione vettoriale fino a 10 volte a un quarto del costo di indicizzazione.

## Prerequisiti
<a name="gpu-acceleration-prerequisites"></a>

L'accelerazione GPU è supportata nei domini che eseguono una versione o successiva e nelle raccolte Serverless. OpenSearch OpenSearch `3.1` OpenSearch Per ulteriori informazioni, vedere, e. [Aggiornamento dei domini Amazon Service OpenSearch](version-migration.md) [UpdateDomainConfig[UpdateCollection](https://docs.aws.amazon.com/opensearch-service/latest/ServerlessAPIReference/API_UpdateCollection.html)](https://docs.aws.amazon.com/opensearch-service/latest/APIReference/API_UpdateDomainConfig.html) APIs

## Come funziona
<a name="gpu-acceleration-how-it-works"></a>

Gli indici vettoriali richiedono risorse di calcolo significative per creare strutture di dati come i grafici Hierarchical Navigable Small Worlds (HNSW). Quando abiliti l'accelerazione GPU sul tuo dominio o sulla tua raccolta, rileva OpenSearch automaticamente le opportunità per accelerare la creazione dell'indice e trasferisce le build dell'indice su istanze GPU. OpenSearch Il servizio gestisce le istanze GPU per tuo conto, assegnandole al tuo dominio o alla tua raccolta quando necessario. Ciò significa che non gestisci l'utilizzo né paghi per i tempi di inattività.

Paghi solo per l'elaborazione utile tramite Compute Units (OCU) - Vector Acceleration. Ogni OCU di accelerazione vettoriale è una combinazione di circa 8 GiB di memoria CPU, 2 v CPUs e 6 GiB di memoria GPU. Per ulteriori informazioni, consulta [Prezzi dell'accelerazione GPU](#gpu-acceleration-pricing).

Per abilitare l'accelerazione GPU per il tuo dominio o la tua raccolta, consulta. [Abilitazione dell'accelerazione GPU](gpu-acceleration-enabling.md)

## Prezzi dell'accelerazione GPU
<a name="gpu-acceleration-pricing"></a>

AWS ti addebita quando OpenSearch rileva opportunità per accelerare i carichi di lavoro di creazione dell'indice del tuo dominio o della tua raccolta. Ogni OCU di accelerazione vettoriale è una combinazione di circa 8 GiB di memoria CPU, 2 v CPUs e 6 GiB di memoria GPU.

AWS fattura l'OCU con granularità di secondo livello. Nel tuo estratto conto, vedrai una voce relativa al calcolo in OCU-Hours.

Ad esempio, quando utilizzi l'accelerazione GPU per un'ora per creare un indice, utilizzando 2 vCPU e 1 GiB di memoria GPU, ti viene fatturato 1 OCU. Se utilizzi 9 GiB di memoria CPU mentre utilizzi l'accelerazione GPU, ti verranno fatturati 2 OCU.

OpenSearch Serverless ne aggiunge altre OCUs in incrementi di 1 OCU in base alla potenza di elaborazione e allo storage necessari per supportare le tue raccolte. Puoi configurare un numero massimo di OCUs per il tuo account per controllare i costi.

**Nota**  
Il numero di OCUs unità fornite in qualsiasi momento può variare e non è esatto. Nel tempo, l'algoritmo utilizzato da OpenSearch Serverless continuerà a migliorare per ridurre al minimo l'utilizzo del sistema. OpenSearch 

Per i dettagli completi sui prezzi, consulta la pagina [dei prezzi OpenSearch di Amazon Service](https://aws.amazon.com/opensearch-service/pricing/).

## Accelerazione tramite GPU e operazioni di scrittura
<a name="gpu-acceleration-write-operations"></a>

L'accelerazione GPU viene attivata quando la velocità di ingestione vettoriale ( OpenSearchMB/sec) rientra in un intervallo. [Sui OpenSearch domini, hai la flessibilità di configurare questo intervallo tramite e.](https://docs.opensearch.org/3.2/vector-search/remote-index-build/#using-the-remote-index-build-service) `index.knn.remote_index_build.size.min` `index.knn.remote_index_build.size.max` Ad esempio, con l'intervallo inferiore predefinito di 50 MB, la scrittura di 15.000 vettori a piena precisione con una dimensione di 768 tra gli [intervalli di aggiornamento](https://docs.aws.amazon.com/opensearch-service/latest/developerguide/bp.html#bp-perf) attiverà l'accelerazione GPU per impostazione predefinita.

I dati vengono scritti con le seguenti operazioni API:
+ [Flush](https://docs.opensearch.org/latest/api-reference/index-apis/flush/)
+ [Bulk](https://docs.opensearch.org/latest/api-reference/document-apis/bulk/)
+ [Reindicizzazione](https://docs.opensearch.org/latest/api-reference/document-apis/reindex/)
+ [Indice](https://docs.opensearch.org/latest/api-reference/index-apis/index/)
+ [Aggiorna](https://docs.opensearch.org/latest/api-reference/document-apis/update-document/)
+ [Elimina](https://docs.opensearch.org/latest/api-reference/document-apis/delete-document/)
+ [Unione forzata](https://docs.opensearch.org/latest/api-reference/index-apis/force-merge/)

[L'accelerazione GPU viene attivata con l'unione automatica e manuale dei segmenti.](https://docs.opensearch.org/latest/api-reference/index-apis/force-merge/)

## Configurazioni degli indici supportate
<a name="gpu-acceleration-index-configurations"></a>

Il motore [Faiss](https://docs.opensearch.org/latest/field-types/supported-field-types/knn-methods-engines/#faiss-engine) supporta l'accelerazione GPU.

Le seguenti configurazioni non supportano l'accelerazione GPU:
+ [Quantizzazione del prodotto Faiss](https://docs.opensearch.org/latest/vector-search/optimizing-storage/faiss-product-quantization/)
+ [Indice dei file invertito (IVF)](https://docs.opensearch.org/latest/field-types/supported-field-types/knn-methods-engines/#ivf-parameters)
+ [Libreria spaziale non metrica](https://docs.opensearch.org/latest/field-types/supported-field-types/knn-methods-engines/#nmslib-engine-deprecated)
+ [Motore Lucene](https://docs.opensearch.org/latest/field-types/supported-field-types/knn-methods-engines/#lucene-engine)

## Supportato Regioni AWS
<a name="gpu-acceleration-regions"></a>

L'accelerazione GPU è disponibile nelle seguenti versioni: Regioni AWS
+ Stati Uniti orientali (Virginia settentrionale)
+ Stati Uniti occidentali (Oregon)
+ Asia Pacifico (Sydney)
+ Asia Pacifico (Tokyo)
+ Europa (Irlanda)

## Best practice
<a name="gpu-acceleration-best-practices"></a>

Segui queste best practice per massimizzare i vantaggi dell'accelerazione GPU per i tuoi carichi di lavoro di ricerca vettoriale:
+ **Aumenta i client di indicizzazione**: per sfruttare appieno i vantaggi della creazione dell' GPUs indice, aumenta il numero di client di indicizzazione in cui vengono importati i dati. OpenSearch Ciò consente una migliore parallelizzazione e utilizzo delle risorse GPU.
+ **Regola la soglia approssimativa**: modifica l'`index.knn.advanced.approximate_threshold`impostazione per garantire che non si verifichino aumenti di indici di segmenti più piccoli, il che migliora la velocità complessiva di inserimento. Un valore di 10.000 è un buon punto di partenza. Per le raccolte, è necessario specificare esplicitamente un valore per questa impostazione.
+ **Ottimizza le dimensioni dei frammenti**: prova a creare frammenti contenenti almeno 1 milione di documenti. Gli shard con un numero di documenti inferiore a questo numero potrebbero non trarre benefici complessivi dall'accelerazione tramite GPU.