Perfeziona un modello linguistico di grandi dimensioni (LLM) utilizzando l'adattamento del dominio - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Perfeziona un modello linguistico di grandi dimensioni (LLM) utilizzando l'adattamento del dominio

L’ottimizzazione dell'adattamento del dominio consente di sfruttare modelli di fondazione preformati e adattarli ad attività specifiche utilizzando dati limitati specifici del dominio. Se un intervento di progettazione di prompt non consente una personalizzazione sufficiente, è possibile utilizzare l'ottimizzazione dell'adattamento del dominio per far funzionare il modello con un linguaggio specifico del dominio, ad esempio gergo di settore, termini tecnici o altri dati specializzati. Questo processo di ottimizzazione modifica i pesi del modello.

Per ottimizzare il modello su un set di dati specifico del dominio:

  1. Prepara i tuoi dati di allenamento. Per istruzioni, consulta Prepara e carica i dati di addestramento per la messa a punto dell'adattamento del dominio.

  2. Crea il tuo lavoro di formazione mirato. Per istruzioni, consulta Crea un processo di formazione per la messa a punto basata sulle istruzioni.

Puoi trovare end-to-end esempi in. Notebook di esempio

L’ottimizzazione dell'adattamento del dominio è disponibile con i seguenti modelli di fondazione:

Nota

Alcuni modelli JumpStart base, come Llama 2 7B, richiedono l'accettazione di un contratto di licenza con l'utente finale prima della messa a punto e dell'esecuzione dell'inferenza. Per ulteriori informazioni, consulta Contratti di licenza con l'utente finale.

  • Bloom 3B

  • Bloom 7B1

  • BloomZ 3B FP16

  • BloomZ 7B1 FP16

  • GPT-2 XL

  • GPT-J6B

  • GPT-Neo 1,3 B

  • GPT-Neo 125M

  • GPT- 2,7 GB NEO

  • Llama 2 13B

  • Llama 2 13B Chat

  • Neurone Llama 2 13B

  • Lama 2 70B

  • Llama 2 70B Chat

  • Lama 2 7B

  • Chat Llama 2 7B

  • Neurone Llama 2 7B

Prepara e carica i dati di addestramento per la messa a punto dell'adattamento del dominio

I dati di formazione per la messa a punto dell'adattamento del dominio possono essere forniti in o in CSV formato di file. JSON TXT Tutti i dati di addestramento devono essere contenuti in un unico file all'interno di un'unica cartella.

I dati di allenamento vengono presi dalla colonna Testo per i CSV nostri file di dati di JSON allenamento. Se nessuna colonna è etichettata come Testo, i dati di allenamento vengono presi dalla prima colonna per i nostri file CSV di dati di JSON allenamento.

Di seguito è riportato un esempio di corpo di un TXT file da utilizzare per la messa a punto:

This report includes estimates, projections, statements relating to our business plans, objectives, and expected operating results that are “forward- looking statements” within the meaning of the Private Securities Litigation Reform Act of 1995, Section 27A of the Securities Act of 1933, and Section 21E of ....

Suddividi i dati per l'addestramento e i test

Facoltativamente, puoi fornire un'altra cartella contenente i dati di convalida. Questa cartella deve includere anche uno CSV o TXT più file. JSON Se non viene fornito alcun set di dati di convalida, una determinata quantità di dati di addestramento viene riservata ai fini della convalida. È possibile regolare la percentuale di dati di addestramento utilizzati per la convalida quando si scelgono gli iperparametri per la messa a punto del modello.

Caricare dati di ottimizzazione su Amazon S3

Carica i dati preparati su Amazon Simple Storage Service (Amazon S3) per utilizzarli durante la messa JumpStart a punto di un modello base. Puoi utilizzare i seguenti comandi per caricare i tuoi dati:

from sagemaker.s3 import S3Uploader import sagemaker import random output_bucket = sagemaker.Session().default_bucket() local_data_file = "train.txt" train_data_location = f"s3://{output_bucket}/training_folder" S3Uploader.upload(local_data_file, train_data_location) S3Uploader.upload("template.json", train_data_location) print(f"Training data: {train_data_location}")

Crea un processo di formazione per la messa a punto basata sulle istruzioni

Dopo aver caricato i dati su Amazon S3, puoi perfezionare e distribuire il tuo modello di base. JumpStart Per perfezionare il modello in Studio, consulta. Perfeziona un modello in Studio Per perfezionare il modello utilizzando il SageMaker Python SDK, vedi. Ottimizzate i modelli di base disponibili pubblicamente con la classe JumpStartEstimator

Notebook di esempio

Per ulteriori informazioni sulla messa a punto dell'adattamento del dominio, consulta i seguenti notebook di esempio: