Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Ottimizzate i modelli di base disponibili pubblicamente con la classe JumpStartEstimator
È possibile ottimizzare un algoritmo integrato o un modello pre-addestrato in poche righe di codice utilizzando il SageMaker Python SDK.
-
Innanzitutto, trova l'ID del modello per il modello di tua scelta nella Tabella degli algoritmi incorporati con
modello preaddestrato. -
Utilizzando l'ID del modello, definisci il tuo lavoro di formazione come estimatore JumpStart.
from sagemaker.jumpstart.estimator import JumpStartEstimator model_id =
"huggingface-textgeneration1-gpt-j-6b"
estimator = JumpStartEstimator(model_id=model_id) -
Esegui
estimator.fit()
sul tuo modello, indicando i dati di addestramento da utilizzare per la messa a punto.estimator.fit( {"train":
training_dataset_s3_path
, "validation":validation_dataset_s3_path
} ) -
Quindi, utilizza il
deploy
metodo per distribuire automaticamente il modello per l'inferenza. In questo esempio, utilizziamo il modello GPT -J 6B di Hugging Face.predictor = estimator.deploy()
-
È quindi possibile eseguire l'inferenza con il modello distribuito utilizzando il metodo.
predict
question =
"What is Southern California often abbreviated as?"
response = predictor.predict(question) print(response)
Nota
Questo esempio utilizza il modello di base GPT -J 6B, adatto a un'ampia gamma di casi d'uso per la generazione di testo, tra cui la risposta a domande, il riconoscimento di entità denominate, il riepilogo e altro ancora. Per ulteriori informazioni sui casi d'uso del modello, vedere. Modelli di fondazione disponibili
Facoltativamente, puoi specificare le versioni del modello o i tipi di istanza durante la creazione del tuoJumpStartEstimator
. Per ulteriori informazioni sulla JumpStartEstimator
classe e i relativi parametri, consultate JumpStartEstimator
Controlla i tipi di istanza predefiniti
Facoltativamente, puoi includere versioni di modello o tipi di istanza specifici durante la messa a punto di un modello preaddestrato utilizzando la classe. JumpStartEstimator
Tutti i JumpStart modelli hanno un tipo di istanza predefinito. Recuperate il tipo di istanza di addestramento predefinito utilizzando il codice seguente:
from sagemaker import instance_types instance_type = instance_types.retrieve_default( model_id=model_id, model_version=model_version, scope=
"training"
) print(instance_type)
È possibile visualizzare tutti i tipi di istanza supportati per un determinato JumpStart modello con il instance_types.retrieve()
metodo.
Controlla gli iperparametri predefiniti
Per controllare gli iperparametri predefiniti utilizzati per l'allenamento, puoi usare il retrieve_default()
metodo della hyperparameters
classe.
from sagemaker import hyperparameters my_hyperparameters = hyperparameters.retrieve_default(model_id=model_id, model_version=model_version) print(my_hyperparameters) # Optionally override default hyperparameters for fine-tuning my_hyperparameters["epoch"] = "3" my_hyperparameters["per_device_train_batch_size"] = "4" # Optionally validate hyperparameters for the model hyperparameters.validate(model_id=model_id, model_version=model_version, hyperparameters=my_hyperparameters)
Per ulteriori informazioni sugli iperparametri disponibili, vedere. Iperparametri di regolazione fine comunemente supportati
Controlla le definizioni delle metriche predefinite
Puoi anche controllare le definizioni delle metriche predefinite:
print(metric_definitions.retrieve_default(model_id=model_id, model_version=model_version))