Ottimizzate i modelli di base disponibili pubblicamente con la classe JumpStartEstimator - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Ottimizzate i modelli di base disponibili pubblicamente con la classe JumpStartEstimator

È possibile ottimizzare un algoritmo integrato o un modello pre-addestrato in poche righe di codice utilizzando il SageMaker Python SDK.

  1. Innanzitutto, trova l'ID del modello per il modello di tua scelta nella Tabella degli algoritmi incorporati con modello preaddestrato.

  2. Utilizzando l'ID del modello, definisci il tuo lavoro di formazione come estimatore JumpStart.

    from sagemaker.jumpstart.estimator import JumpStartEstimator model_id = "huggingface-textgeneration1-gpt-j-6b" estimator = JumpStartEstimator(model_id=model_id)
  3. Esegui estimator.fit() sul tuo modello, indicando i dati di addestramento da utilizzare per la messa a punto.

    estimator.fit( {"train": training_dataset_s3_path, "validation": validation_dataset_s3_path} )
  4. Quindi, utilizza il deploy metodo per distribuire automaticamente il modello per l'inferenza. In questo esempio, utilizziamo il modello GPT -J 6B di Hugging Face.

    predictor = estimator.deploy()
  5. È quindi possibile eseguire l'inferenza con il modello distribuito utilizzando il metodo. predict

    question = "What is Southern California often abbreviated as?" response = predictor.predict(question) print(response)
Nota

Questo esempio utilizza il modello di base GPT -J 6B, adatto a un'ampia gamma di casi d'uso per la generazione di testo, tra cui la risposta a domande, il riconoscimento di entità denominate, il riepilogo e altro ancora. Per ulteriori informazioni sui casi d'uso del modello, vedere. Modelli di fondazione disponibili

Facoltativamente, puoi specificare le versioni del modello o i tipi di istanza durante la creazione del tuoJumpStartEstimator. Per ulteriori informazioni sulla JumpStartEstimator classe e i relativi parametri, consultate JumpStartEstimator.

Controlla i tipi di istanza predefiniti

Facoltativamente, puoi includere versioni di modello o tipi di istanza specifici durante la messa a punto di un modello preaddestrato utilizzando la classe. JumpStartEstimator Tutti i JumpStart modelli hanno un tipo di istanza predefinito. Recuperate il tipo di istanza di addestramento predefinito utilizzando il codice seguente:

from sagemaker import instance_types instance_type = instance_types.retrieve_default( model_id=model_id, model_version=model_version, scope="training") print(instance_type)

È possibile visualizzare tutti i tipi di istanza supportati per un determinato JumpStart modello con il instance_types.retrieve() metodo.

Controlla gli iperparametri predefiniti

Per controllare gli iperparametri predefiniti utilizzati per l'allenamento, puoi usare il retrieve_default() metodo della hyperparameters classe.

from sagemaker import hyperparameters my_hyperparameters = hyperparameters.retrieve_default(model_id=model_id, model_version=model_version) print(my_hyperparameters) # Optionally override default hyperparameters for fine-tuning my_hyperparameters["epoch"] = "3" my_hyperparameters["per_device_train_batch_size"] = "4" # Optionally validate hyperparameters for the model hyperparameters.validate(model_id=model_id, model_version=model_version, hyperparameters=my_hyperparameters)

Per ulteriori informazioni sugli iperparametri disponibili, vedere. Iperparametri di regolazione fine comunemente supportati

Controlla le definizioni delle metriche predefinite

Puoi anche controllare le definizioni delle metriche predefinite:

print(metric_definitions.retrieve_default(model_id=model_id, model_version=model_version))