Überprüfen Sie die Standard-Instanztypen Überprüfen Sie die Standard-Hyperparameter Überprüfen Sie die Standard-Metrikdefinitionen

Die Feinabstimmung öffentlich verfügbarer Foundation-Modelle mithilfe der Klasse `JumpStartEstimator`

Sie können einen integrierten Algorithmus oder ein vortrainiertes Modell in nur wenigen Codezeilen feinabstimmen, indem Sie den SageMaker Python SDK.

Suchen Sie zunächst die Modell-ID für das Modell Ihrer Wahl in der Tabelle „Integrierte Algorithmen mit vortrainiertem Modell“.

Definieren Sie anhand der Modell-ID Ihren Trainingsjob als JumpStart Schätzer.


from sagemaker.jumpstart.estimator import JumpStartEstimator

model_id = "huggingface-textgeneration1-gpt-j-6b"
estimator = JumpStartEstimator(model_id=model_id)

Führen Sie estimator.fit() Ihr Modell aus und verweisen Sie dabei auf die Trainingsdaten, die für die Feinabstimmung verwendet werden sollen.
```
estimator.fit(
    {"train": training_dataset_s3_path, "validation": validation_dataset_s3_path}
)
```
Verwenden Sie dann die deploy Methode, um Ihr Modell automatisch für die Inferenz bereitzustellen. In diesem Beispiel verwenden wir das GPT-J 6B-Modell von Hugging Face.
```
predictor = estimator.deploy()
```

Anschließend können Sie mithilfe der Methode eine Inferenz mit dem bereitgestellten Modell ausführen. predict


question = "What is Southern California often abbreviated as?"
response = predictor.predict(question)
print(response)

Anmerkung

In diesem Beispiel wird das Foundation-Modell GPT-J 6B verwendet, das für eine Vielzahl von Anwendungsfällen zur Textgenerierung geeignet ist, darunter die Beantwortung von Fragen, Erkennung benannter Entitäten, Zusammenfassung und mehr. Weitere Informationen zu Modellanwendungsfällen finden Sie unter. Verfügbare Fundamentmodelle

Sie können optional Modellversionen oder Instanztypen angeben, wenn Sie Ihre erstellenJumpStartEstimator. Weitere Informationen zur JumpStartEstimator Klasse und ihren Parametern finden Sie unter JumpStartEstimator.

Überprüfen Sie die Standard-Instanztypen

Sie können bei der Feinabstimmung eines vortrainierten Modells mithilfe der Klasse optional bestimmte Modellversionen oder Instanztypen JumpStartEstimator einbeziehen. Alle JumpStart Modelle haben einen Standard-Instanztyp. Rufen Sie den Standard-Trainingsinstanztyp mit dem folgenden Code ab:


from sagemaker import instance_types

instance_type = instance_types.retrieve_default(
    model_id=model_id,
    model_version=model_version,
    scope="training")
print(instance_type)

Mit der instance_types.retrieve() Methode können Sie alle unterstützten Instanztypen für ein bestimmtes JumpStart Modell anzeigen.

Überprüfen Sie die Standard-Hyperparameter

Um die für das Training verwendeten Standard-Hyperparameter zu überprüfen, können Sie die retrieve_default() Methode aus der hyperparameters Klasse verwenden.


from sagemaker import hyperparameters

my_hyperparameters = hyperparameters.retrieve_default(model_id=model_id, model_version=model_version)
print(my_hyperparameters)

# Optionally override default hyperparameters for fine-tuning
my_hyperparameters["epoch"] = "3"
my_hyperparameters["per_device_train_batch_size"] = "4"

# Optionally validate hyperparameters for the model
hyperparameters.validate(model_id=model_id, model_version=model_version, hyperparameters=my_hyperparameters)

Weitere Informationen zu verfügbaren Hyperparametern finden Sie unter. Häufig unterstützte Feinabstimmung von Hyperparametern

Überprüfen Sie die Standard-Metrikdefinitionen

Sie können auch die standardmäßigen Metrikdefinitionen überprüfen:


print(metric_definitions.retrieve_default(model_id=model_id, model_version=model_version))

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

SageMaker Python SDK

Stellen Sie ein öffentliches Modell bereit

Die Feinabstimmung öffentlich verfügbarer Foundation-Modelle mithilfe der Klasse JumpStartEstimator

Anmerkung

Überprüfen Sie die Standard-Instanztypen

Überprüfen Sie die Standard-Hyperparameter

Überprüfen Sie die Standard-Metrikdefinitionen

Die Feinabstimmung öffentlich verfügbarer Foundation-Modelle mithilfe der Klasse `JumpStartEstimator`