SageMaker Compilatore di formazione FAQ - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

SageMaker Compilatore di formazione FAQ

Importante

Amazon Web Services (AWS) annuncia che non ci saranno nuove release o versioni di SageMaker Training Compiler. Puoi continuare a utilizzare SageMaker Training Compiler tramite gli esistenti AWS Deep Learning Containers (DLCs) for SageMaker Training. È importante notare che, sebbene gli esistenti DLCs rimangano accessibili, non riceveranno più patch o aggiornamenti da AWS, in conformità con la politica di supporto del AWS Deep Learning Containers Framework.

Utilizza i seguenti FAQ elementi per trovare le risposte alle domande più frequenti su SageMaker Training Compiler.

D: Come faccio a sapere se SageMaker Training Compiler funziona?

Se hai avviato con successo il tuo processo di formazione con SageMaker Training Compiler, ricevi i seguenti messaggi di registro:

  • Con TrainingCompilerConfig(debug=False)

    Found configuration for Training Compiler Configuring SM Training Compiler...
  • Con TrainingCompilerConfig(debug=True)

    Found configuration for Training Compiler Configuring SM Training Compiler... Training Compiler set to debug mode

D: Quali modelli accelera SageMaker Training Compiler?

SageMaker Training Compiler supporta i modelli di deep learning più diffusi della libreria Hugging Face transformers. Con la maggior parte degli operatori supportati dal compilatore, questi modelli possono essere addestrati più velocemente con Training Compiler. SageMaker I modelli compilabili includono, a titolo esemplificativo ma non esaustivo: bert-base-cased, bert-base-chinese, bert-base-uncased, distilbert-base-uncased, distilbert-base-uncased-finetuned-sst-2-english, gpt2, roberta-base, roberta-large, t5-base e xlm-roberta-base. Il compilatore funziona con la maggior parte degli operatori DL e delle strutture dati e può accelerare molti altri modelli DL, oltre a quelli testati.

D: Cosa succede se abilito SageMaker Training Compiler con un modello non testato?

Per un modello non testato, potrebbe essere necessario prima modificare lo script di addestramento per renderlo compatibile con Training Compiler. SageMaker Per ulteriori informazioni, consultare Portare il proprio modello di deep learning e seguire le istruzioni su come preparare lo script di addestramento.

Dopo aver aggiornato lo script di addestramento è possibile avviare il processo di addestramento. Il compilatore procede alla compilazione del modello. Tuttavia, la velocità di addestramento potrebbe non aumentare e potrebbe addirittura diminuire rispetto alla linea di base con un modello non testato. Potrebbe essere necessario regolare nuovamente i parametri di addestramento, ad esempio batch_size e learning_rate per ottenere vantaggi in termini di accelerazione.

Se la compilazione del modello non testato non riesce, il compilatore restituisce un errore. Per informazioni dettagliate sui tipi di errore e sui messaggi di errore, vedere SageMaker Risoluzione dei problemi del Training Compiler.

D: Con Training Compiler avrò sempre un lavoro di formazione più veloce? SageMaker

No, non necessariamente. Innanzitutto, SageMaker Training Compiler aggiunge un certo sovraccarico di compilazione prima che il processo di formazione in corso possa essere accelerato. Il processo di addestramento ottimizzato deve durare sufficientemente a lungo da ammortizzare e compensare questo sovraccarico di compilazione incrementale all'inizio del processo di addestramento.

Inoltre, come con qualsiasi processo di allenamento modello, l'allenamento con parametri non ottimali può aumentare i tempi di allenamento. SageMaker Training Compiler può modificare le caratteristiche del processo di formazione, ad esempio modificando l'impronta di memoria del lavoro. A causa di queste differenze, potrebbe essere necessario regolare nuovamente i parametri del processo di addestramento per velocizzarlo. Una tabella di riferimento che specifica i parametri con le migliori prestazioni per i processi di addestramento con diversi tipi e modelli di istanze è disponibile all'indirizzo. Modelli testati

Infine, parte del codice in uno script di addestramento potrebbe aggiungere ulteriore sovraccarico o interrompere il grafico di calcolo compilato e rallentare l'addestramento. Se utilizzi un modello personalizzato o non testato, consulta le istruzioni in Procedure consigliate per utilizzare Training Compiler con/ SageMaker PyTorchXLA.

D: Posso sempre usare batch di dimensioni maggiori con SageMaker Training Compiler?

Le dimensioni del batch aumentano nella maggior parte dei casi, ma non in tutti. Le ottimizzazioni effettuate da SageMaker Training Compiler possono modificare le caratteristiche del processo di formazione, come l'ingombro di memoria. In genere, un processo di Training Compiler occupa meno memoria rispetto a un processo di addestramento non compilato con il framework nativo, il che consente una dimensione del batch maggiore durante l'addestramento. Una dimensione del batch più grande e un corrispondente adeguamento del tasso di apprendimento aumentano la produttività dell'addestramento e possono ridurre il tempo totale di addestramento.

Tuttavia, potrebbero esserci casi in cui SageMaker Training Compiler potrebbe effettivamente aumentare l'ingombro di memoria in base al suo schema di ottimizzazione. Il compilatore utilizza un modello di costo analitico per prevedere il programma di esecuzione con il costo di esecuzione più basso per qualsiasi operatore che utilizza molte risorse di calcolo. Questo modello potrebbe trovare una pianificazione ottimale che aumenti l'utilizzo della memoria. In questo caso, non sarà possibile aumentare le dimensioni dei batch, ma la produttività del campione è ancora più elevata.

D: SageMaker Training Compiler funziona con altre funzionalità di formazione, come le librerie di SageMaker formazione distribuite per l' SageMaker intelligenza artificiale e Debugger? SageMaker

SageMaker Training Compiler attualmente non è compatibile con SageMaker le librerie di formazione distribuite di AI.

SageMaker Training Compiler è compatibile con SageMaker Debugger, ma Debugger potrebbe ridurre le prestazioni computazionali aggiungendo un sovraccarico.

D: SageMaker Training Compiler supporta contenitori personalizzati (portate il vostro contenitore)?

SageMaker Training Compiler viene fornito tramite AWS Deep Learning Containers ed è possibile estendere un sottoinsieme di contenitori per personalizzarlo in base al proprio caso d'uso. I contenitori estesi da AWS DLCs sono supportati da Training Compiler. SageMaker Per ulteriori informazioni, consulta Supported Frameworks e Utilizzo di SageMaker AI Python SDK e Extending SageMaker AI Framework Deep Learning Containers. Se hai bisogno di ulteriore assistenza, contatta il team di SageMaker intelligenza artificiale tramite AWS Support o AWS Developer Forums for Amazon SageMaker AI.