Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Come funziona SageMaker lo smart sifting
L'obiettivo dello SageMaker smart sifting è quello di esaminare i dati di allenamento durante il processo di addestramento e fornire al modello solo campioni più informativi. Durante l'allenamento tipico con PyTorch, i dati vengono inviati iterativamente in batch al ciclo di allenamento e ai dispositivi di accelerazione (come i GPUs chip Trainium) dal. PyTorchDataLoader
Il diagramma seguente mostra una panoramica di come è progettato l'algoritmo SageMaker smart sifting.
In breve, lo SageMaker smart sifting funziona durante l'allenamento man mano che i dati vengono caricati. L'algoritmo SageMaker smart sifting esegue il calcolo delle perdite su più batch ed elimina i dati non migliorativi prima del passaggio avanti e indietro di ogni iterazione. Il batch di dati raffinato viene quindi utilizzato per il passaggio in avanti e all'indietro.
Nota
Il setacciamento intelligente dei dati sull' SageMaker intelligenza artificiale utilizza passaggi in avanti aggiuntivi per analizzare e filtrare i dati di allenamento. A sua volta, si registrano meno passaggi all'indietro, in quanto i dati con un impatto minore vengono esclusi dal processo di formazione. Per questo motivo, i modelli con passaggi all'indietro lunghi o costosi ottengono i maggiori vantaggi in termini di efficienza quando utilizzano lo smart sifting. Al contrario, se il passaggio in avanti del modello richiede più tempo rispetto al passaggio all'indietro, l'overhead potrebbe aumentare il tempo totale di allenamento. Per misurare il tempo impiegato per ogni passaggio, è possibile eseguire un processo di formazione pilota e raccogliere registri che registrano il tempo impiegato nei processi. Considerate anche l'utilizzo di SageMaker Profiler, che fornisce strumenti di profilazione e un'applicazione per l'interfaccia utente. Per ulteriori informazioni, consulta Amazon SageMaker Profiler.
SageMaker smart sifting è ideale per lavori di formazione PyTorch basati sul classico parallelismo distribuito dei dati, che riproduce i modelli su ogni lavoratore ed esegue le stesse prestazioni. GPU AllReduce
Funziona con PyTorch DDP e con la libreria parallela di dati distribuiti di SageMaker intelligenza artificiale.