Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Iperparametri di classificazione delle immagini
Gli iperparametri sono parametri impostati prima che un modello di machine learning inizi l'apprendimento. I seguenti iperparametri sono supportati dall'algoritmo di classificazione delle immagini SageMaker integrato di Amazon. Per informazioni sull'ottimizzazione della classificazione delle immagini, consulta Ottimizzazione di un modello di classificazione delle immagini.
Nome parametro | Descrizione |
---|---|
num_classes |
Numero di classi di output. Questo parametro definisce le dimensioni dell'output di rete e in genere viene impostato sul numero di classi nel set di dati. Oltre alla classificazione multi-classe, è supportata anche la classificazione multi-etichetta. Fare riferimento Interfaccia di input/output per l'algoritmo di classificazione immagine per i dettagli su come utilizzare la classificazione multi-etichetta con i file manifest aumentati. Campo obbligatorio Valori validi: numeri interi positivi |
num_training_samples |
Numero di esempi di addestramento nel set di dati di input. Se non c'è corrispondenza tra questo valore e il numero di esempi nel set di dati di addestramento, il comportamento del parametro Campo obbligatorio Valori validi: numeri interi positivi |
augmentation_type |
Tipo di ottimizzazione dei dati. Le immagini di input possono essere ottimizzate in diversi modi, come specificato di seguito.
Opzionale Valori validi: Valore predefinito: nessuno |
beta_1 |
Il beta1 per Opzionale Valori validi: float. Intervallo in [0, 1]. Valore predefinito: 0,9 |
beta_2 |
Il beta2 per Opzionale Valori validi: float. Intervallo in [0, 1]. Valore predefinito: 0,999 |
checkpoint_frequency |
Periodo per archiviare i parametri del modello (in numero di epoche (Unix epochs)). Notare che tutti i file checkpoint vengono salvati come parte del file di modello finale "model.tar.gz" e caricati su S3 nella posizione del modello specificata. Ciò aumenta la dimensione del file del modello proporzionalmente al numero di checkpoint salvati durante l’addestramento. Opzionale Valori validi: numeri interi positivi non superiori a Valore predefinito: nessuno (salva checkpoint all'epoca (Unix epoch) che ha la migliore accuratezza di convalida). |
early_stopping |
Opzionale Valori validi: Valore predefinito: |
early_stopping_min_epochs |
Il numero minimo di epoche (Unix epochs) che devono essere eseguite prima di poter richiamare la logica di arresto precoce. Usato solo quando Opzionale Valori validi: numeri interi positivi Valore predefinito: 10 |
early_stopping_patience |
Il numero di epoche (Unix epochs) da aspettare prima di terminare l’addestramento se non verranno eseguiti dei miglioramenti nel parametro rilevante. Usato solo quando Opzionale Valori validi: numeri interi positivi Valore predefinito: 5 |
early_stopping_tolerance |
Tolleranza relativa per misurare un miglioramento nel parametro di convalida accuratezza. Se il rapporto tra il miglioramento nell'accuratezza, diviso per l'accuratezza migliore precedente è inferiore al valore Opzionale Valori validi: 0 ≤ float ≤ 1 Valore predefinito: 0.0 |
epochs |
Numero di epoche (Unix epochs) di addestramento. Opzionale Valori validi: numeri interi positivi Valore predefinito: 30 |
eps |
L'epsilon per Opzionale Valori validi: float. Intervallo in [0, 1]. Valore predefinito: 1e-8 |
gamma |
Il gamma per Opzionale Valori validi: float. Intervallo in [0, 1]. Valore predefinito: 0,9 |
image_shape |
Le dimensioni dell'immagine di input, che corrispondono alle dimensioni del livello di input della rete. Il formato è definito come " Per quanto riguarda l'addestramento, se un'immagine di input è più piccola di questo parametro in qualsiasi dimensione, l'addestramento ha un esito negativo. Se un'immagine è più grande, una parte dell'immagine viene tagliata, con l'area tagliata specificata da questo parametro. Se l'iperparametro In caso di inferenza, le immagini di input vengono ridimensionate a Opzionale Valori validi: stringa Valore di default: "3.224.224" |
kv_store |
Modalità di sincronizzazione di aggiornamento del peso durante l’addestramento distribuito. Gli aggiornamenti del peso possono essere eseguiti in modo sincrono o asincrono sulle macchine. Gli aggiornamenti sincroni in genere offrono accuratezza migliore rispetto agli aggiornamenti asincroni ma possono essere più lenti. Vedi la formazione distribuita in MXNet per maggiori dettagli. Questo parametro non è applicabile all’addestramento a singola macchina.
Opzionale Valori validi: Valore predefinito: nessuno |
learning_rate |
Velocità di apprendimento iniziale. Opzionale Valori validi: float. Intervallo in [0, 1]. Valore predefinito: 0,1 |
lr_scheduler_factor |
Il rapporto per ridurre il tasso di apprendimento utilizzato in combinazione con il parametro Opzionale Valori validi: float. Intervallo in [0, 1]. Valore predefinito: 0,1 |
lr_scheduler_step |
Le epoche (Unix epochs) in base alle quali ridurre la velocità di apprendimento. Come spiegato nel parametro Opzionale Valori validi: stringa Valore predefinito: nessuno |
mini_batch_size |
Le dimensioni del batch per l’addestramento. In un'GPUimpostazione multipla su una singola macchina, ciascuna GPU gestisce esempi di addestramento Opzionale Valori validi: numeri interi positivi Valore predefinito: 32 |
momentum |
Il momento per Opzionale Valori validi: float. Intervallo in [0, 1]. Valore predefinito: 0,9 |
multi_label |
Flag da utilizzare per la classificazione multi-etichetta, in cui ogni esempio può essere assegnato a più etichette. Viene registrata l'accuratezza media per tutte le classi. Opzionale Valori validi: 0 o 1 Valore predefinito: 0 |
num_layers |
Numero di livelli per la rete. Per dati con immagini di grandi dimensioni (ad esempio, 224x224, simili ImageNet), suggeriamo di selezionare il numero di livelli dal set [18, 34, 50, 101, 152, 200]. Per dati con immagini di dimensioni ridotte (ad esempio, 28x28, similiCIFAR), suggeriamo di selezionare il numero di livelli dal set [20, 32, 44, 56, 110]. Il numero di strati in ogni set dipende dal tipo di ResNet carta. Per il trasferimento dell'apprendimento, il numero di livelli definisce l'architettura della rete di base e, di conseguenza, può essere selezionata solo dal set [18, 34, 50, 101, 152, 200]. Opzionale Valori validi: numeri interi positivi in [18, 34, 50, 101, 152, 200] o [20, 32, 44, 56, 110] Valore predefinito: 152 |
optimizer |
Il tipo di ottimizzazione. Per maggiori dettagli sui parametri per gli ottimizzatori, consulta MXNet'sAPI. Opzionale Valori validi: uno tra Valore predefinito: |
precision_dtype |
La precisione dei pesi usati per l’addestramento. L'algoritmo può utilizzare la precisione singola ( Opzionale Valori validi: Valore predefinito: |
resize |
Numero di pixel sul lato più corto di un'immagine dopo averla ridimensionata per l'addestramento. Se il parametro non è impostato, i dati di addestramento vengono utilizzati come tali senza ridimensionamento. Il parametro dovrebbe essere maggiore dei componenti relativi alla larghezza e all'altezza di Obbligatorio quando si utilizzano tipi di contenuto immagine Facoltativo quando si utilizza il tipo di contenuto RecordIO Valori validi: numeri interi positivi Valore predefinito: nessuno |
top_k |
Segnala l'accuratezza top-k durante l’addestramento. Questo parametro deve essere maggiore di 1, poiché l'accuratezza top-1 dell’addestramento corrisponde all'accuratezza regolare di addestramento che è già stata segnalata. Opzionale Valori validi: numeri interi positivi superiori a 1. Valore predefinito: nessuno |
use_pretrained_model |
Appone un flag per utilizzare per l’addestramento un modello precedentemente addestrato. Se impostato su 1, il modello pre-addestrato con il numero corrispondente di livelli viene caricato e utilizzato per l’addestramento. Solo il primo livello FC viene inizializzato nuovamente con pesi casuali. Altrimenti, la rete viene preparata da zero. Opzionale Valori validi: 0 o 1 Valore predefinito: 0 |
use_weighted_loss |
Contrassegna per utilizzare la perdita di entropia incrociata ponderata per la classificazione multi-etichetta (utilizzata solo quando Opzionale Valori validi: 0 o 1 Valore predefinito: 0 |
weight_decay |
Il coefficiente di decadimento peso per Opzionale Valori validi: float. Intervallo in [0, 1]. Valore predefinito: 0.0001 |