Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Restrizioni e quote di servizio per i prodotti di machine learning in Marketplace AWS
Questa sezione descrive le restrizioni e le quote sui tuoi prodotti di machine learning (ML) in. Marketplace AWS
Argomenti
- Isolamento della rete
- Dimensione dell’immagine
- Dimensioni dell'archiviazione
- Dimensioni istanza
- Dimensione del payload per l'inferenza
- Tempo di elaborazione per l'inferenza
- Quote del servizio
- Inferenza asincrona
- Inferenza serverless
- Addestramento spot gestito
- Immagini Docker e Account AWS
- Pubblicazione di pacchetti di modelli da algoritmi integrati o Marketplace AWS
- Supportato per la pubblicazione Regioni AWS
Isolamento della rete
Per motivi di sicurezza, quando un acquirente sottoscrive un abbonamento al tuo prodotto containerizzato, i contenitori Docker vengono eseguiti in un ambiente isolato senza accesso alla rete. Quando crei i contenitori, non fare affidamento sulle chiamate in uscita su Internet perché falliranno. Anche le chiamate a Servizi AWS avranno esito negativo.
Dimensione dell’immagine
La dimensione dell'immagine Docker è regolata dalle quote del servizio Amazon Elastic Container Registry (AmazonECR). La dimensione dell'immagine Docker influisce sul tempo di avvio durante i processi di formazione, i lavori di trasformazione in batch e la creazione degli endpoint. Per prestazioni migliori, mantieni una dimensione ottimale dell'immagine Docker.
Dimensioni dell'archiviazione
Quando crei un endpoint, Amazon SageMaker collega un volume di storage Amazon Elastic Block Store EBS (Amazon) a ogni istanza di calcolo ML che ospita l'endpoint. (Un endpoint è anche noto come inferenza in tempo reale o servizio di SageMaker hosting Amazon.) Le dimensioni del volume di storage dipendono dal tipo di istanza. Per ulteriori informazioni, consulta Host Instance Storage Volumes nella Amazon SageMaker Developer Guide.
Per la trasformazione in batch, consulta Storage in Batch Transform nella Amazon SageMaker Developer Guide.
Dimensioni istanza
SageMaker offre una selezione di tipi di istanze ottimizzati per adattarsi a diversi casi d'uso ML. I tipi di istanza sono costituiti da diverse combinazioni di CPU memoria e capacità di rete. GPU I tipi di istanze offrono la flessibilità necessaria per scegliere la combinazione appropriata di risorse per la creazione, la formazione e l'implementazione dei modelli di machine learning. Per ulteriori informazioni, consulta la sezione Tipi di istanze Amazon SageMaker ML
Dimensione del payload per l'inferenza
Per un endpoint, limita la dimensione massima dei dati di input per chiamata a 6 MB. Questo valore non può essere modificato.
Per la trasformazione in batch, la dimensione massima dei dati di input per chiamata è 100 MB. Questo valore non può essere modificato.
Tempo di elaborazione per l'inferenza
Per un endpoint, il tempo massimo di elaborazione per chiamata è di 60 secondi. Questo valore non può essere modificato.
Per la trasformazione in batch, il tempo massimo di elaborazione per chiamata è di 60 minuti. Questo valore non può essere modificato.
Quote del servizio
Per ulteriori informazioni sulle quote relative alla formazione e all'inferenza, consulta Amazon Service SageMaker Quotas.
Inferenza asincrona
I pacchetti di modelli e gli algoritmi pubblicati in non Marketplace AWS possono essere distribuiti su endpoint configurati per Amazon SageMaker Asynchronous Inference. Gli endpoint configurati per l'inferenza asincrona richiedono che i modelli dispongano di connettività di rete. Tutti i Marketplace AWS modelli funzionano in isolamento di rete. Per ulteriori informazioni, vedere Nessun accesso alla rete.
Inferenza serverless
I pacchetti di modelli e gli algoritmi pubblicati in non Marketplace AWS possono essere distribuiti su endpoint configurati per Amazon SageMaker Serverless Inference. Gli endpoint configurati per l'inferenza senza server richiedono che i modelli dispongano di connettività di rete. Tutti i Marketplace AWS modelli funzionano in isolamento di rete. Per ulteriori informazioni, vedere Nessun accesso alla rete.
Addestramento spot gestito
Per tutti gli algoritmi di Marketplace AWS, il valore di MaxWaitTimeInSeconds
è impostato su 3.600 secondi (60 minuti), anche se è implementato il checkpoint per l'addestramento in loco gestito. Questo valore non può essere modificato.
Immagini Docker e Account AWS
Per la pubblicazione, le immagini devono essere archiviate negli ECR archivi Amazon di proprietà Account AWS del venditore. Non è possibile pubblicare immagini archiviate in un archivio di proprietà di un altro. Account AWS
Pubblicazione di pacchetti di modelli da algoritmi integrati o Marketplace AWS
I pacchetti modello creati da lavori di formazione utilizzando un algoritmo SageMaker integrato di Amazon o un algoritmo da un Marketplace AWS abbonamento non possono essere pubblicati.
Puoi comunque utilizzare gli artefatti del modello derivanti dal processo di formazione, ma per la pubblicazione dei pacchetti di modelli è necessaria la tua immagine di inferenza.
Supportato per la pubblicazione Regioni AWS
Marketplace AWS supporta il pacchetto del modello di pubblicazione e le risorse dell'algoritmo, Regioni AWS in base alle quali sono entrambi validi quanto segue:
-
Una regione SageMakersupportata da Amazon
-
Una regione disponibile
che viene attivata per impostazione predefinita (ad esempio, restituisce describe-regions) "OptInStatus": "opt-in-not-required"
Tutte le risorse necessarie per la pubblicazione di un pacchetto modello o di un prodotto algoritmico devono essere archiviate nella stessa regione da cui scegliete di pubblicare. Questo include gli output seguenti:
-
Pacchetti modello e risorse di algoritmi creati in Amazon SageMaker
-
Immagini di inferenza e addestramento caricate negli archivi Amazon ECR
-
Elementi del modello (se presenti) archiviati in Amazon Simple Storage Service (Amazon S3) e caricati dinamicamente durante la distribuzione del modello per le risorse del pacchetto modello
-
Dati di test per la convalida dell'inferenza e dell'addestramento archiviati in Amazon S3
Puoi sviluppare e addestrare il tuo prodotto in qualsiasi regione supportata da. SageMaker Tuttavia, prima di poter pubblicare, è necessario copiare tutte le risorse e ricreare le risorse in una regione da cui è Marketplace AWS supportata la pubblicazione.
Durante il processo di pubblicazione, indipendentemente dalla fonte da Regione AWS cui pubblichi, puoi scegliere le regioni in cui desideri pubblicare e in cui rendere disponibile il prodotto.