As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Importante
Em 30 de novembro de 2023, a interface do usuário do Autopilot está migrando para o Amazon SageMaker Canvas como parte da experiência atualizada do Amazon SageMaker Studio. SageMaker O Canvas fornece aos analistas e cientistas de dados cidadãos recursos sem código para tarefas como preparação de dados, engenharia de recursos, seleção de algoritmos, treinamento e ajuste, inferência e muito mais. Os usuários podem aproveitar visualizações integradas e análises hipotéticas para explorar seus dados e diferentes cenários, com predições automatizadas que permitem que eles produzam facilmente seus modelos. O Canvas é compatível com uma variedade de casos de uso, incluindo visão computacional, previsão de demanda, pesquisa inteligente e IA generativa.
Os usuários do Amazon SageMaker Studio Classic, a experiência anterior do Studio, podem continuar usando a interface do usuário do Autopilot no Studio Classic. Usuários com experiência em programação podem continuar usando todas as referências de API em qualquer SDK compatível para implementação técnica.
Se você usa o Autopilot no Studio Classic até agora e deseja migrar para o SageMaker Canvas, talvez seja necessário conceder permissões adicionais ao seu perfil de usuário ou função do IAM para poder criar e usar o aplicativo SageMaker Canvas. Para obter mais informações, consulte (Opcional) Migrar do piloto automático no Studio Classic para o Canvas SageMaker .
Todas as instruções relacionadas à interface do usuário neste guia se referem aos recursos autônomos do Autopilot antes da migração para o Amazon Canvas. SageMaker Os usuários que seguem essas instruções devem usar o Studio Classic.
O Amazon SageMaker Autopilot é um conjunto de recursos que simplifica e acelera vários estágios do fluxo de trabalho de aprendizado de máquina ao automatizar o processo de criação e implantação de modelos de aprendizado de máquina (AutoML). A página a seguir explica as principais informações sobre o Amazon SageMaker Autopilot.
O Autopilot executa as seguintes tarefas principais que você pode usar no Autopilot ou com vários graus de orientação humana:
-
Análise e pré-processamento de dados: o Autopilot identifica seu tipo de problema específico, processa valores ausentes, normaliza seus dados, seleciona atributos e, em geral, prepara os dados para o treinamento de modelos.
-
Seleção de modelos: o Autopilot explora uma variedade de algoritmos e usa uma técnica de reamostragem de validação cruzada para gerar métricas que avaliam a qualidade preditiva dos algoritmos com base em métricas objetivas predefinidas.
-
Otimização de hiperparâmetros: o Autopilot automatiza a busca por configurações ideais de hiperparâmetros.
-
Treinamento de modelo e avaliação: o Autopilot automatiza o processo de treinamento e avaliação de vários modelos candidatos. Ele divide os dados em conjuntos de treinamento e validação, treina os candidatos ao modelo selecionados usando os dados de treinamento e avalia seu desempenho com base nos dados não vistos no conjunto de validação. Por fim, ele classifica os candidatos a modelos otimizados com base em seu desempenho e identifica o modelo com melhor performance.
-
Implantação do modelo: Após o Autopilot ter identificado o modelo com melhor performance, oferece a opção de implantar o modelo automaticamente gerando os artefatos do modelo e o endpoint expondo uma API. Aplicações externas podem enviar dados para o endpoint e receber as predições ou inferências correspondentes.
O piloto automático oferece suporte à criação de modelos de aprendizado de máquina em grandes conjuntos de dados de até centenas de. GBs
A seguir, o diagrama delineia as tarefas deste processo do AutoML gerenciado pelo Autopilot.

Dependendo do seu nível de conforto com o processo de machine learning e sua experiência em codificação, você pode usar o Autopilot de diferentes maneiras:
-
Uso da interface do usuário do Studio Classic, os usuários podem escolher entre uma experiência sem código ou ter algum nível de contribuição humana.
nota
Somente experimentos criados a partir de dados tabulares para tipos de problemas, como regressão ou classificação, estão disponíveis por meio da interface do usuário do Studio Classic.
-
Usando a API AutoML, os usuários com experiência em codificação podem usar o Available para SDKs criar trabalhos do AutoML. Essa abordagem oferece maior flexibilidade e opções de personalização e está disponível para todos os tipos de problemas.
Atualmente, o Autopilot oferece apoio aos seguintes tipos de problemas:
nota
Para problemas de regressão ou classificação envolvendo dados tabulares, os usuários podem escolher entre duas opções: usar a interface de usuário do Studio Classic ou as Referências da API.
Tarefas como classificação de texto e imagem, previsão de séries temporais e ajuste de grandes modelos de linguagem estão disponíveis exclusivamente na versão 2 da API REST do AutoML. Se sua linguagem preferida for Python, você pode se referir diretamente ao AWS SDK for Python (Boto3) MLV2
Os usuários que preferem a conveniência de uma interface de usuário podem usar o Amazon SageMaker Canvas para acessar modelos pré-treinados e modelos básicos de IA generativos, ou criar modelos personalizados para textos específicos, classificação de imagens, necessidades de previsão ou IA generativa.
-
Classificação multiclasse, de regressão e binária com dados tabulares formatados como arquivos CSV ou Parquet, nos quais cada coluna contém um atributo com um tipo de dados específico e cada linha contém uma observação. Os tipos de dados de coluna aceitos incluem séries numéricas, categóricas, de texto e temporais que consistem em sequências de números separados por vírgulas.
-
Para criar um trabalho de piloto automático como um experimento piloto usando a referência da SageMaker API, consulteCrie trabalhos de regressão ou classificação para dados tabulares com a API do AutoML.
-
Para criar um trabalho no Autopilot como um experimento piloto usando a interface do usuário do Studio Classic, consulte Crie um experimento de Regressão ou de Classificação do Autopilot com os dados tabulares usando a interface do usuário do Studio Classic.
-
Se você for um administrador que deseja pré-configurar a infraestrutura padrão, a rede ou os parâmetros de segurança dos experimentos do Autopilot na interface do usuário do Studio Classic, consulte Configurar os parâmetros padrão de um experimento do Autopilot (para administradores).
-
-
Classificação de texto com formato de dados como arquivos CSV ou Parquet nos quais uma coluna fornece as frases a serem classificadas, enquanto outra coluna deve fornecer o rótulo da classe correspondente. Consulte Crie um trabalho de AutoML para classificação de texto com a API.
-
Classificação de imagens com formatos de imagens como PNG, JPEG ou uma combinação de ambos. Consulte Crie um trabalho de classificação de imagens usando a API AutoML.
-
Previsão de séries temporais com dados de séries temporais formatados como arquivos CSV ou Parquet. Consulte Crie um trabalho de AutoML para previsão de séries temporais com a API.
-
Ajuste fino de modelos de linguagem grandes (LLMs) para geração de texto com dados formatados como arquivos CSV ou Parquet.Consulte. Crie uma tarefa do AutoML para ajustar os modelos de geração de texto usando a API
Além disso, o Autopilot ajuda os usuários a entender como os modelos fazem predições, gerando relatórios automaticamente que mostram a importância de cada atributo individual. Isso fornece transparência e insights sobre os fatores que influenciam as predições, que podem ser usados por equipes de risco e conformidade e por reguladores externos. O Autopilot também fornece um relatório de desempenho do modelo que engloba um resumo das métricas de avaliação, uma matriz de confusão, várias visualizações, como curvas características operacionais do receptor e curvas de recuperação de precisão e muito mais. O conteúdo específico de cada relatório varia de acordo com o tipo de problema do experimento do Autopilot.
Os relatórios de desempenho e explicabilidade do melhor modelo candidato em um experimento do Autopilot estão disponíveis para os tipos de problemas de classificação de dados tabulares, texto e imagem.
Para casos de uso de dados tabulares como regressão ou classificação, o Autopilot oferece visibilidade adicional sobre como os dados foram organizados e como os modelos candidatos foram selecionados, treinados e ajustados, gerando cadernos que contêm o código usado para explorar os dados e encontrar o modelo com melhor desempenho. Esses cadernos fornecem um ambiente interativo e exploratório para ajudar você a aprender sobre o impacto de várias entradas ou as compensações feitas nos experimentos. Você pode experimentar ainda mais com o modelo candidato de maior desempenho fazendo suas próprias modificações nos cadernos de exploração de dados e definição de candidatos fornecidos pelo Autopilot.
Com a Amazon SageMaker AI, você paga somente pelo que usa. Você paga pelos recursos subjacentes de computação e armazenamento dentro da SageMaker IA ou de outros AWS serviços, com base no seu uso. Para obter mais informações sobre o custo do uso da SageMaker IA, consulte Amazon SageMaker AI Pricing
Tópicos
- Crie trabalhos de regressão ou classificação para dados tabulares com a API do AutoML
- Crie um trabalho de classificação de imagens usando a API AutoML
- Crie um trabalho de AutoML para classificação de texto com a API
- Crie um trabalho de AutoML para previsão de séries temporais com a API
- Crie uma tarefa do AutoML para ajustar os modelos de geração de texto usando a API
- Crie um experimento de Regressão ou de Classificação do Autopilot com os dados tabulares usando a interface do usuário do Studio Classic
- Notebooks de exemplo do Amazon SageMaker Autopilot
- Vídeos: Usar o Autopilot para automatizar e explorar o processo de machine learning
- Tutoriais: Comece a usar o Amazon Autopilot SageMaker
- Cotas do Autopilot
- Guia de referência da API do Autopilot