Criar um modelo de ML - Amazon Machine Learning

Não estamos mais atualizando o serviço Amazon Machine Learning nem aceitando novos usuários para ele. Essa documentação está disponível para usuários existentes, mas não estamos mais atualizando-a. Para obter mais informações, consulte O que é o Amazon Machine Learning.

Criar um modelo de ML

Depois de criar uma fonte de dados, você está pronto para criar um modelo de ML. Se você usar o console do Amazon Machine Learning para criar um modelo, pode usar as configurações padrão ou personalizar o modelo aplicando opções personalizadas.

As opções personalizadas incluem:

  • Configurações de avaliação: o Amazon ML pode reservar uma parte dos dados de entrada para avaliar a qualidade preditiva do modelo de ML. Para obter informações sobre avaliações, consulte Avaliar modelos de ML.

  • Uma receita: uma receita informa ao Amazon ML quais atributos e transformações de atributos estão disponíveis para treinamento de modelos. Para obter informações sobre receitas do Amazon ML, consulte Transformações de recursos com receitas de dados.

  • Parâmetros de treinamento: os parâmetros controlam determinadas propriedades do processo de treinamento e do modelo de ML resultante. Para obter mais informações sobre parâmetros de treinamento, consulte Parâmetros de treinamento.

Para selecionar ou especificar valores para essas configurações, escolha a opção Custom (Personalizar) ao usar o assistente Create ML Model (Criar modelo de ML). Se quiser que o Amazon ML aplique as configurações padrão, escolha Padrão.

Quando você cria um modelo de ML, o Amazon ML seleciona o tipo de algoritmo de aprendizagem que usará de acordo com o tipo de atributo do atributo de destino. (O atributo de destino é o atributo que contém as respostas "corretas".) Se o atributo de destino for binário, o Amazon ML vai criar um modelo de classificação binária, que usa um algoritmo de regressão logística. Se o atributo de destino é categórico, o Amazon ML cria um modelo de classificação multiclasse, que usa um algoritmo de regressão logística multinomial. Se o atributo de destino é numérico, o Amazon ML cria um modelo de regressão, que usa um algoritmo de regressão linear.

Pré-requisitos

Antes de usar o console do Amazon ML para criar um modelo de ML, você precisa criar duas fontes de dados: uma para treinar o modelo e outra para avaliá-lo. Se você não tiver criado duas fontes de dados, consulte Etapa 2: Criar uma fonte de dados de treinamento no tutorial.

Criar um modelo de ML com opções padrão

Escolha as opções Padrão se quiser que o Amazon ML:

  • Divida os dados de entrada para usar os primeiros 70 por cento para treinamento e os 30 por cento restantes para avaliação

  • Sugira uma receita com base nas estatísticas coletadas na fonte de dados de treinamento, que são 70 por cento da fonte de dados de entrada

  • Escolha os parâmetros de treinamento padrão

Para escolher opções padrão
  1. No console do Amazon ML, escolha Amazon Machine Learning e, em seguida, escolha Modelos de ML.

  2. Na página de resumo ML models (Modelos de ML), escolha Create a new ML model (Criar um novo modelo de ML).

  3. Na página Input data (Dados de entrada), selecione I already created a datasource pointing to my S3 data (Já criei uma fonte de dados para meus dados do S3).

  4. Na tabela, escolha a fonte de dados e, em seguida, Continue (Continuar).

  5. Na página ML model settings (Configurações do modelo de ML), em ML model name (Nome do modelo de ML), digite um nome para o modelo de ML.

  6. Em Training and evaluation settings (Configurações de treinamento e avaliação), selecione Default (Padrão).

  7. Em Nomear esta avaliação, digite um nome para a avaliação e escolha Revisar. O Amazon ML ignora o restante do assistente e apresenta a página Revisar.

  8. Examine seus dados, exclua todas as tags copiadas da fonte de dados que não deseja aplicar ao modelo e às avaliações e, em seguida, escolha Finish (Concluir).

Criar um modelo de ML com opções personalizadas

A personalização do modelo de ML permite que você:

  • Forneça a sua própria receita. Para obter mais informações sobre como fornecer sua própria receita, consulte Referência de formato de receita.

  • Escolha parâmetros de treinamento. Para obter mais informações sobre parâmetros de treinamento, consulte Parâmetros de treinamento.

  • Escolha uma taxa de divisão entre treinamento/avaliação diferente da proporção padrão de 70/30 ou forneça outra fonte de dados que já esteja preparada para avaliação. Para obter informações sobre estratégias de divisão, consulte Dividir dados.

Você também pode escolher os valores padrão para qualquer uma dessas configurações.

Se você já tiver criado um modelo usando as opções padrão e desejar melhorar o desempenho preditivo do modelo, use a opção Custom (Personalizar) para criar um novo modelo com algumas configurações personalizadas. Por exemplo, você pode adicionar mais transformações de recursos à receita ou aumentar o número de passagens no parâmetro de treinamento.

Para criar um modelo com opções personalizadas
  1. No console do Amazon ML, escolha Amazon Machine Learning e, em seguida, escolha Modelos de ML.

  2. Na página de resumo ML models (Modelos de ML), escolha Create a new ML model (Criar um novo modelo de ML).

  3. Se você já criou uma fonte de dados, na página Input data (Dados de entrada), escolha I already created a datasource pointing to my S3 data (Já criei um fonte de dados apontando para meus dados do S3). Na tabela, escolha a fonte de dados e, em seguida, Continue (Continuar).

    Se você precisar criar uma fonte de dados, escolha My data is in S3, and I need to create a datasource (Meus dados estão no S3 e preciso criar uma fonte de dados) e Continue (Continuar). Você será redirecionado para o assistente Create a Datasource (Criar uma fonte de dados). Especifique se os dados estão no S3 ou no Redshift e escolha Verify (Verificar). Conclua o procedimento para criar uma fonte de dados.

    Depois de criar uma fonte de dados, você é redirecionado para a próxima etapa no assistente Create ML Model (Criar modelo de ML).

  4. Na página ML model settings (Configurações do modelo de ML), em ML model name (Nome do modelo de ML), digite um nome para o modelo de ML.

  5. Em Select training and evaluation settings (Selecionar configurações de treinamento e avaliação), escolha Custom (Personalizar) e, em seguida, Continue (Continuar).

  6. Na página Recipe (Receita), você pode customize a recipe. Caso não deseje personalizar uma receita, o Amazon ML sugere uma para você. Escolha Continue (Continuar).

  7. Na página Advanced settings (Configurações avançadas), especifique Maximum ML model Size (Tamanho máximo do modelo de ML), Maximum number of data passes (Número máximo de passagens de dados), Shuffle type for training data (Tipo de embaralhamento para dados de treinamento), Regularization type (Tipo de regularização) e Regularization amount (Quantidade de regularização). Se você não especificar essas opções, o Amazon ML usará os parâmetros de treinamento padrão.

    Para obter mais informações sobre esses parâmetros e seus valores padrão, consulte Parâmetros de treinamento.

    Escolha Continue (Continuar).

  8. Na página Evaluation (Avaliação), especifique se deseja avaliar o modelo de ML imediatamente. Se não desejar avaliar o modelo de ML agora, escolha Review (Rever).

    Se quiser avaliar o modelo de ML agora:

    1. Em Name this evaluation (Nomear esta avaliação), digite um nome para a avaliação.

    2. Em Selecionar dados de avaliação, escolha se deseja que o Amazon ML reserve uma parte dos dados de entrada para avaliação e, se desejar, como quer dividir a fonte de dados ou opte por fornecer uma fonte de dados diferente para avaliação.

    3. Escolha Review (Revisar).

  9. Na página Review (Rever), edite suas seleções, exclua todas as tags copiadas da fonte de dados que não deseja aplicar ao modelo e às avaliações e, em seguida, escolha Finish (Concluir).

Depois de criar o modelo, consulte Etapa 4: Analisar o desempenho preditivo do modelo de ML e definir um limite de pontuação.