Não estamos mais atualizando o serviço Amazon Machine Learning nem aceitando novos usuários para ele. Essa documentação está disponível para usuários existentes, mas não estamos mais atualizando-a. Para obter mais informações, consulte O que é o Amazon Machine Learning.
Importância da transformação de recursos
Considere um modelo de Machine Learning cuja tarefa é decidir se uma transação de cartão de crédito é fraudulenta ou não. Com base no conhecimento geral e na análise de dados de seu aplicativo, você pode decidir quais campos de dados (ou recursos) devem ser incluídos nos dados de entrada. É importante fornecer ao processo de aprendizagem, por exemplo, o valor da transação, o nome do comerciante, o endereço e o endereço do titular do cartão de crédito. Por outro lado, um ID de transação gerado aleatoriamente não contém informações (se sabemos que realmente é aleatório) e não é útil.
Assim que você escolher quais campos incluir, transforme esses recursos para ajudar o processo de aprendizagem. As transformações acrescentam experiência geral aos dados de entrada, permitindo que o modelo de Machine Learning se beneficie dessa experiência. Por exemplo, o seguinte endereço de comerciante é representado como uma string:
"Rua Principal, 123, Rio de Janeiro, RJ 20000-000"
Por si só, o endereço tem limitada capacidade de expressão; é útil apenas para padrões de aprendizagem associados a esse endereço exato. Dividindo-o em suas partes constituintes, no entanto, podemos criar características adicionais, como "Endereço" (Rua Principal, 123), "Cidade" (Rio de Janeiro), "Estado" (RJ) e "CEP" (20000-000). Agora, o algoritmo de aprendizagem pode agrupar transações díspares e descobrir padrões mais abrangentes, talvez alguns CEPs de comerciantes apresentam mais atividades fraudulentas do que outros.
Para obter mais informações sobre a abordagem e o processo de transformação de recursos, consulte Conceitos de Machine Learning.