Exemplos de conjuntos de dados no Canvas - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Exemplos de conjuntos de dados no Canvas

SageMaker O Canvas fornece conjuntos de dados de amostra abordando casos de uso exclusivos para que você possa começar a criar, treinar e validar modelos rapidamente sem escrever nenhum código. Os casos de uso associados a esses conjuntos de dados destacam os recursos do SageMaker Canvas, e você pode aproveitar esses conjuntos de dados para começar a criar modelos. Você pode encontrar os conjuntos de dados de amostra na página Conjuntos de dados do seu aplicativo SageMaker Canvas.

Os conjuntos de dados a seguir são os exemplos que o SageMaker Canvas fornece por padrão. Esses conjuntos de dados abrangem casos de uso, como previsão de preços imobiliários, inadimplência de empréstimos e readmissão de pacientes diabéticos; previsão de vendas; previsão de falhas de máquinas para agilizar a manutenção preditiva em unidades de fabricação; e geração de previsões da cadeia de suprimentos para transporte e logística. Os conjuntos de dados são armazenados na sample_dataset pasta no bucket SageMaker padrão do Amazon S3 criado para sua conta em uma região.

  • canvas-sample-diabetic-readmission.csv: Esse conjunto de dados contém dados históricos, incluindo mais de quinze recursos com resultados de pacientes e hospitais. Você pode usar esse conjunto de dados para prever se pacientes diabéticos de alto risco têm probabilidade de serem readmitidos no hospital dentro de 30 dias após a alta, após 30 dias ou se não serão readmitidos. Use a coluna readmitido como coluna de destino e use o tipo de modelo de previsão de 3 ou mais categorias com esse conjunto de dados. Para saber mais sobre como criar um modelo com esse conjunto de dados, consulte a página do workshop do SageMaker Canvas. Esse conjunto de dados foi obtido do UCIMachine Learning Repository.

  • canvas-sample-housing.csv: Esse conjunto de dados contém dados sobre as características vinculadas a um determinado preço de habitação. Você pode usar esse conjunto de dados para prever os preços de imóveis residenciais. Use a coluna median_house_value como coluna de destino e use o tipo de modelo de predição numérica com esse conjunto de dados. Para saber mais sobre como criar um modelo com esse conjunto de dados, consulte a página do workshop do SageMaker Canvas. Este é o conjunto de dados habitacionais da Califórnia obtido do StatLib repositório.

  • canvas-sample-loans.csv: esse conjunto de dados contém dados completos de todos os empréstimos emitidos de 2007 a 2011, incluindo o status atual do empréstimo e as informações de pagamento mais recentes. Você pode usar esse conjunto de dados para prever se um cliente pagará um empréstimo. Use a coluna loan_status como coluna de destino e use o tipo de modelo de previsão de 3 ou mais categorias com esse conjunto de dados. Para saber mais sobre como criar um modelo com esse conjunto de dados, consulte a página do workshop do SageMaker Canvas. Esses dados usam os LendingClub dados obtidos do Kaggle.

  • canvas-sample-maintenance.csv: esse conjunto de dados contém dados sobre as características vinculadas a um determinado tipo de falha de manutenção. Você pode usar esse conjunto de dados para prever quais falhas ocorrerão no futuro. Use a coluna Tipo de falha como coluna de destino e use o tipo de modelo de previsão de 3 ou mais categorias com esse conjunto de dados. Para saber mais sobre como criar um modelo com esse conjunto de dados, consulte a página do workshop do SageMaker Canvas. Esse conjunto de dados foi obtido do UCIMachine Learning Repository.

  • canvas-sample-shipping-logs.csv: esse conjunto de dados contém dados completos de envio de todos os produtos entregues, incluindo tempo estimado, prioridade de envio, transportadora e origem. Você pode usar esse conjunto de dados para prever o tempo estimado de chegada da remessa em número de dias. Use a ActualShippingDayscoluna como a coluna de destino e use o tipo de modelo de predição numérica com esse conjunto de dados. Para saber mais sobre como criar um modelo com esses dados, consulte a página do workshop do SageMaker Canvas. Este é um conjunto de dados sintético criado pela Amazon.

  • canvas-sample-sales-forecasting.csv: esse conjunto de dados contém dados históricos de vendas de séries temporais para lojas de varejo. Você pode usar esse conjunto de dados para prever as vendas de uma determinada loja de varejo. Use a coluna de vendas como a coluna de destino e use o tipo de modelo de previsão de séries temporais com esse conjunto de dados. Para saber mais sobre como criar um modelo com esse conjunto de dados, consulte a página do workshop do SageMaker Canvas. Este é um conjunto de dados sintético criado pela Amazon.