Requisitos do conjunto de dados de previsão em lote - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Requisitos do conjunto de dados de previsão em lote

Para previsões em lote, certifique-se de que seus conjuntos de dados atendam aos requisitos descritos em Criar um conjunto de dados. Se seu conjunto de dados for maior que 5 GB, o Canvas usa o Amazon EMR Serverless para processar seus dados e dividi-los em lotes menores. Depois que seus dados forem divididos, o Canvas usa o SageMaker Batch Transform para fazer previsões. Você pode ver cobranças desses dois serviços depois de executar previsões em lote. Para obter mais informações, consulte Preços do Canvas.

Talvez você não consiga fazer previsões em alguns conjuntos de dados se eles tiverem esquemas incompatíveis. Um esquema é uma estrutura organizacional. Para um conjunto de dados tabulares, o esquema envolve os nomes das colunas e o tipo de dados dos dados nas colunas. Um esquema incompatível pode ocorrer por um dos seguintes motivos:

  • O conjunto de dados que você está usando para fazer previsões tem menos colunas do que o conjunto de dados que você está usando para criar o modelo.

  • Os tipos de dados nas colunas que você usou para criar o conjunto de dados podem ser diferentes dos tipos de dados no conjunto de dados que você está usando para fazer previsões.

  • O conjunto de dados que você está usando para fazer previsões e o conjunto de dados que você usou para compilar o modelo têm nomes de colunas que não coincidem. Os nomes das colunas diferenciam letras maiúsculas. Column1 não é o mesmo que column1.

Para garantir que você possa gerar previsões em lote com êxito, combine o esquema do seu conjunto de dados de previsões em lote com o conjunto de dados que você usou para treinar o modelo.

nota

Para previsões em lote, se você eliminou alguma coluna ao ao compilar seu modelo, o Canvas adiciona as colunas eliminadas de volta aos resultados da previsão. No entanto, o Canvas não adicionará as colunas eliminadas às suas previsões em lote para modelos de séries temporais.