As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
SageMaker O Canvas usa o método de amostragem aleatória para amostrar seu conjunto de dados. O método de amostra aleatória significa que cada linha tem a mesma chance de ser escolhida para a amostra. Você pode escolher uma coluna na visualização prévia para obter estatísticas resumidas para a amostra aleatória, como a média e o modo.
Por padrão, o SageMaker Canvas usa um tamanho de amostra aleatório de 20.000 linhas do seu conjunto de dados para conjuntos de dados com mais de 20.000 linhas. Para conjuntos de dados menores que 20.000 linhas, o tamanho padrão da amostra será o número de linhas no seu conjunto de dados. Você pode aumentar ou diminuir o tamanho da amostra escolhendo Amostra aleatória na guia Criar do aplicativo SageMaker Canvas. Você pode usar o controle deslizante para selecionar o tamanho da amostra desejada e, em seguida, escolher Atualizar para alterar o tamanho da amostra. O tamanho máximo da amostra que você pode escolher para um conjunto de dados é de 40.000 linhas e o tamanho mínimo da amostra é de 500 linhas. Se você escolher uma amostra grande, a visualização prévia do conjunto de dados e as estatísticas resumidas podem levar alguns minutos para serem recarregadas.
A página de Criação mostra uma visualização prévia de 100 linhas do seu conjunto de dados. Se o tamanho da amostra for do mesmo tamanho do seu conjunto de dados, a visualização prévia usará as primeiras 100 linhas do seu conjunto de dados. Caso contrário, a visualização prévia usa as primeiras 100 linhas da amostra aleatória.