

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Experiência de preparação de dados (nova)
<a name="data-prep-experience-new"></a>

A preparação de dados transforma dados brutos em um formato otimizado para análise e visualização. Em inteligência de negócios, esse processo crucial envolve limpeza, estruturação e enriquecimento de dados para permitir insights comerciais significativos.

A interface de preparação de dados do Amazon Quick Sight revoluciona esse processo com uma experiência visual intuitiva que permite aos usuários criar conjuntos de dados prontos para análise sem a experiência em SQL. Por meio de sua abordagem moderna e simplificada, os usuários podem criar e gerenciar com eficiência conjuntos de dados de business intelligence. A interface visual apresenta uma visão clara e sequencial das transformações de dados, permitindo que os autores acompanhem as mudanças do estado inicial até a saída final com precisão.

A plataforma enfatiza a colaboração e a reutilização, permitindo que as equipes compartilhem e reutilizem fluxos de trabalho em toda a organização. Esse design colaborativo promove a consistência nas práticas de transformação de dados e, ao mesmo tempo, elimina o trabalho redundante, promovendo processos padronizados entre as equipes e aprimorando a eficiência geral.

**Topics**
+ [Componentes da experiência de preparação de dados](data-prep-components.md)
+ [Etapas de preparação de dados](data-prep-steps.md)
+ [Recursos avançados de fluxo de trabalho](advanced-workflow-capabilities.md)
+ [Funcionalidades exclusivas para especiarias](spice-only-features.md)
+ [Alternando entre experiências de preparação de dados](switching-between-data-prep-experiences.md)
+ [Recursos não suportados na nova experiência de preparação de dados](unsupported-features.md)
+ [Limites de preparação de dados](data-preparation-limits.md)
+ [Mudanças no comportamento de ingestão](ingestion-behavior-changes.md)
+ [Perguntas frequentes](new-data-prep-faqs.md)

# Componentes da experiência de preparação de dados
<a name="data-prep-components"></a>

A experiência de preparação de dados do Amazon Quick Sight tem os seguintes componentes principais.

## Fluxo de trabalho
<a name="workflow-component"></a>

Um fluxo de trabalho na experiência de preparação de dados do Quick Sight representa uma série sequencial de etapas de transformação de dados que orientam seu conjunto de dados do estado bruto até um formato pronto para análise. Esses fluxos de trabalho são projetados para serem reutilizados, permitindo que os analistas aproveitem e desenvolvam o trabalho existente, mantendo padrões consistentes de transformação de dados em toda a organização.

Embora os fluxos de trabalho possam acomodar vários caminhos por meio de várias entradas ou por meio de divergência (detalhados nas seções subsequentes), eles devem, em última análise, convergir em uma única tabela de saída. Essa estrutura unificada garante a consistência dos dados e recursos de análise simplificados.

## Transformação
<a name="transformation-component"></a>

Uma transformação é uma operação específica de manipulação de dados que altera a estrutura, o formato ou o conteúdo dos seus dados. A experiência de preparação de dados do Quick Sight oferece vários tipos de transformação, incluindo unir, filtrar, agregar, dinamizar, desdinamizar, acrescentar e colunas calculadas. Cada tipo de transformação tem um propósito distinto ao remodelar seus dados para atender aos requisitos analíticos. Essas transformações são implementadas como etapas individuais em seu fluxo de trabalho.

## Etapa
<a name="step-component"></a>

Uma etapa é uma coleção de transformações homogêneas do mesmo tipo aplicadas em seu fluxo de trabalho. Cada etapa contém uma ou mais operações relacionadas da mesma categoria de transformação. Por exemplo, uma etapa Renomear pode incluir várias operações de renomeação de colunas e uma etapa de Filtro pode conter várias condições de filtragem, todas gerenciadas como uma única unidade em seu fluxo de trabalho.

A maioria das etapas pode incluir várias operações, com duas exceções notáveis: as etapas Unir e Anexar estão limitadas a duas tabelas de entrada por etapa. Para unir ou acrescentar mais de duas tabelas, você pode criar etapas adicionais de junção ou anexação em sequência.

As etapas são exibidas em ordem, com cada etapa baseada nos resultados das etapas anteriores, permitindo que você acompanhe a transformação progressiva de seus dados. Para renomear ou excluir uma etapa, selecione-a e escolha o menu de três pontos.

## Conector
<a name="connector-component"></a>

O conector vincula duas etapas com uma seta indicando a direção do fluxo de trabalho. Você pode excluir um conector selecionando-o e pressionando a tecla delete. Para adicionar uma etapa entre duas etapas existentes, basta excluir o conector, adicionar a nova etapa e reconectar as etapas arrastando o mouse entre elas.

## Painel de configuração
<a name="configure-pane-component"></a>

O **painel Configuração** é a área interativa na qual você define parâmetros e configurações para uma etapa selecionada. Quando você seleciona uma etapa em seu fluxo de trabalho, esse painel exibe opções relevantes para esse tipo de transformação específico. Por exemplo, ao configurar uma etapa de união, você pode selecionar o tipo de união, as colunas correspondentes e outras configurações específicas da união. A point-and-click interface do **painel Configuração** elimina a necessidade de conhecimento de SQL.

## Painel de pré-visualização
<a name="preview-pane-component"></a>

O **painel de visualização** exibe uma amostra em tempo real dos seus dados conforme eles aparecem após a aplicação da etapa de transformação atual. Esse feedback visual imediato ajuda você a verificar se cada transformação produz os resultados esperados antes de prosseguir para a próxima etapa. O **painel de visualização é** atualizado dinamicamente à medida que você modifica as configurações das etapas, permitindo o refinamento iterativo das transformações de dados com confiança.

Esses componentes trabalham juntos para criar uma experiência intuitiva e visual de preparação de dados que torna as transformações de dados complexas acessíveis aos usuários corporativos sem a necessidade de conhecimento técnico.

# Etapas de preparação de dados
<a name="data-prep-steps"></a>

A experiência de preparação de dados do Amazon Quick Sight oferece onze tipos poderosos de etapas que permitem transformar seus dados sistematicamente. Cada etapa serve a uma finalidade específica no fluxo de trabalho de preparação de dados.

As etapas podem ser configuradas por meio de uma interface intuitiva no painel **Configuração**, com feedback imediato visível no painel **Visualizar**. As etapas podem ser combinadas sequencialmente para criar transformações de dados sofisticadas sem exigir experiência em SQL.

Cada etapa pode receber a entrada de uma tabela física ou a saída de uma etapa anterior. A maioria das etapas aceita uma única entrada, com as etapas Append e Join sendo as exceções — elas exigem exatamente duas entradas.

## Input
<a name="input-step"></a>

A etapa de entrada inicia seu fluxo de trabalho de preparação de dados no Quick Sight, permitindo que você selecione e importe dados de várias fontes para transformação nas etapas subsequentes.

**Opções de entrada**
+ **Adicionar conjunto de dados**

  Aproveite os conjuntos de dados existentes do Quick Sight como fontes de entrada, com base em dados que já foram preparados e otimizados por sua equipe.
+ **Adicionar fonte de dados**

  Conecte-se diretamente a bancos de dados como Amazon Redshift, Athena, RDS ou outras fontes compatíveis selecionando objetos de banco de dados específicos e fornecendo parâmetros de conexão.
+ **Adicionar upload de arquivo**

  Importe dados diretamente de arquivos locais em formatos como CSV, TSV, Excel ou JSON.

**Configuração**

A etapa de entrada não requer configuração. O painel de **visualização** exibe os dados importados junto com as informações da fonte, incluindo detalhes da conexão, nome da tabela e metadados da coluna.

**Observações de uso**
+ Várias etapas de entrada podem existir em um único fluxo de trabalho.
+ Você pode adicionar etapas de entrada em qualquer ponto do seu fluxo de trabalho.

## Adicionar colunas calculadas
<a name="add-calculated-columns-step"></a>

A etapa Adicionar colunas calculadas permite criar novas colunas usando expressões em nível de linha que realizam cálculos em colunas existentes. Você pode criar novas colunas usando funções e operadores escalares (nível de linha) e aplicar cálculos em nível de linha que façam referência a colunas existentes.

**Configuração**

Para configurar a etapa Adicionar colunas calculadas, no painel **Configuração**:

1. Dê um nome à sua nova coluna calculada.

1. [Crie expressões usando o editor de cálculo, que oferece suporte a funções e operadores em nível de linha (como [ifelse](ifelse-function.md) e round).](round-function.md)

1. Salve seu cálculo.

1. Visualize os resultados da expressão.

1. Adicione mais colunas calculadas conforme necessário.

**Observações de uso**
+ Somente cálculos escalares (em nível de linha) são suportados nesta etapa.
+ No SPICE, as colunas calculadas são materializadas e funcionam como colunas padrão nas etapas subsequentes.

## Alterar tipo de dados
<a name="change-data-type-step"></a>

O Quick Sight simplifica o gerenciamento de tipos de dados ao oferecer suporte a quatro tipos de dados abstratos: `date` `decimal``integer`,, e. `string` Esses tipos abstratos eliminam a complexidade mapeando automaticamente vários tipos de dados de origem para seus equivalentes do Quick Sight. Por exemplo,`tinyint`,`smallint`,`integer`, e `bigint` são todos mapeados para`integer`, enquanto `date``datetime`, e `timestamp` são mapeados para. `date`

Essa abstração significa que você só precisa entender os quatro tipos de dados do Quick Sight, pois o Quick Sight lida automaticamente com todas as conversões e cálculos de tipos de dados subjacentes ao interagir com diferentes fontes de dados.

**Configuração**

Para configurar a etapa Alterar tipo de dados, no painel **Configuração**:

1. Selecione uma coluna para converter.

1. Escolha o tipo de dados de destino (`string``integer`,`decimal`, ou`date`).

1. Para conversões de data, especifique as configurações de formato e visualize os resultados com base nos formatos de entrada. Veja os [formatos de data compatíveis](supported-data-types-and-values.md) no Quick Sight.

1. Adicione colunas adicionais para converter conforme necessário.

**Observações de uso**
+ Converta os tipos de dados de várias colunas em uma única etapa para maior eficiência.
+ Ao usar o SPICE, todas as alterações de tipo de dados são materializadas nos dados importados.

## Renomear colunas
<a name="rename-columns-step"></a>

A etapa Renomear colunas permite que você modifique os nomes das colunas para que sejam mais descritivos, fáceis de usar e consistentes com as convenções de nomenclatura da sua organização.

**Configuração**

Para configurar a etapa Renomear colunas, no painel **Configuração**:

1. Selecione uma coluna para nomear.

1. Insira um novo nome para a coluna selecionada.

1. Adicione mais colunas para renomear conforme necessário.

**Observações de uso**
+ Todos os nomes das colunas devem ser exclusivos em seu conjunto de dados.

## Selecionar colunas
<a name="select-columns-step"></a>

A etapa Selecionar colunas permite que você simplifique seu conjunto de dados incluindo, excluindo e reordenando colunas. Isso ajuda a otimizar sua estrutura de dados removendo colunas desnecessárias e organizando as restantes em uma sequência lógica para análise.

**Configuração**

Para configurar a etapa Selecionar colunas, no painel **Configuração**:

1. Escolha colunas específicas para incluir em sua saída.

1. Selecione as colunas em sua ordem preferida para estabelecer a sequência.

1. Use **Selecionar tudo** para incluir as colunas restantes na ordem original.

1. Exclua colunas indesejadas deixando-as desmarcadas.

**Características principais**
+ As colunas de saída aparecem na ordem de seleção.
+ **Selecionar Tudo** preserva a sequência de colunas original.

**Observações de uso**
+ As colunas não selecionadas são removidas das etapas subsequentes.
+ Otimize o tamanho do conjunto de dados removendo colunas desnecessárias.

## Anexar
<a name="append-step"></a>

A etapa Anexar combina verticalmente duas tabelas, semelhante a uma operação SQL UNION ALL. O Quick Sight combina automaticamente as colunas por nome em vez de sequência, permitindo a consolidação eficiente de dados mesmo quando as tabelas têm ordens de colunas diferentes ou números variáveis de colunas.

**Configuração**

Para configurar a etapa Anexar, no painel **Configuração**:

1. Selecione duas tabelas de entrada para anexar.

1. Revise a sequência da coluna de saída.

1. Examine quais colunas estão presentes nas duas tabelas versus nas tabelas individuais.

**Recursos principais**
+ Combina as colunas por nome em vez de sequência.
+ Retém todas as linhas das duas tabelas, incluindo duplicatas.
+ Suporta tabelas com diferentes números de colunas.
+ Segue a sequência de colunas da Tabela 1 para colunas correspondentes e, em seguida, adiciona colunas exclusivas da Tabela 2.
+ Mostra indicadores de origem claros para todas as colunas

**Observações de uso**
+ Use primeiro a etapa Renomear ao acrescentar colunas com nomes diferentes.
+ Cada etapa de Anexação combina exatamente duas tabelas; use etapas adicionais de Acrescentar para obter mais tabelas.

## Ingressar
<a name="join-step"></a>

A etapa Unir combina horizontalmente os dados de duas tabelas com base nos valores correspondentes em colunas especificadas. O Quick Sight suporta os tipos de junção externa esquerda, externa direita, externa completa e interna, fornecendo opções flexíveis para suas necessidades analíticas. A etapa inclui a resolução inteligente de conflitos de colunas que processa automaticamente nomes de colunas duplicados. Embora as uniões automáticas não estejam disponíveis como um tipo específico de associação, você pode obter resultados semelhantes usando a divergência do fluxo de trabalho.

**Configuração**

Para configurar a etapa de junção, no painel **Configuração**:

1. Selecione duas tabelas de entrada para unir.

1. Escolha seu tipo de junção (Externa Esquerda, Externa Direita, Externa Completa ou Interna).

1. Especifique as chaves de junção de cada tabela.

1. Analise os conflitos de nomes de colunas resolvidos automaticamente.

**Recursos principais**
+ Suporta vários tipos de junção para diferentes necessidades analíticas.
+ Resolve automaticamente nomes de colunas duplicados.
+ Aceita colunas calculadas como chaves de junção.

**Observações de uso**
+ As chaves de junção devem ter tipos de dados compatíveis; use a etapa Alterar tipo de dados, se necessário.
+ Cada etapa de junção combina exatamente duas tabelas; use etapas de junção adicionais para obter mais tabelas.
+ Crie uma etapa de renomeação após a união para personalizar cabeçalhos de coluna resolvidos automaticamente.

## Agregar
<a name="aggregate-step"></a>

A etapa Agregar permite resumir os dados agrupando colunas e aplicando operações de agregação. Essa transformação poderosa condensa dados detalhados em resumos significativos com base nas dimensões especificadas. O Quick Sight simplifica operações SQL complexas por meio de uma interface intuitiva, oferecendo funções de agregação abrangentes, incluindo operações avançadas de string, como e. `ListAgg` `ListAgg distinct`

**Configuração**

Para configurar a etapa de agregação, no painel **Configuração**:

1. Selecione as colunas pelas quais agrupar.

1. Escolha funções de agregação para colunas de medida.

1. Personalize os nomes das colunas de saída.

1. Para `ListAgg` e `ListAgg distinct`:

   1. Selecione a coluna a ser agregada.

   1. Escolha um separador (vírgula, traço, ponto e vírgula ou linha vertical).

1. Visualize os dados resumidos.

**Funções suportadas por tipo de dados**


| Tipo de dado | Funções compatíveis | 
| --- | --- | 
|  Numérico  |  `Average`, `Sum` `Count`, `Count Distinct` `Max`, `Min`  | 
|  Data  |  `Count`, `Count Distinct` `Max`, `Min` `ListAgg`, `ListAgg distinct` (somente para data)  | 
|  String  |  `ListAgg`, `ListAgg distinct` `Count`, `Count Distinct` `Max`, `Min`  | 

**Recursos principais**
+ Aplica funções de agregação diferentes às colunas na mesma etapa.
+ **O agrupamento por** sem funções de agregação atua como SQL SELECT DISTINCT.
+ `ListAgg`concatena todos os valores; `ListAgg distinct` inclui somente valores exclusivos.
+ `ListAgg`as funções mantêm a ordem de classificação crescente por padrão.

**Observações de uso**
+ A agregação reduz significativamente a contagem de linhas em seu conjunto de dados.
+ `ListAgg`e `ListAgg distinct` apoiam `date` valores, mas não`datetime`.
+ Use separadores para personalizar a saída de concatenação de strings.

## Filtro
<a name="filter-step"></a>

A etapa Filtrar permite que você restrinja seu conjunto de dados incluindo somente linhas que atendam a critérios específicos. Você pode aplicar várias condições de filtro em uma única etapa, todas combinadas por meio da `AND` lógica para ajudar a concentrar sua análise em dados relevantes.

**Configuração**

Para configurar a etapa Filtro, no painel **Configuração**:

1. Selecione uma coluna para filtrar.

1. Escolha um operador de comparação.

1. Especifique os valores do filtro com base no tipo de dados da coluna.

1. Adicione condições de filtro adicionais em diferentes colunas, se necessário.

**nota**  
Filtros de string com “está em” ou “não está em”: insira vários valores (um por linha).
Filtros numéricos e de data: insira valores únicos (exceto “entre”, que requer dois valores).

**Operadores compatíveis por tipo de dados**


| Tipo de dado | Operadores com suporte | 
| --- | --- | 
|  Número inteiro e decimal  |  É igual, não é igual Maior que, Menor que É maior ou igual a, É menor ou igual a Está entre  | 
|  Data  |  Depois, antes Está entre É depois ou igual a, É antes ou igual a  | 
|  String  |  É igual, não é igual Começa com, termina com Contém, não contém Está dentro, não está dentro  | 

**Observações de uso**
+ Aplique várias condições de filtro em uma única etapa.
+ Combine condições em diferentes tipos de dados.
+ Visualize os resultados filtrados em tempo real.

## Pivot
<a name="pivot-step"></a>

A etapa Pivot transforma valores de linha em colunas exclusivas, convertendo dados de um formato longo em um formato amplo para facilitar a comparação e a análise. Essa transformação requer especificações para filtragem, agregação e agrupamento de valores para gerenciar as colunas de saída com eficiência.

**Configuração**

Para configurar a etapa do Pivot, use o seguinte no painel **Configuração**:

1. **Coluna dinâmica: selecione a coluna** cujos valores se tornarão cabeçalhos de coluna (por exemplo, Categoria).

1. **Valor da linha da coluna dinâmica**: filtre valores específicos a serem incluídos (por exemplo, tecnologia, material de escritório).

1. **Cabeçalho da coluna de saída: personalize novos cabeçalhos** de coluna (o padrão é dinamizar os valores da coluna).

1. **Coluna de valor**: selecione a coluna a ser agregada (por exemplo, Vendas).

1. **Função de agregação**: escolha o método de agregação (por exemplo, soma).

1. **Agrupar por**: especifique as colunas de organização (por exemplo, Segmento).

![\[alt text not found\]](http://docs.aws.amazon.com/pt_br/quick/latest/userguide/images/pivot.png)


**Operadores compatíveis por tipo de dados**


| Tipo de dado | Operadores com suporte | 
| --- | --- | 
|  Número inteiro e decimal  |  `Average`, `Sum` `Count`, `Count Distinct` `Max`, `Min`  | 
|  Data  |  `Count`, `Count Distinct` `Max`, `Min` `ListAgg`, `ListAgg distinct` (somente valores de data)  | 
|  String  |  `ListAgg`, `ListAgg distinct` `Count`, `Count Distinct` `Max`, `Min`  | 

**Observações de uso**
+ Cada coluna dinâmica contém valores agregados da coluna de valor.
+ Personalize os cabeçalhos das colunas para maior clareza.
+ Visualize os resultados da transformação em tempo real.

## Unpivot
<a name="unpivot-step"></a>

A etapa Unpivot transforma colunas em linhas, convertendo dados amplos em um formato maior e mais estreito. Essa transformação ajuda a organizar os dados espalhados por várias colunas em um formato mais estruturado para facilitar a análise e a visualização.

**Configuração**

**Para configurar a etapa Unpivot, no painel Configuração:**

1. Selecione as colunas para desdobrar em linhas.

1. Defina os valores da linha da coluna de saída. O padrão é o nome original da coluna. Alguns exemplos incluem tecnologia, material de escritório e móveis.

1. Nomeie as duas novas colunas de saída.
   + **Cabeçalho de coluna não dinâmico**: o nome dos nomes das colunas anteriores (por exemplo, Categoria)
   + Valores de **coluna não dinâmicos: o nome dos valores** não dinâmicos (por exemplo, Vendas)

![\[alt text not found\]](http://docs.aws.amazon.com/pt_br/quick/latest/userguide/images/unpivot.png)


**Recursos principais**
+ Retém todas as colunas não dinâmicas na saída.
+ Cria duas novas colunas automaticamente: uma para nomes de colunas anteriores e outra para seus valores correspondentes.
+ Transforma dados amplos em formato longo.

**Observações de uso**
+ Todas as colunas não dinâmicas devem ter tipos de dados compatíveis.
+ A contagem de linhas normalmente aumenta depois de não girar.
+ Visualize as alterações em tempo real antes de aplicá-las.

# Recursos avançados de fluxo de trabalho
<a name="advanced-workflow-capabilities"></a>

A experiência de preparação de dados do Amazon Quick Sight oferece recursos sofisticados que aprimoram sua capacidade de criar transformações de dados complexas e reutilizáveis. Esta seção aborda dois recursos poderosos que ampliam seu potencial de fluxo de trabalho.

A divergência permite criar vários caminhos de transformação a partir de uma única etapa, permitindo fluxos de processamento paralelos que podem ser recombinados posteriormente. Esse recurso é particularmente valioso para cenários complexos, como junções automáticas e transformações paralelas.

Os conjuntos de dados compostos permitem que você crie estruturas de dados hierárquicas usando conjuntos de dados existentes como blocos de construção. Esse recurso promove a colaboração entre equipes e garante uma lógica de negócios consistente por meio de transformações reutilizáveis em camadas.

Esses recursos funcionam juntos para fornecer designs flexíveis de fluxo de trabalho, colaboração aprimorada em equipe e transformações de dados reutilizáveis. Eles garantem uma linhagem de dados clara e permitem soluções escaláveis de preparação de dados, capacitando sua organização a lidar com cenários de dados cada vez mais complexos com eficiência e clareza.

## Divergência
<a name="divergence"></a>

A divergência permite que você crie vários caminhos de transformação paralelos a partir de uma única etapa do seu fluxo de trabalho. Esses caminhos podem ser transformados de forma independente e posteriormente recombinados, permitindo cenários complexos de preparação de dados, como junções automáticas.

**Criando caminhos divergentes**

Para iniciar uma divergência, em seu fluxo de trabalho:

1. Selecione a etapa em que você deseja criar divergência.

1. Escolha o ícone **\$1** que aparece.

1. Configure a nova ramificação que aparece.

1. Aplique as transformações desejadas em cada caminho.

1. Use as etapas Unir ou Anexar para recombinar caminhos em uma única saída.

![\[alt text not found\]](http://docs.aws.amazon.com/pt_br/quick/latest/userguide/images/divergence.png)


**Recursos principais**
+ Cria até cinco caminhos divergentes a partir de uma única etapa.
+ Aplica transformações diferentes a cada caminho.
+ Recombina caminhos usando as etapas Unir ou Anexar.
+ Visualiza as alterações em cada caminho de forma independente.

**Práticas recomendadas**
+ Use a divergência para implementar uniões automáticas.
+ Crie cópias de dados para transformações paralelas.
+ Planeje sua estratégia de recombinação (juntar ou acrescentar).
+ Mantenha uma nomenclatura clara dos caminhos para melhor visibilidade do fluxo de trabalho.

## Conjuntos de dados compostos
<a name="composite-datasets"></a>

Os conjuntos de dados compostos permitem que você se baseie em conjuntos de dados existentes, criando estruturas hierárquicas de transformação de dados que podem ser compartilhadas e reutilizadas em toda a organização. O Quick Sight suporta até 10 níveis de conjuntos de dados compostos nos modos SPICE e Direct Query.

**Criação de um conjunto de dados composto**

Para criar um conjunto de dados composto, em seu fluxo de trabalho:

1. Selecione a etapa de entrada ao criar um novo conjunto de dados.

1. Escolha **Conjunto de dados** como sua fonte em **Adicionar dados**.

1. Selecione um conjunto de dados existente para se basear.

1. Aplique transformações adicionais conforme necessário.

1. Salve como um novo conjunto de dados.

**Recursos principais**
+ Cria estruturas hierárquicas de transformação de dados.
+ Suporta até 10 níveis de aninhamento de conjuntos de dados.
+ Compatível com SPICE e Direct Query.
+ Mantém uma linhagem de dados clara.
+ Permite transformações específicas da equipe.

Esse recurso aprimora a colaboração entre diferentes equipes. Por exemplo,


| Perfil | Ação | Output | 
| --- | --- | --- | 
|  Analista global  |  Cria um conjunto de dados com lógica de negócios global  |  Conjunto de dados A  | 
|  Analista das Américas  |  Usa o conjunto de dados A, adiciona lógica regional  |  Conjunto de dados B  | 
|  Analista do Oeste dos EUA  |  Usa o conjunto de dados B, adiciona lógica local  |  Conjunto de dados C  | 

Essa abordagem hierárquica promove uma lógica de negócios consistente em toda a organização, atribuindo uma propriedade clara das camadas de transformação. Ele cria uma linhagem de dados rastreável e, ao mesmo tempo, oferece suporte a até 10 níveis de agrupamento de conjuntos de dados, permitindo o gerenciamento controlado e sistemático da transformação de dados.

**Práticas recomendadas**
+ Estabeleça uma propriedade clara para cada camada de transformação.
+ Documente as relações e dependências do conjunto de dados.
+ Planeje a profundidade da hierarquia com base nas necessidades comerciais.
+ Mantenha convenções de nomenclatura consistentes.
+ Analise e atualize os conjuntos de dados upstream com cuidado.

# Funcionalidades exclusivas para especiarias
<a name="spice-only-features"></a>

O SPICE (mecanismo de cálculo superrápido, paralelo e em memória) do Amazon Quick Sight permite certos recursos de preparação de dados com uso intensivo de computação. Essas transformações são materializadas no SPICE para um desempenho ideal, em vez de serem executadas no momento da consulta.

**Funcionalidades exclusivas para especiarias**


| Etapas | Outras capacidades | 
| --- | --- | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/pt_br/quick/latest/userguide/spice-only-features.html)  |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/pt_br/quick/latest/userguide/spice-only-features.html)  | 

**Recursos disponíveis no SPICE e DirectQuery**


| Etapas | Outras capacidades | 
| --- | --- | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/pt_br/quick/latest/userguide/spice-only-features.html)  |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/pt_br/quick/latest/userguide/spice-only-features.html)  | 

**Práticas recomendadas**
+ Use o SPICE para fluxos de trabalho que exigem recursos exclusivos do SPICE.
+ Escolha o SPICE para otimizar o desempenho de transformações complexas e grandes conjuntos de dados.
+ Considere as necessidades DirectQuery de dados em tempo real quando os recursos somente do SPICE não forem necessários.

# Alternando entre experiências de preparação de dados
<a name="switching-between-data-prep-experiences"></a>

A experiência antiga de preparação de dados se refere à interface anterior de preparação de dados no Amazon Quick Sight que existia antes de outubro de 2025. A nova experiência de preparação de dados é a interface visual aprimorada que mostra as sequências de step-by-step transformação. Os conjuntos de dados legados são aqueles criados antes da nova experiência de preparação de dados, enquanto os novos conjuntos de dados são aqueles criados após outubro de 2025.

Ao criar um novo conjunto de dados, o Quick Sight direciona você automaticamente para a nova experiência de preparação de dados. Essa interface visual oferece recursos aprimorados e usabilidade aprimorada para tarefas de transformação de dados.

## Opção de exclusão
<a name="opt-out"></a>

Antes de salvar e publicar um conjunto de dados, você tem a opção de voltar para a experiência antiga de preparação de dados, se preferir. Essa flexibilidade permite que as equipes façam a transição em seu próprio ritmo enquanto se familiarizam com a nova interface.

**Importante**  
Se um conjunto de dados for salvo e publicado na nova experiência, não haverá a opção de voltar à experiência antiga. Isso ocorre intencionalmente, pois a nova experiência tem novos recursos significativos que não são suportados na experiência antiga. Portanto, a conversão direta de conjuntos de dados de uma experiência para outra não é suportada. Você precisará criar um novo conjunto de dados para mudar para a experiência antiga.

## fluxo de trabalho de transição
<a name="transition-workflow"></a>

Depois que um conjunto de dados é salvo na experiência nova ou na antiga, as transformações não podem ser convertidas diretamente de uma experiência para outra. No entanto, se existir uma versão publicada do conjunto de dados, você poderá usar o controle de versão para acessar a versão anterior, que pode estar na experiência antiga.

Os conjuntos de dados antigos continuarão acessíveis para visualização e edição exclusivamente por meio da interface antiga. Isso mantém a compatibilidade com fluxos de trabalho previamente estabelecidos.

Antes de fazer a transição completa, reserve um tempo para se familiarizar com a nova experiência de preparação de dados. Ao trabalhar com conjuntos de dados legados, considere criar uma nova versão usando a nova experiência para futuras modificações. Use o controle de versão para manter o acesso às versões antigas dos conjuntos de dados, se necessário. Documente todas as mudanças no fluxo de trabalho ao fazer a transição da experiência antiga para a nova para garantir o alinhamento da equipe.

# Recursos não suportados na nova experiência de preparação de dados
<a name="unsupported-features"></a>

Embora a nova experiência de preparação de dados ofereça recursos aprimorados, alguns recursos da experiência antiga ainda não são suportados. Esta seção descreve esses recursos e fornece orientação para lidar com fluxos de trabalho afetados.

Ao usar fontes de dados não suportadas, o Amazon Quick Sight automaticamente usa como padrão a experiência antiga. Para outros recursos não compatíveis, selecione **Alternar para a experiência antiga** no canto superior direito da página de preparação de dados. Os conjuntos de dados de regras criados na experiência antiga permanecem compatíveis com os conjuntos de dados da experiência antiga e nova.

## Fontes de dados não suportadas
<a name="unsupported-data-sources"></a>

No momento, as fontes de dados a seguir estão disponíveis somente na experiência antiga.


| Fonte de dados | Detalhes | 
| --- | --- | 
|  Salesforce  |  Assume automaticamente a experiência legada  | 
|  Planilhas Google  |  Assume automaticamente a experiência legada  | 
|  Análise S3  |  **As fontes de dados S3 são suportadas**  | 

## Outros recursos não suportados
<a name="other-unsupported-features"></a>

No momento, os recursos a seguir estão disponíveis somente na experiência antiga.


| Categoria de recurso | Atributos não compatíveis | 
| --- | --- | 
|  Gerenciamento de conjuntos de dados  |  [Atualização incremental](refreshing-imported-data.md#refresh-spice-data-incremental)[, [parâmetros do conjunto de dados](dataset-parameters.md), [pastas de colunas, descrições de colunas](organizing-fields-folder.md)](describing-data.md)  | 
|  Tipos de dados  |  [Geoespacial](geospatial-data-prep.md)[, [formatos ELF/CLF](supported-data-sources.md#file-data-sources), arquivos Zip/ no S3 GZip ](supported-data-sources.md#file-data-sources)  | 
|  Opções de configuração  |  [“Começar da linha” nas configurações de upload de arquivos](choosing-file-upload-settings.md), formato de data JODA  | 
|  Seleção do conjunto de dados principal a partir da experiência antiga  |  Os conjuntos de dados pai e filho devem existir no mesmo ambiente de experiência. Você não pode usar um conjunto de dados de experiência legado como pai para um novo conjunto de dados de experiência.  | 

## Desenvolvimento futuro
<a name="future-development"></a>

O Amazon Quick Sight planeja implementar esses recursos na nova experiência de preparação de dados no futuro. Essa abordagem garante que o lançamento inicial da nova experiência de preparação de dados priorize:

**Capacidades aprimoradas**
+ Fluxos de trabalho de transformação visual
+ Maior transparência do processo
+ Técnicas avançadas de preparação por meio da Divergência
+ Novos recursos poderosos, como Append, Aggregate e Pivot

**Adoção flexível**

Os usuários podem escolher entre experiências antes de publicar conjuntos de dados, garantindo fluxos de trabalho ininterruptos enquanto as equipes fazem a transição em seu próprio ritmo. Essa abordagem permite acesso imediato a novos recursos e, ao mesmo tempo, mantém o suporte para requisitos especializados por meio da experiência antiga.

# Limites de preparação de dados
<a name="data-preparation-limits"></a>

A experiência de preparação de dados do Amazon Quick Sight foi projetada para lidar com conjuntos de dados em escala empresarial e, ao mesmo tempo, manter o desempenho ideal. Os limites a seguir garantem uma funcionalidade confiável.

## Limites de tamanho do conjunto de dados (SPICE)
<a name="dataset-size-limits"></a>
+ **Tamanho de saída**: até 2 TB ou 2 bilhões de linhas
+ **Tamanho total da entrada**: as fontes de entrada combinadas não podem exceder 2 TB
+ **Tamanho das tabelas secundárias**: o tamanho combinado é limitado a 20 GB

**nota**  
As tabelas primárias são aquelas com tamanho máximo em um fluxo de trabalho; todas as outras são secundárias.

## limites da estrutura do fluxo de trabalho
<a name="workflow-structure-limits"></a>
+ **Etapas máximas**: até 256 etapas de transformação por fluxo de trabalho
+ **Tabelas de origem**: máximo de 32 etapas de importação por fluxo de trabalho
+ **Colunas de saída**: até 2048 colunas em qualquer etapa do fluxo de trabalho e tabela de saída final com 2.000 colunas
+ **Caminhos divergentes**: máximo de 5 caminhos em uma única etapa (somente SPICE, não aplicável para) DirectQuery
+ **Conjunto de dados como fonte**: até 10 níveis para SPICE e DirectQuery

Esses limites foram projetados para equilibrar flexibilidade e desempenho, permitindo transformações complexas de dados e garantindo recursos de análise ideais.

# Mudanças no comportamento de ingestão
<a name="ingestion-behavior-changes"></a>

A nova experiência de preparação de dados introduz uma mudança importante na forma como os problemas de qualidade dos dados são tratados durante a ingestão do SPICE. Essa alteração afeta significativamente a integridade e a transparência dos dados em seus conjuntos de dados.

Na experiência antiga, ao encontrar inconsistências de tipo de dados (como formatos de data incorretos ou [problemas semelhantes](errors-spice-ingestion.md)), a linha inteira contendo células problemáticas é ignorada durante a ingestão. Essa abordagem resulta em menos linhas no conjunto de dados final, potencialmente obscurecendo os problemas de qualidade dos dados.

A nova experiência adota uma abordagem mais granular às inconsistências de dados. Ao encontrar células problemáticas, somente os valores inconsistentes são convertidos em valores nulos, mantendo a linha inteira. Essa preservação garante que os dados relacionados em outras colunas permaneçam acessíveis para análise.

**Impacto na qualidade do conjunto de dados**

Os conjuntos de dados criados na nova experiência normalmente contêm mais linhas do que seus equivalentes antigos quando os dados de origem contêm inconsistências. Essa abordagem aprimorada oferece vários benefícios:
+ Melhoria na integridade dos dados ao manter todas as linhas
+ Maior transparência na identificação de problemas de qualidade de dados
+ Melhor visibilidade dos valores problemáticos para remediação
+ Preservação de dados relacionados em colunas não afetadas

Essa mudança permite que os analistas identifiquem e resolvam problemas de qualidade de dados com mais eficiência, em vez de omitir silenciosamente as linhas problemáticas do conjunto de dados.

# Perguntas frequentes
<a name="new-data-prep-faqs"></a>

## 1. Quando os usuários precisam mudar da experiência nova para a antiga?
<a name="faq-1"></a>

Os usuários devem retornar à experiência antiga ao trabalhar com conjuntos de dados que contêm recursos atualmente [não suportados](unsupported-features.md). A Quick Sight está trabalhando ativamente para incorporar esses recursos à nova experiência nos próximos lançamentos.

## 2. Por que os conjuntos de dados ficam acinzentados ao tentar adicioná-los à nova experiência? Os conjuntos de dados podem ser combinados entre experiências antigas e novas?
<a name="faq-2"></a>

Atualmente, os conjuntos de dados pai e filho devem existir no mesmo ambiente de experiência. Você não pode combinar conjuntos de dados entre experiências antigas e novas porque a nova experiência inclui recursos adicionais não disponíveis no legado, como funcionalidades de anexação, recursos de dinamização e divergência.

**Usando conjuntos de dados principais da experiência antiga**

Para usar conjuntos de dados principais da experiência antiga, você pode voltar para esse ambiente. Basta navegar até a página de preparação de dados e escolher **Voltar para a experiência antiga** no canto superior direito. Uma vez lá, você pode criar seus conjuntos de dados secundários conforme necessário.

**Desenvolvimento futuro**

Estamos planejando implementar uma funcionalidade que permitirá aos usuários atualizar conjuntos de dados legados para a nova experiência. Esse caminho atualizado permitirá o uso de conjuntos de dados primários legados na nova experiência.

## 3. Por que a Quick Sight está lançando a nova experiência de preparação de dados antes de alcançar a paridade total de recursos com a experiência antiga?
<a name="faq-3"></a>

A nova experiência de preparação de dados foi desenvolvida por meio de ampla colaboração com o cliente para enfrentar os desafios de análise do mundo real. O lançamento inicial prioriza:

**Capacidades aprimoradas**
+ Fluxos de trabalho de transformação visual
+ Transparência aprimorada do processo
+ Técnicas avançadas de preparação por meio da Divergência
+ Novos recursos poderosos, como Append, Aggregate e Pivot

**Adoção flexível**

Os usuários podem escolher entre experiências antes de publicar conjuntos de dados, garantindo fluxos de trabalho ininterruptos enquanto as equipes fazem a transição em seu próprio ritmo. Essa abordagem permite acesso imediato a novos recursos e, ao mesmo tempo, mantém o suporte para requisitos especializados por meio da experiência antiga.

## 4. Os recursos atualmente disponíveis somente na experiência antiga serão adicionados à nova experiência?
<a name="faq-4"></a>

Sim. A Quick Sight está trabalhando ativamente para incorporar recursos antigos à nova experiência.

## 5. Como as alterações na API afetam os scripts de criação de conjuntos de dados existentes?
<a name="faq-5"></a>

O Quick Sight mantém a compatibilidade com versões anteriores enquanto introduz novos recursos:
+ Scripts existentes: os scripts de API antigos continuarão funcionando, criando conjuntos de dados na experiência antiga
+ Nomenclatura da API: os nomes atuais da API permanecem inalterados
+ Nova funcionalidade: formatos adicionais de API oferecem suporte aos recursos aprimorados da nova experiência
+ Documentação: As especificações completas da API para a nova experiência estão disponíveis em nossa referência de API

## 6. Os conjuntos de dados podem ser convertidos entre experiências após a publicação?
<a name="faq-6"></a>
+ Future Migration Path: O Quick Sight adicionará um recurso no futuro para migrar facilmente conjuntos de dados legados para a nova experiência.
+ Processo unidirecional: a conversão de conjuntos de dados da nova experiência para o formato antigo não é suportada devido às dependências de recursos avançados