

# Usar a transformação Split String para dividir uma coluna de string
<a name="transforms-split-string"></a>

 A transformação Split String permite que você divida uma string em uma matriz de tokens usando uma expressão regular para definir como a divisão é feita. Em seguida, você pode manter a coluna como um tipo de matriz ou aplicar uma transformação **Array To Columns** após esta, para extrair os valores da matriz nos campos de nível superior, supondo que cada token tenha um significado que conhecemos de antemão. Além disso, se a ordem dos tokens for irrelevante (por exemplo, um conjunto de categorias), você poderá usar a transformação **Explode** para gerar uma linha separada para cada valor. 

 Por exemplo, você pode dividir a coluna “categories” usando uma vírgula como padrão para adicionar uma coluna “categories\_arr”. 


| product\_id | categories | categories\_arr | 
| --- | --- | --- | 
| 1 | esportes, inverno | [esportes, inverno] | 
| 2 | jardim, ferramentas | [jardim, ferramentas] | 
| 3 | videogames | [videogames] | 
| 4 | jogo, jogo de tabuleiro, social | [jogo, jogo de tabuleiro, social] | 

**Para adicionar uma transformação Split String:**

1. Abra o painel Recurso e escolha Split String para adicionar uma nova transformação ao diagrama do trabalho. O nó selecionado no momento da adição do nó será o nó superior.

1. (Opcional) Na guia Propriedades do nó, insira um nome para o nó no diagrama do trabalho. Se ainda não houver um nó pai selecionado, escolha um na lista Node parents (Nós pais) para usar como fonte de entrada para a transformação.

1. Na guia **Transformar**, escolha a coluna a ser dividida e insira o padrão a ser usado para dividir a string. Na maioria dos casos, você pode simplesmente inserir o(s) caractere(s), a menos que tenha um significado especial como expressão regular e precise de escape. Os caracteres que precisam de escape são: `\.[]{}()<>*+-=!?^$|` adicionando uma barra invertida na frente do caractere. Por exemplo, se você quiser separar por um ponto ('.'), você precisa inserir `\.`. No entanto, uma vírgula não tem um significado especial e só pode ser especificada como está: `,`.  
![A captura de tela mostra a guia Transformar para a transformação Split String.](http://docs.aws.amazon.com/pt_br/glue/latest/dg/images/transforms-split-string-transform-tab.png)

1. (Opcional) Se você quiser manter a coluna de string original, poderá inserir um nome para uma nova coluna de matriz, mantendo assim a coluna de string original e a nova coluna de matriz tokenizada.