As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Convertendo SSIS para com AWS GlueAWS SCT
A seguir, você pode descobrir como converter pacotes SQL do Microsoft Server Integration Services (SSIS) em AWS Glue uso AWS SCT.
Para converter SSIS pacotes da Microsoft em AWS Glue, certifique-se de usar a AWS SCT versão 1.0.642 ou superior. Você também precisa ter um SSIS projeto com ETL pacotes —.dtsx
,.conmgr
, e .params
arquivos na pasta local.
Você não precisa de um SSIS servidor instalado. O processo de conversão passa pelos SSIS arquivos locais.
Para converter um SSIS pacote em AWS Glue uso AWS SCT
-
Crie um novo projeto AWS SCT ou abra um projeto existente. Para obter mais informações, consulte Iniciando e gerenciando projetos em AWS SCT.
-
Escolha Adicionar fonte no menu para adicionar um novo SSIS pacote de código-fonte ao seu projeto.
-
Escolha Serviços de integração de SQL servidores e conclua o seguinte:
-
Nome da conexão: Insira o nome da conexão. AWS SCT exibe esse nome na árvore de metadados.
-
SSISpasta de pacotes — Escolha o caminho para a pasta SSIS do seu projeto com pacotes.
AWS SCT lê os arquivos do projeto (arquivos com
.dtsx
as extensões.conmgr
ou.params
) da pasta local e os analisa. Em seguida, ele os organiza em uma AWS SCT árvore de categorias. -
-
Escolha Adicionar destino no menu para adicionar uma nova plataforma de destino para converter seus SSIS pacotes de origem.
-
Escolha AWS Glue e preencha o seguinte:
-
Nome da conexão: Insira o nome da conexão. AWS SCT exibe esse nome na árvore de metadados.
-
Copiar do AWS perfil — Escolha o perfil a ser usado.
-
AWS chave de acesso — Insira sua chave de AWS acesso.
-
AWS chave secreta — Insira sua chave AWS secreta.
-
Região — Escolha a Região da AWS que você deseja usar na lista.
-
Pasta de bucket do Amazon S3: Insira o caminho da pasta para o bucket do Amazon S3 que você planeja usar.
Você pode usar um AWS Glue alvo virtual. Nesse caso, você não precisa especificar as credenciais de conexão. Para obter mais informações, consulte Mapeamento para alvos virtuais no AWS Schema Conversion Tool.
-
-
Crie uma nova regra de mapeamento que inclua seu SSIS pacote de origem e seu AWS Glue destino. Para obter mais informações, consulte Mapeando novos tipos de dados no AWS Schema Conversion Tool.
-
No menu Visualizar, escolha Visualização principal.
-
Na exibição em SSIS árvore, abra o menu de contexto (clique com o botão direito do mouse) dos gerenciadores de conexões e escolha Configurar conexões.
-
Configure o gerenciador de conexões do projeto.
Para configurar um mapeamento de SSIS conexão para gerenciadores de conexão, especifique a AWS Glue conexão para o gerenciador de SSIS conexões correspondente. Certifique-se de que suas AWS Glue conexões já tenham sido criadas.
-
Em Conexões, escolha Conexões do projeto.
-
Para conexão com o catálogo Glue, escolha a AWS Glue conexão apropriada.
-
-
Configure o gerenciador de conexões de pacotes:
-
Em Conexões, escolha seu pacote.
-
Para conexão com o catálogo Glue, escolha a AWS Glue conexão apropriada.
-
Repita essas ações em todas as conexões disponíveis para seu pacote.
-
-
Escolha Aplicar.
-
Converta seu pacote. Na visualização da árvore de origem, encontre Pacotes. Abra o menu de contexto (clique com o botão direito do mouse) do pacote e escolha Converter pacote.
-
Salve o script convertido no Amazon S3. Na visualização da árvore de destino, encontre os Scripts de pacote. Abra o menu de contexto (clique com o botão direito do mouse) do script convertido e escolha Salvar no S3.
-
Configure seu AWS Glue trabalho. Na visualização da árvore de destino, encontre os Scripts de pacote. Abra o menu de contexto (clique com o botão direito do mouse) do script convertido e escolha Configurar AWS Glue tarefa.
-
Preencha as três seções de configuração a seguir.
-
Seção Fluxo de dados do projeto:
-
Estratégia de execução — Escolha como seu trabalho executará ETL os scripts. Escolha SEQUENTIALexecutar os scripts na ordem especificada no assistente. Escolha PARALLELexecutar os scripts em paralelo, desconsiderando a ordem especificada no assistente.
-
Scripts: Escolha o nome do script convertido.
-
Selecione Próximo.
-
-
Seção Propriedades da tarefa:
-
Nome — Insira o nome do seu AWS Glue trabalho.
-
IAMFunção — Escolha a IAM função usada para autorização dos recursos usados para executar o trabalho e acessar os armazenamentos de dados.
-
Nome do arquivo de script: Insira o nome do script convertido.
-
Caminho do arquivo de script do S3: Insira o caminho do Amazon S3 para seu script convertido.
-
Criptografar script usando SSE -S3 — Escolha essa opção para proteger os dados usando criptografia do lado do servidor com chaves de criptografia gerenciadas pelo Amazon S3 (-S3). SSE
-
Diretório temporário — Insira o caminho do Amazon S3 para um diretório temporário para obter resultados intermediários. AWS Glue e as transformações AWS Glue integradas usam esse diretório para ler ou gravar no Amazon Redshift.
-
AWS SCT gera automaticamente o caminho para as bibliotecas Python. Você pode revisar esse caminho em Caminho gerado da biblioteca Python. Não é possível editar esse caminho gerado automaticamente. Para usar bibliotecas Python adicionais, insira o caminho em Caminho da biblioteca Python do usuário.
-
Caminho da biblioteca Python: Insira os caminho de outras bibliotecas Python do usuário. Separe os caminhos do Amazon S3 com vírgulas.
-
Caminho de .jars dependentes: Insira os caminhos dos arquivos. jar dependentes. Separe os caminhos do Amazon S3 com vírgulas.
-
Caminho dos arquivos referenciados: Insira os caminhos para arquivos adicionais que são exigidos pelo seu script (por exemplo, arquivos de configuração). Separe os caminhos do Amazon S3 com vírgulas.
-
Capacidade máxima — insira o número máximo de unidades de processamento de AWS Glue dados (DPUs) que podem ser alocadas quando esse trabalho é executado. Você pode inserir qualquer número inteiro de 2 a 100. O padrão é 2.
-
Simultaneidade máxima: Insira o número máximo de execuções simultâneas permitidas para a tarefa. O padrão é 1. AWS Glue retorna um erro quando esse limite é atingido.
-
Tempo limite do trabalho (minutos) — Insira o valor do tempo limite do seu ETL trabalho como uma proteção contra trabalhos descontrolados. O padrão é 2.880 minutos (48 horas) para tarefas em lotes. Se a tarefa exceder esse limite, seu estado da execução é alterado para
TIMEOUT
. -
Limite de notificação de atraso (minutos) — Insira o limite em minutos antes de AWS SCT enviar uma notificação de atraso.
-
Número de novas tentativas — insira o número de vezes (0 a 10) que AWS Glue devem reiniciar automaticamente a tarefa se ela falhar. As tarefas que atingem o limite de tempo não são reiniciadas. O padrão é 0.
-
Escolha Próximo.
-
-
Configure as conexões necessárias:
-
Em Todas as conexões, escolha as AWS Glue conexões necessárias e adicione-as à lista de conexões selecionadas.
-
Escolha Terminar.
-
-
-
Crie um AWS Glue trabalho configurado. Na visualização da árvore de destino, encontre e expanda ETLTrabalhos. Abra o menu de contexto (clique com o botão direito do mouse) do ETL trabalho que você configurou e escolha Create AWS Glue Job.
-
Execute o AWS Glue trabalho:
-
Abra o AWS Glue console em https://console.aws.amazon.com/glue/
. -
No painel de navegação, escolha Tarefas.
-
Escolha Adicionar tarefa e, em seguida, escolha a tarefa que você deseja executar.
-
Na guia Ações, selecione Executar.
-
SSIScomponentes que AWS SCT podem ser convertidos em AWS Glue
Você pode usar AWS SCT para converter componentes de fluxo de dados e fluxo de controle, bem como contêineres, parâmetros e variáveis.
Os componentes de fluxo de dados compatíveis incluem os seguintes:
ADONETDestino
ADONETFonte
Agregar
Transformação de cache
Transformação do mapa de caracteres
Transformação de divisão condicional
Transformação da coluna de cópia
Transformação da conversão de dados
Transformação de coluna derivada
Destino do Excel
Origem do Excel
Transformação da exportação de coluna
Destino do arquivo simples
Origem do arquivo simples
Transformação de Pesquisa Difusa
Transformação da coluna de importação
Transformação de Pesquisa
Transformação de junção de mesclagem
Transformação de mesclagem
Transformação multicast
ODBCDestino
ODBCFonte
OLETransformação de comandos do DB
OLEDestino do DB
OLEFonte de banco de dados
Transformação de amostragem percentual
Transformação de articulação
Destino do arquivo bruto
Origem do arquivo bruto
RecordSet Destino
Transformação da contagem de linhas
Transformação de amostragem de linhas
Transformação de classificação
SQLDestino do servidor
Transformação de Union All
Transformação de desarticulação
XMLFonte
Os componentes de controle de fluxo suportados incluem os seguintes:
Tarefa de inserção em massa
Tarefa de execução do pacote
Executar SQL tarefa
Executar tarefa de SQL instrução T
Tarefa de expressão
Tarefa de sistema de arquivos
Tarefa de notificação do operador
Tarefa de enviar e-mail
SSISOs contêineres compatíveis incluem o seguinte:
Contêiner For Loop
Contêiner Foreach Loop
Contêiner de sequência