Inicialização de uma aplicação do Spark usando a integração do Amazon Redshift para Apache Spark

Para as EMR versões 6.4 a 6.9 da Amazon, você deve usar a --packages opção --jars ou para especificar quais dos seguintes JAR arquivos você deseja usar. A --jars opção especifica dependências armazenadas localmenteHDFS, em ou usando HTTP /S. Para ver outras localizações de arquivos suportadas pela --jars opção, consulte Gerenciamento avançado de dependências na documentação do Spark. A opção --packages especifica dependências armazenadas no repositório público Maven.

spark-redshift.jar
spark-avro.jar
RedshiftJDBC.jar
minimal-json.jar

As EMR versões 6.10.0 e superiores da Amazon não exigem a minimal-json.jar dependência e instalam automaticamente as outras dependências em cada cluster por padrão. Os exemplos a seguir mostram como iniciar uma aplicação do Spark com a integração do Amazon Redshift para Apache Spark.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Usar o Spark no Amazon Redshift

Autenticação no Amazon Redshift