As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Inicialização de uma aplicação do Spark usando a integração do Amazon Redshift para Apache Spark
Para as EMR versões 6.4 a 6.9 da Amazon, você deve usar a --packages
opção --jars
ou para especificar quais dos seguintes JAR arquivos você deseja usar. A --jars
opção especifica dependências armazenadas localmenteHDFS, em ou usando HTTP /S. Para ver outras localizações de arquivos suportadas pela --jars
opção, consulte Gerenciamento avançado de dependências--packages
especifica dependências armazenadas no repositório público Maven.
-
spark-redshift.jar
-
spark-avro.jar
-
RedshiftJDBC.jar
-
minimal-json.jar
As EMR versões 6.10.0 e superiores da Amazon não exigem a minimal-json.jar
dependência e instalam automaticamente as outras dependências em cada cluster por padrão. Os exemplos a seguir mostram como iniciar uma aplicação do Spark com a integração do Amazon Redshift para Apache Spark.