Diferentes maneiras de colocar dados na Amazon EMR - Amazon EMR

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Diferentes maneiras de colocar dados na Amazon EMR

EMRA Amazon fornece várias maneiras de colocar dados em um cluster. A forma mais comum é fazer o upload dos dados para o Amazon S3 e usar os recursos integrados da Amazon EMR para carregar os dados no seu cluster. Você também pode usar o DistributedCache recurso do Hadoop para transferir arquivos de um sistema de arquivos distribuído para o sistema de arquivos local. A implementação do Hive fornecida pela Amazon EMR (Hive versão 0.7.1.1 e posterior) inclui funcionalidades que você pode usar para importar e exportar dados entre o DynamoDB e um cluster da Amazon. EMR Se você tiver grandes quantidades de dados locais para processar, poderá encontrar o AWS Direct Connect serviço útil.