As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Por padrão, as informações de usuários do Hue e os histórico de consultas são armazenados em um banco de dados MySQL local no nó principal. Como opção, você pode criar um ou mais clusters habilitados para o Hue usando uma configuração armazenada no Amazon S3 e um banco de dados MySQL no Amazon Relational Database Service (Amazon RDS). Isso permite que você mantenha as informações dos usuários e o histórico de consultas criados pelo Hue sem manter o cluster do Amazon EMR em execução. Recomendamos o uso da criptografia do lado do servidor do Amazon S3 para armazenar o arquivo de configuração.
Primeiro, crie o banco de dados remoto para o Hue.
Para criar o banco de dados MySQL externo
-
Abra o console do Amazon RDS em https://console.aws.amazon.com/rds/
. -
Clique em Launch a DB Instance (Iniciar uma instância de banco de dados).
-
Escolha MySQL e clique em Select (Selecionar).
-
Deixe a seleção padrão de Multi-AZ Deployment and Provisioned IOPS Storage (Implantação Multi-AZ e armazenamento de IOPS provisionadas) e clique em Next (Próximo).
-
Deixe as especificações da instância em seus valores padrão, especifique configurações e clique em Next (Próximo).
-
Na página Configure Advanced Settings, escolha um nome de security group apropriado e o nome do banco de dados. O security group que você usar deve permitir pelo menos o acesso TCP de entrada para a porta 3306 a partir do nó principal do seu cluster. Se você não tiver criado o cluster neste ponto, poderá permitir que todos os hosts se conectem à porta 3306 e ajustar o security group depois de ter executado o cluster. Clique em Launch DB Instance (Iniciar instância de banco de dados).
-
Em RDS Dashboard (Painel do RDS), selecione Instances (Instâncias) e selecione a instância que você acabou de criar. Quando seu banco de dados estiver disponível, anote o nome do banco de dados, o nome de usuário, a senha e o nome de host da instância do RDS. Você usará essas informações ao criar e configurar o cluster.
Para especificar um banco de dados MySQL externo para o Hue ao iniciar um cluster usando o AWS CLI
Para especificar um banco de dados MySQL externo para o Hue ao iniciar um cluster usando o AWS CLI, use as informações que você observou ao criar sua instância do RDS para configuração com um objeto de configuraçãohue.ini
.
nota
Você pode criar vários clusters que usam o mesmo banco de dados externo, mas cada cluster compartilhará informações de usuários e o histórico de usuários.
-
Usando o AWS CLI, crie um cluster com o Hue instalado, usando o banco de dados externo que você criou e referenciando um arquivo de configuração com uma classificação de configuração para o Hue que especifica as propriedades do banco de dados. O exemplo a seguir cria um cluster com o Hue instalado, fazendo referência a um arquivo de configuração no Amazon S3,
myConfig.json
, que especifica a configuração do banco de dados.nota
Os caracteres de continuação de linha do Linux (\) são incluídos para facilitar a leitura. Eles podem ser removidos ou usados em comandos do Linux. No Windows, remova-os ou substitua-os por um sinal de interpolação (^).
aws emr create-cluster --release-label
emr-7.8.0
--applications Name=Hue Name=Spark Name=Hive \ --instance-typem5.xlarge
--instance-count3
\ --configurationshttps://s3.amazonaws.com/amzn-s3-demo-bucket/myfolder/myConfig.json
--use-default-rolesOs conteúdos de exemplo do arquivo
myConfig.json
são mostrados abaixo. Substituadbname
username
,password
,, eRDS instance hostname
pelos valores que você anotou anteriormente no Painel do RDS.[{ "Classification": "hue-ini", "Properties": {}, "Configurations": [ { "Classification": "desktop", "Properties": {}, "Configurations": [ { "Classification": "database", "Properties": { "name": "
dbname
", "user": "username
", "password": "password
", "host": "RDS instance hostname
", "port": "3306", "engine": "mysql" }, "Configurations": [] } ] } ] }]
Solução de problemas
No caso de um failover do Amazon RDS
É possível que os usuários encontrem atrasos ao executar uma consulta, pois a instância de banco de dados do Hue não está respondendo ou está em processo de failover. Veja a seguir estão alguns fatos e diretrizes para esse problema:
-
Se você fizer login no console do Amazon RDS, poderá procurar eventos de failover. Por exemplo, para ver se um failover é em andamento ou já ocorreu, procure eventos como "Multi-AZ instance failover started" e "Multi-AZ instance failover completed".
-
Leva cerca de 30 segundos para uma instância do RDS concluir um failover.
-
Se você estiver recebendo longer-than-normal respostas para consultas no Hue, tente reexecutar a consulta.