

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Habilitar o confirmador otimizado para EMRFS S3 do Hive
<a name="hive-optimized-committer"></a>

O confirmador otimizado para EMRFS S3 do Hive é uma forma alternativa pela qual o Hive no EMR grava arquivos para inserir consultas ao ser usado o EMRFS. O confirmador elimina as operações de listar e renomear feitas no Amazon S3 e melhora a performance da aplicação. O atributo está disponível desde o EMR 5.34 e o EMR 6.5.

## Habilitar o confirmador
<a name="enabling-hive-committer"></a>

Se você quiser permitir que o Hive no EMR use `HiveEMRFSOptimizedCommitter` para confirmar dados como padrão para todas as tabelas externas e gerenciadas do Hive, use a seguinte configuração `hive-site` nos clusters do EMR 6.5.0 ou do EMR 5.34.0.

```
[
   {
      "classification": "hive-site",
      "properties": {
         "hive.blobstore.use.output-committer": "true"
      }
   }
]
```

**nota**  
Não ative esse atributo quando `hive.exec.parallel` estiver definido como `true`.

## Limitações
<a name="hive-committer-limitations"></a>

As restrições básicas a seguir se aplicam a tags:
+ Não há suporte para habilitar o Hive para mesclar arquivos pequenos automaticamente. A lógica de confirmação padrão do Hive será usada mesmo quando o confirmador otimizado estiver habilitado.
+ As tabelas ACID do Hive não são suportadas. A lógica de confirmação padrão do Hive será usada mesmo quando o confirmador otimizado estiver habilitado.
+ A nomenclatura de nomeação para arquivos gravados foi alterada de `<task_id>_<attempt_id>_<copy_n>` para `<task_id>_<attempt_id>_<copy_n>_<query_id>` do Hive. Por exemplo, um arquivo denominado 

  `s3://warehouse/table/partition=1/000000_0` será alterado para `s3://warehouse/table/partition=1/000000_0-hadoop_20210714130459_ba7c23ec-5695-4947-9d98-8a40ef759222-1`. A `query_id` aqui é uma combinação de nome de usuário, carimbo de data/hora e UUID.
+ Quando partições personalizadas estão em sistemas de arquivos diferentes (HDFS, S3), esse atributo é automaticamente desabilitado. A lógica de confirmação padrão do Hive será usada quando estiver habilitada.