As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
O Trino é um mecanismo de consulta de código aberto projetado para consultas interativas em uma ampla variedade de fontes de dados. Isso pode incluir bancos de dados relacionais, dados baseados em arquivos, dados HDFS e outros. O objetivo mais comum do Trino com o Amazon EMR é executar consultas SQL complexas em grandes conjuntos de dados armazenados no Amazon S3. Também é compatível com o ANSI SQL, o que o torna familiar para engenheiros de banco de dados, analistas de dados e cientistas de dados que estão familiarizados com o SQL.
nota
O PrestoSQL foi renomeado para Trino em dezembro de 2020. As versões 6.4.0 e posteriores do Amazon EMR geralmente se referem ao Trino
Importante
O PrestoSQL, a versão anterior do Trino, ainda está disponível para uso com o Amazon EMR. No entanto, é altamente recomendável usar o Trino no futuro com o Amazon EMR. Observe também que o Trino e o PrestoSQL não podem ser executados simultaneamente no mesmo cluster.
A tabela a seguir lista a versão do Trino incluída na versão mais recente do Amazon EMR 7.x, junto com os componentes que o Amazon EMR instala com o Trino. Para a versão dos componentes instalados com o Trino nesta versão, consulte Versões de componentes da versão 7.8.0.
Rótulo de versão do Amazon EMR | Versão Trino | Componentes instalados com o Trino |
---|---|---|
emr-7.8.0 |
Trino 467 |
emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hive-client, hudi, hudi-trino, hcatalog-server, mariadb-server, trino-coordinator, trino-worker |