Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Trino
Trino est un moteur de requêtes open source conçu pour les requêtes interactives sur un large éventail de sources de données. Il peut s'agir de bases de données relationnelles, de données basées sur des fichiers, de données HDFS, etc. L'objectif le plus courant de Trino avec Amazon EMR est d'exécuter des requêtes SQL complexes sur de grands ensembles de données stockés dans Amazon S3. Il est également conforme à la norme ANSI SQL, ce qui le rend familier aux ingénieurs de bases de données, aux analystes de données et aux scientifiques des données familiarisés avec le SQL.
Note
PrestoSQL a été renommé Trino en décembre 2020. Les versions 6.4.0 et ultérieures d'Amazon EMR font généralement référence à Trino
Important
PrestoSQL, la version précédente de Trino, est toujours disponible pour une utilisation avec Amazon EMR. Cependant, nous recommandons vivement d'utiliser Trino à l'avenir avec Amazon EMR. Notez également que Trino et PrestoSQL ne peuvent pas fonctionner simultanément sur le même cluster.
Le tableau suivant répertorie la version de Trino incluse dans la dernière version d'Amazon EMR 7.x, ainsi que les composants qu'Amazon EMR installe avec Trino. Pour la version des composants installés avec Trino dans cette version, voir Versions des composants de la version 7.8.0.
Étiquette de version Amazon EMR | Version Trino | Composants installés avec Trino |
---|---|---|
emr-7,8.0 |
Trino 467 |
emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hive-client, hudi, hudi-trino, hcatalog-server, mariadb-server, trino-coordinator, trino-worker |