Running Trino with Alluxio

Slack Docker Pulls GitHub edit source

Trino 是一个开源的分布式 SQL 查询引擎,可以在大规模数据上运行交互式分析查询。 本指南介绍了如何使用 Alluxio 作为分布式缓存层在 Trino 上对 Alluxio 支持的任何数据存储系统(如 AWS S3、HDFS、Azure Blob Store、NFS 等)进行查询。 Alluxio 允许 Trino 从各种数据源获取数据,并将经常访问的数据(例如常用表)透明地缓存到 Alluxio 分布式存储中。 将 Alluxio worker 与 Trino worker 部署在一起可以提高数据本地性,并在其他存储系统远程或网络缓慢或阻塞时减少 I/O 访问延迟。

前置条件

  • Java 配置为 Java 11,版本不低于 11.0.7,64 位,与 Trino 要求一致
  • Python 版本为 2.6.x,2.7.x,或者 3.x,与 Trino 要求一致
  • 部署 Trino 这篇指南用 Trino-352 进行测试
  • Alluxio 已经被配置好而且开始运行
  • 确保 Alluxio client jar 可用 这个 Alluxio 客户端 jar 文件可以在从 Alluxio 下载页面下载的 tarball 中的 //client/alluxio-2.10.0-SNAPSHOT-client.jar 处找到
  • 请确保 Hive MetaStore 正在运行以提供 Hive table 的元数据信息

基本配置

配置 Trino 与 Hive Metastore

Trino 通过 Trino 的 Hive connector从 Hive 元数据仓库获取数据库和表元数据信息(包括文件系统位置)。 这里是一个 catalog 使用 Hive connector 的 Trino 配置文件示例 ${Trino_HOME}/etc/catalog/hive.properties,其中 Metastore 位于本地主机上

connector.name=hive-hadoop2
hive.metastore.uri=thrift://localhost:9083

将 Alluxio client jar 分发到所有 Trino 服务器上

为了使 Trino 能够与 Alluxio 服务器通信,必须将 Alluxio client jar 放在 Trino 服务器的 classpath 中。 将 Alluxio client jar /<PATH_TO_ALLUXIO>/client/alluxio-2.10.0-SNAPSHOT-client.jar 放到所有 Trino 服务器的路径 ${Trino_HOME}/plugin/hive-hadoop2/ 下 (此目录在不同版本中可能有所不同)。重启 Trino worker 和 coordinator:

$ ${Trino_HOME}/bin/launcher restart

在完成基本配置后,Trino 应该能够访问 Alluxio 中的数据。 要为 Trino 配置更高级的功能(例如,使用 HA 连接 Alluxio),请按照高级设置中的说明进行操作。

示例:使用 Trino 查询 Alluxio 上的表

在 Alluxio 上创建 Hive table

下面是一个在Hive中创建一个由Alluxio中的文件支持的内部表的例子。 你可以从 http://grouplens.org/datasets/movielens/ 下载数据文件(e.g. ml-100k.zip)。 解压该文件然后将 u.user 上传至 Alluxio 中的 /ml-100k/:

$ ./bin/alluxio fs mkdir /ml-100k
$ ./bin/alluxio fs copyFromLocal /path/to/ml-100k/u.user alluxio:///ml-100k

创建指向 Alluxio 文件位置的外部 Hive table。

hive> CREATE TABLE u_user (
  userid INT,
  age INT,
  gender CHAR(1),
  occupation STRING,
  zipcode STRING)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '|'
STORED AS TEXTFILE
LOCATION 'alluxio://master_hostname:port/ml-100k';

您可以通过访问 Alluxio WebUI http://master_hostname:19999 查看 Hive 创建的目录和文件。

启动Hive Metastore

确保您的 Hive Metastore 服务正在运行。Hive 元数据仓库默认情况下在端口 9083 上运行。如果未运行,请执行以下命令启动 Metastore:

$ ${HIVE_HOME}/bin/hive --service metastore

启动 Trino 服务器

启动你的 Trino 服务器。Trino 服务器默认情况下在端口 8080 上运行 (在 ${Trino_HOME}/etc/config.properties 中的 http-server.http.port 设置):

$ ${Trino_HOME}/bin/launcher run

用 Trino 查询表格

按照 Trino CLI 说明下载 trino-cli-<Trino_VERSION>-executable.jar,将其重命名为 trino,并使用 chmod +x 命令使其可执行(有时可执行文件 trino 存在于 ${trino_HOME}/bin/trino 中,您可以直接使用)。

运行单个查询(将 localhost:8080 替换为实际的 Trino 服务器主机名和端口):

$ ./trino --server localhost:8080 --execute "use default; select * from u_user limit 10;" \
  --catalog hive --debug

高级设置

定制化 Alluxio 用户属性

要配置其他 Alluxio 属性,您可以将包含 alluxio-site.properties 的配置路径(即 ${ALLUXIO_HOME}/conf)附加到 Trino 文件夹下的 etc/jvm.config 中 Trino 的 JVM 配置里。此方法的优点是在 alluxio-site.properties 的同一文件中设置所有 Alluxio 属性。

...
-Xbootclasspath/a:<path-to-alluxio-conf>

或者,将 Alluxio 配置项添加到 Hadoop 配置文件(core-site.xmlhdfs-site.xml)中,并在文件 ${Trino_HOME}/etc/catalog/hive.properties 中将每一个 Trino worker的属性 hive.config.resources 指向 Hadoop 资源的位置。

hive.config.resources=/<PATH_TO_CONF>/core-site.xml,/<PATH_TO_CONF>/hdfs-site.xml

示例:连接高可用模式(HA)的 Alluxio 集群

如果 Alluxio HA 集群使用Embedded Journal模式的高可用,请在 classpath 上的 alluxio-site.properties 文件中适当设置 Alluxio 集群属性。

alluxio.master.rpc.addresses=master_hostname_1:19998,master_hostname_2:19998,master_hostname_3:19998

或者,您可以将属性添加到 hive.config.resources 包含的 Hadoop core-site.xml 配置中。

<configuration>
  <property>
    <name>alluxio.master.rpc.addresses</name>
    <value>master_hostname_1:19998,master_hostname_2:19998,master_hostname_3:19998</value>
  </property>
</configuration>

有关如何连接使用基于 ZooKeeper(UFS Journal 模式)的 Alluxio 高可用集群,请参阅高可用模式客户端配置参数

示例:更改 Alluxio 默认写入类型

例如,将 alluxio.user.file.writetype.default 从默认值 ASYNC_THROUGH 更改为 CACHE_THROUGH

可以在 alluxio-site.properties 中指定该属性,并将此文件分发到每个 Trino 节点的 classpath:

alluxio.user.file.writetype.default=CACHE_THROUGH

或者,修改 conf/hive-site.xml 以包括:

<property>
  <name>alluxio.user.file.writetype.default</name>
  <value>CACHE_THROUGH</value>
</property>

增加并行度

Trino 的 Hive connector 使用配置 hive.max-split-size 来控制查询的并行性。 对于 Alluxio 1.6 或更早版本,建议将此大小设置为不小于 Alluxio 的块大小,以避免在同一块内的读冲突。 在 Alluxio 的后续版本中考虑到 Alluxio 的异步缓存能力,此问题不再存在。

避免 Trino 在读取大文件时超时

建议将 alluxio.user.streaming.data.timeout 的值增大(e.g. 10min),以避免从远端 worker 读取大文件时出现超时失败。