Skip to content

Latest commit

 

History

History
257 lines (175 loc) · 12.8 KB

README_CN.md

File metadata and controls

257 lines (175 loc) · 12.8 KB

Apache SeaTunnel

seatunnel logo

Backend Workflow Slack Twitter Follow


EN doc

SeaTunnel的前身是Waterdrop,并于2021年10月12日更名为SeaTunnel。


那么,SeaTunnel是什么? SeaTunnel是下一代超高性能、分布式、海量数据集成工具。它每天可以稳定高效地同步数百亿个数据,并已在许多公司的生产中使用。SeaTunnel-web为SeaTunnel提供可视化界面,方便用户使用Apache SeaTunnel。

如果你想知道更多关于SeaTunnel的设计。 👉🏻设计

如何开始

注意:一些细节请参考 docs/QuickStart.md

1 准备Apache SeaTunnel环境

因为SeaTunnel Web使用SeaTunnel Java客户端来提交作业,所以运行SeaTunnel Web需要首先准备SeaTunnel Zeta Engine服务。

根据SeaTunnel Zeta Engine的使用要求,提交作业的SeaTunnel Client节点必须与运行作业的SeaTunnel Server节点具有相同的操作系统和安装目录结构。比如如果你想在本地IDEA中运行SeaTunnel Web,你必须在与IDEA相同的机器上安装和运行SeaTunnel Zeta引擎服务器。

别担心,接下来的步骤将告诉您如何在不同情况下正确安装SeaTunnel Zeta Engine Server。

2 在IDEA中运行SeaTunnel Web

如果您想部署和运行SeaTunnel Web,请转到 [3 Run SeaTunnel Web In Server](#3 Run SeaTunnel Web In Server)

2.1 安装SeaTunnel Zeta引擎服务器

有两种方法可以获得SeaTunnel安装包。从源代码构建或从SeaTunnel网站下载。

此处使用的SeaTunnel版本仅用于编写本文档以向您展示所使用的过程,并不一定代表正确的版本。SeaTunnel Web和SeaTunnel Engine有严格的版本依赖关系,您可以通过确认具体的版本对应关系。现在只支持在本地构建SeaTunnel Web和SeaTunnel Zeta Engine,因为有必要确保SeaTunnel Web中的SeaTunnel-api与SeaTunnel Zeta Engine中的版本相同

2.1.1 从源代码构建和部署
  • https://seatunnel.apache.org/downloadhttps://github.com/apache/seatunnel.git 获取源包
  • 请按照 从源码构建 SeaTunnel 来构建 SeaTunnel
  • 在构建之后,需要设置一个环境变量ST_WEB_BASEDIR_PATH来表示数据源shade包的位置。将使用自定义类加载器来基于此加载数据源shade包。例如:ST_WEB_BASEDIR_PATH=/seatunnel-web-dist/target/apache-seatunnel-web-1.0.3-SNAPSHOT/ 然后你可以在${Your_code_dir}/seatunnel-dist/target下获取安装包,例如:apache-seatunnel-2.3.8-bin.tar.gz
  • 执行tar -zxvf apache-seatunnel-2.3.8-bin.tar.gz解压安装包。
  • 运行cd apache-seatunnel-2.3.8 & sh bin/seatunnel-cluster.sh -d运行SeaTunnel Zeta Engine Server。
  • SeaTunnel Zeta Engine Server默认占用5801端口,请确认端口5801正在被SeaTunnelServer进程占用。
2.1.2 下载安装程序包并进行部署

下载安装包并部署SeaTunnel Zeta Engine Server的另一种安装方式是从 https://seatunnel.apache.org/download 下载安装包并部署。

2.2 初始化数据库

  1. 编辑 seatunnel-server/seatunnel-app/src/main/resources/script/seatunnel_server_env.sh 文件, 填写已安装的数据库 address, port, username, and password. 下面是一个例子:

    export HOSTNAME="localhost"
    export PORT="3306"
    export USERNAME="root"
    export PASSWORD="123456"
    
  2. 执行命令 sh seatunnel-server/seatunnel-app/src/main/resources/script/init_sql.sh 如果运行过程中没有错误,则说明初始化成功。

2.3 构建项目

sh build.sh code

2.4 配置应用程序并运行SeaTunnel Web后端服务器

  1. 编辑 seatunnel-server/seatunnel-app/src/main/resources/application.yml 写数据库连接信息

img.png

  1. 编辑 seatunnel-server/seatunnel-app/src/main/resources/application.yml 添加 jwt.secretKey 值. 例如: https://github.com/apache/seatunnel (注意: 不能太短).
  2. 复制 apache-seatunnel-2.3.8/connectors/plugin-mapping.properties 文件 到 seatunnel-web/seatunnel-server/seatunnel-app/src/main/resources 目录.
  3. 运行 seatunnel-server/seatunnel-app/src/main/java/org/apache/seatunnel/app/SeatunnelApplication.java 如果没有报错,说明seatunnel web后端服务启动成功。注意,你必须设置 -DSEATUNNEL_HOME=${your_seatunnel_install_path} 像这样:

img.png

由于数据源插件是动态加载的,所以需要设置相关的环境变量:

img.png

2.3 运行SeaTunnel Web Front End

cd seatunnel-ui
npm install
npm run dev

如果操作正常,系统显示如下信息:

  ➜  Local:   http://127.0.0.1:5173/
  ➜  Network: use --host to expose
  ➜  press h to show help

在浏览器中访问 http://127.0.0.1:5173/login , 默认用户名和密码是 admin/admin

3 在服务器上运行 SeaTunnel Web

要在服务器上运行SeaTunnel Web,首先需要有一个SeaTunnel Zeta引擎服务器环境。如果还没有,可以参考以下步骤进行部署。

3.1 在Server Node中部署SeaTunnel Zeta Engine Server

有两种方法可以获得SeaTunnel安装包。从源代码构建或从SeaTunnel网站下载。

此处使用的SeaTunnel版本仅用于编写本文档以向您展示所使用的过程,并不一定代表正确的版本。SeaTunnel Web和SeaTunnel Engine有严格的版本依赖关系,您可以通过xxx确认具体的版本对应关系

3.1.1 从源码编译
  • https://seatunnel.apache.org/downloadhttps://github.com/apache/seatunnel.git 获取源码包
  • 使用maven命令编译安装包 ./mvnw -U -T 1C clean install -DskipTests -D"maven.test.skip"=true -D"maven.javadoc.skip"=true -D"checkstyle.skip"=true -D"license.skipAddThirdParty"
  • 然后您可以在${您的代码目录}/seatunnel-dist/target中获得安装包,例如:apache-seatunnel-2.3.8-bin.tar.gz
3.1.2 下载安装包

获取 SeaTunnel Zeta 引擎服务安装包的另一种方式是从 https://seatunnel.apache.org/download 下载安装包并在线安装插件。

  • 下载并安装连接器插件(这个过程中也会自动下载和安装一些第三方依赖包,比如 hadoop jar)。您可以参考 https://seatunnel.apache.org/docs/2.3.8/start-v2/locally/deployment 获取详细步骤。
  • 完成上述步骤后,您将获得一个可以用于在服务器上安装 SeaTunnel Zeta 引擎服务的安装包。运行 tar -zcvf apache-seatunnel-2.3.8-bin.tar.gz apache-seatunnel-2.3.8
3.1.3 部署 SeaTunnel Zeta 服务端

在完成 3.1.1 或 3.1.2 后您可以获得一个安装包 apache-seatunnel-2.3.8-bin.tar.gz,然后您可以将其复制到服务器节点并参考 https://seatunnel.apache.org/docs/seatunnel-engine/deployment 进行部署。

3.1.4 在 SeaTunnel Web 运行节点部署 SeaTunnel Zeta 客户端

如果您使用 SeaTunnel Web,您需要在 SeaTunnel Web 运行节点部署一个 SeaTunnel Zeta 客户端。如果 SeaTunnel Zeta 服务端和 SeaTunnel Web 在同一节点,您可以跳过此步骤

  • apache-seatunnel-2.3.8-bin.tar.gz 复制到 SeaTunnel Web 节点并解压,解压到与 SeaTunnel Zeta 服务端节点相同的路径下
  • 和 SeaTunnel Zeta 服务端节点相同,设置 SEATUNNEL_HOME 环境变量。
  • 参考 https://seatunnel.apache.org/docs/seatunnel-engine/deployment#6-config-seatunnel-engine-client 配置 hazelcast-client.yaml
  • 运行 $SEATUNNEL_HOME/bin/seatunnel.sh --config $SEATUNNEL_HOME/config/v2.batch.config.template,如果该作业运行结束,表示客户端部署成功。

3.2 从源码构建 SeaTunnel Web 安装包

cd seatunnel-web
sh build.sh code

然后您可以在 seatunnel-web/seatunnel-web-dist/target/apache-seatunnel-web-${project.version}.tar.gz 目录中获得安装包。

3.3 安装

apache-seatunnel-web-${project.version}.tar.gz 复制到服务器节点并解压。

tar -zxvf apache-seatunnel-web-${project.version}.tar.gz

3.4 初始化数据库

  1. 编辑 apache-seatunnel-web-${project.version}/script/seatunnel_server_env.sh 文件, 填写已安装的数据库 address, port, username, and password. 例如:

    export HOSTNAME="localhost"
    export PORT="3306"
    export USERNAME="root"
    export PASSWORD="123456"
    
  2. 运行初始化脚本 sh apache-seatunnel-web-${project.version}/script/init_sql.sh 如果操作过程中没有错误,表示初始化成功。

3.5 配置应用并运行 SeaTunnel Web 后端服务

  • 编辑 apache-seatunnel-web-${project.version}/conf/application.yml 在文件中填写数据库连接信息和数据服务接口相关信息。
  • 编辑 apache-seatunnel-web-${project.version}/conf/application.yml 文件, 填写 jwt.secretKey 密钥. 例如: https://github.com/apache/seatunnel (注意: 不能太短).

image

  • 复制 $SEATUNNEL_HOME/config/hazelcast-client.yamlapache-seatunnel-web-${project.version}/conf/
  • 复制 apache-seatunnel-2.3.8/connectors/plugin-mapping.properties 文件到 apache-seatunnel-web-${project.version}/conf/ 目录.

3.6 运行 SeaTunnel Web

cd apache-seatunnel-web-${project.version}
sh bin/seatunnel-backend-daemon.sh start

在浏览器中访问 http://127.0.0.1:8801/ui/ , 默认用户名和密码是 admin/admin.

如何使用

完成所有前置工作后,我们可以打开以下网址: http://127.0.0.1:7890(请根据您的配置替换)来使用它。

现在,让我向您展示如何使用它。

用户管理

img.png

任务管理

img.png

数据源管理

img.png

虚拟表

img.png

功能

1 配置占位符

占位符用于配置中,表示将在运行时或处理过程中动态替换的值。 它们允许根据需要注入特定值,从而增强配置灵活性和可重用性。

1.1 占位符格式

${p1:v1}:p1 是配置值的占位符。如果在执行时未提供 p1 值,则使用默认值 v1。 ${p1}:如果在执行时未提供 p1 值,则执行将失败并出现错误。

1.2 转义占位符

要转义占位符,请在占位符前添加反斜杠。例如,\${p1:v1} 或 \${p1}。 当您想将占位符按原样传递给引擎而不替换 Seatunnel-web 中的值时,这是必需的。

1.3 Seatunnel-web 如何处理占位符

在作业执行期间,在将作业发送到引擎之前,Seatunnel-web 会替换占位符中的实际值。这可确保实际执行的作业记录在 Seatunnel-web 历史记录中。

注意:此功能目前在通过 API 执行时很有用。UI 不提供传递占位符值的选项。

升级

1. 从 1.0.1 或之前版本升级到 1.0.2 或之后版本。

执行以下 SQL 升级数据库:

ALTER TABLE `t_st_job_instance` ADD COLUMN `error_message` varchar(4096) CHARACTER SET utf8mb4 COLLATE utf8mb4_bin NULL DEFAULT NULL;

2. 从1.0.2或更早版本升级到1.0.3或更高版本。

  • 执行以下SQL语句以升级数据库:
      ALTER TABLE `user` ADD COLUMN `auth_provider` varchar(10) CHARACTER SET utf8mb4 COLLATE utf8mb4_bin NOT NULL DEFAULT 'DB';
    
  • 启用LDAP支持,
    • 要启用LDAP支持,您需要在application.yml文件中添加LDAP服务器配置,并将LDAP包含在认证提供者列表中。
    • 如果未定义任何认证提供者,将使用默认的DB策略,不需要做任何更改。
    • 以下是认证提供者和LDAP服务器设置的示例配置。
       # sample application.yaml
       spring:
         ldap:
           url: ldap://localhost:389
           search:
           base: ou=people,dc=example,dc=com
           filter: (uid={0})
           domain: example.com
      seatunnel:
        authentication:
          providers:
            - DB
            - LDAP