1.前言DataX阿里在开源的时候没有提供任何可视化界面。在使用过程中,我们需要将Json配置文件放到Datax的job路径下。随着业务的发展Added,配置文件不方便管理和迁移,每次执行命令都需要记录。DataX目前只支持单机版,无法控制多个节点之间的协同。我们希望有一个友好的可视化界面,支持定时任务,支持分布式数据同步工具,这也是这个项目的目标。2、开发环境平台主要用于数据同步、数据处理等ETL操作。该平台基于阿里开源同步工具datax3.0开发。平台开发语言Java8,对平台运行环境无要求。数据库Mysql5.7。Python2.7(要支持Python3,需要修改替换datax/bin下的三个python文件,替换文件在doc/datax源码阅读笔记/datax-python3下)。项目地址:https://github.com/WeiYe-Jing/datax-web三、项目运行1、下载datax的打包文件或从github上拉取datax代码包,配置环境变量。DATAX_HOME=G:\learndemo\springboot-datax\datax\bin2。执行datax-web/db下的sql文件,修改application.yml数据库配置信息。3.application.yml配置数据提取日志文件保存路径。etlLogDir:D:\temp\logs\datax-web\4.idea启动datax-admin5。启动成功后,打开页面http://localhost:8080/index.html#/datax/job6。单击作业配置以创建job7。创建作业后,点击同步任务,选择任务,点击开始8.可以点击查看日志,实时获取日志信息。4.开发计划[x]springboot重构项目[x]集成swagger方便调试[x]集成mybatisplus和Mysql数据库存储应用数据[x]在网页修改job配置的json持久化到数据库[x]网页实时查看提取日志,类似Jenkins的日志控制台输出功能[x]实时查看提取日志BUG功能修复2019-11-07[]Job运行记录展示,页面operationstopdataxjob(开发中)[]实现datax分布式作业(开发中)[]实现datax综合定时任务(开发中)[]网页各种阅读编写插件模板生成,可以在上面组装使用页面[]实现部分写作插件支持自动建表功能[]QQ交流群776939467
