这里写目录标题
- 简要说明
- 依赖
- 代码
简要说明
通过简单修改源码中关于相关的reader、writer和DBUtil工具类,实现表到表之间的Geometry字段类型数据的输送,目前修改仅测试过在postgresql的postgis插件下的Geometry类型可行。
依赖
1.通过gitclone 或者 到github 下载dataX的源码
2.后期的本地测试debug方式,可参考 https://blog.csdn.net/qq_41613913/article/details/140638920
代码
用ide 打开项目后,找到相应的模块进行修改。
1.CommonRdbmsReader类的修改
在模块plugin-rdbms-util下,找到CommonRdbmsReader类,找到buildRecord方法。
因为在关系型数据库下的读数据都是通过CommonRdbmsReader封装的逻辑,在现在的框架下,是不支持geometry类型的字段的,你可以通过java.sql.Types了解到,并没有geometry的对应值,所以通过jdbc connection执行得到的字段元数据中,geometry的数据库类型被标注为‘1111’(代表其他),所以我们必须做些特殊处理
修改如下:
即是在组装record时,遍历读取到的数据时,当columnTypeName为geometry时,当成字符串处理。
2.PostgresqlWriter类型的修改
其中calcValueHolder() 方法的意义,你可以理解为字段值的类型指明
3.DBUtil工具类的修改
在写入目标表时,会先查询目标表的字段类型,而Triple<List, List, List> 分别代表Left:ColumnName Middle:ColumnType Right:ColumnTypeName,因为在现有的代码中,中间的ColumnType 当是‘1111’ 时,CommonRdbmsWriter是不支持处理的,所以对应读取时的修改,这里直接当做普通字符串去处理。
至此,修改完毕,进行打包,替换jar
只需打包部分模块,将最外层的pom.xml文件中,只保留
<module>common</module><module>core</module><module>transformer</module><module>postgresqlreader</module><module>postgresqlwriter</module><module>plugin-rdbms-util</module>
拿到postgresqlreader-0.0.1-SNAPSHOT.jar、postgresqlwriter-0.0.1-SNAPSHOT.jar和plugin-rdbms-util-0.0.1-SNAPSHOT.jar后,替换本地或者服务器上的plugin目录下reader 和 writer 的对应的jar,比如reader下