对话新晋 Apache SeaTunnel Committer:张圣航的开源之路与技术洞察

近日,张圣航被推选为 Apache SeaTunnel 的 Committer成员。带着对技术的热情和社区的责任,他将如何跟随 Apache SeaTunnel 社区迈向新的高度?让我们一起来聆听他的故事。

自我介绍

请您简单介绍一下自己,包括职业背景、当前的工作以及加入 Apache SeaTunnel 社区的起点。

在这里插入图片描述

  • **您的全名:**张圣航
  • **邮箱:**shenghang@apache.org
  • **当前职位/角色:**大数据架构师
  • **主要技术方向:**从事汽车行业,大数据架构师,负责数据平台整体工作,主导数据运维、同步、开发等平台建设,为业务系统提供高效数据支撑。
  • **加入SeaTunnel社区的时间:**2024年6月
  • **最初如何接触到SeaTunnel这个项目的:**当时使用的是 DataX ,而 DataX 作为一款经典单机离线的数据集成工具,缺乏服务化及分布式处理能力,在大规模数据同步场景下存在明显局限,需要一款更全面的数据集成框架,基于以上痛点,我们选择并使用了Apache SeaTunnel!

社区贡献之路

您在成为 Committer 之前,对社区都有哪些贡献?

您的第一个贡献是什么?
  • Kafka 消费者组自动提交偏移量逻辑错误的修复
哪些具体的功能、改进或活动是您主导的?
  • 新增 Seatunnel Engine 任务调度 Pendding 队列特性
    • https://github.com/apache/seatunnel/pull/7693
  • 支持 Kafka Protobuf 数据格式支持
    • https://github.com/apache/seatunnel/pull/7361
  • 支持 Kerberos 在 e2e 中的测试
    • https://github.com/apache/seatunnel/pull/8108
    • https://github.com/apache/seatunnel/pull/8159
  • 新增 Seatunnel Engine资源调度算法
    • https://github.com/apache/seatunnel/pull/8233
  • 新增 Hbase Sink TTL 特性
    • https://github.com/apache/seatunnel/pull/7116
  • 新增 Api 获取日志特性
    • https://github.com/apache/seatunnel/pull/7818
  • 修复Flink Source Busy 100%忙碌问题
    • https://github.com/apache/seatunnel/pull/8354
  • 支持 Typesense 连接器
    • https://github.com/apache/seatunnel/pull/7450
  • 支持配置变量的默认值替换
    • https://github.com/apache/seatunnel/pull/7562
  • 修复 Doris 自定义 SQL 未执行问题
    • https://github.com/apache/seatunnel/pull/7464
  • 修复Kafka消费者组自动提交偏移量逻辑错误
    • https://github.com/apache/seatunnel/pull/6961
  • 修复Flink模式下 RabbitMQ checkpoint 异常等
    • https://github.com/apache/seatunnel/pull/7108
在贡献过程中,您遇到了哪些挑战,又是如何克服的?
  • Engine、Connector、Transform每一个环节都有大量源码,在学习的过程中还是有一点难度,非常感谢社区的技术小伙伴,其中特别想感谢范佳、海林等大佬的解惑,加快了我对SeaTunnel的了解。

成为 Committer 的感受

成为 Committer 对您来说意味着什么?
  • 能够更好地推动社区发展,帮助新贡献者融入,促进更多人参与开源项目,推动国内开源文化的普及。同时有机会与行业内大佬交流,深入参与项目的技术讨论和架构设计,

洞察 SeaTunnel

  • 在您看来,SeaTunnel 作为一个开源项目的独特优势是什么?

    • 高度可扩展性、多种数据源支持、高效稳定的数据处理能力、活跃的社区支持、易于使用和部署
  • 您最喜欢 SeaTunnel 的哪些功能或特性?

    • 实时数据集成能力

对社区的寄语

您对社区成员,尤其是想要加入开源项目的新手,有什么建议?
  • 不要害怕源码读不懂,搞不定,阅读源码是每个开发者成长过程中必经的阶段,很多功能的优化并不复杂,我在SeaTunnel的第一个PR就是修改了一个简单的判断逻辑,修复一个Bug。
如果开发者想要开始参与贡献 SeaTunnel,您会推荐他们从哪些方面入手?
  • 可以按照下面几个步骤开展:

    1.先了解使用项目:下载并使用,熟悉功能和问题。

    2.阅读贡献指南:熟悉项目的贡献流程和要求。

    3.从小任务开始:如修复文档、简单bug,逐步积累经验。

    4.参与社区讨论:加入邮件列表、微信群等,了解项目动态。

    5.保持耐心:接受反馈,逐步改进。

感谢展望🙏

您如何平衡工作、开源贡献与生活?

  • 哈哈,下班后少刷手机,工作之余多在开源社区活跃,好几位SeaTunnel的PMC/Committer经常在很晚的时候还在跟我持续交流!非常敬佩且折服!

有哪些人或团队在您的开源之路上给予了特别的支持?

  • 当然是WhaleOps了,作为基于Apache SeaTunnel开发并发布对应商业版的公司,白鲸开源的技术大佬们都很热情低调!
对 SeaTunnel 社区的未来,您有什么样的期待?

Apache SeaTunnel 在数据集成的基础能力方面已经展现出十分强大的实力,然而,在当前数据处理愈发注重用户体验和操作便捷性的趋势下,可视化界面的突破对于其进一步拓展用户群体、提升用户满意度以及降低使用门槛等方面显得尤为重要,这将为非技术专业人员更高效地利用 SeaTunnel 进行数据集成任务提供有力支持。

本文由 白鲸开源科技 提供发布支持!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/1133.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

智慧公厕大数据驱动下的公共卫生管理与优化

在快速发展的城市化进程中,公共卫生问题日益凸显,成为城市管理的重要议题。智慧公厕,作为公共卫生设施的一次革命性创新,正借助物联网技术的东风,引领公共卫生进入一个全新的生态时代。本文将深入探讨智慧公厕如何利用…

后盾人JS--JS值类型使用(终章)

数值类型转换技巧与NaN类型 什么是NaN呢&#xff1f;顾名思义就是&#xff0c;not a number <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width,…

EFK采集k8s日志

在 Kubernetes 集群中&#xff0c;需要全面了解各个 pod 应用运行状态、故障排查和性能分析。但由于 Pod 是动态创建和销毁的&#xff0c;其日志分散且存储不持久&#xff0c;因此需要通过集中式日志采集方案&#xff0c;将日志收集到统一的平台并配置日志可视化分析和监控告警…

探索网络安全:浅析文件上传漏洞

前言 在数字化时代&#xff0c;网络安全已成为我们每个人都需要关注的重要议题。无论是个人隐私保护&#xff0c;还是企业数据安全&#xff0c;网络威胁无处不在。了解网络安全的基本知识和防护措施&#xff0c;对我们每个人来说都至关重要。 网络安全 网络安全并非只是对网…

计算机网络 (36)TCP可靠传输的实现

前言 TCP&#xff08;传输控制协议&#xff09;是一种面向连接的、可靠的、基于字节流的传输层通信协议。TCP通过多种机制实现可靠传输&#xff0c;这些机制主要包括连接管理、序列号和确认应答机制、重传机制、流量控制、拥塞控制等。 一、连接管理 TCP使用三次握手&#xff0…

零样本极速复刻语音!F5-TTS本地部署教程

一、介绍 F5-TTS 是由上海交通大学、剑桥大学和吉利汽车研究院&#xff08;宁波&#xff09;有限公司于 2024 年共同开源的一款高性能文本到语音 (TTS) 系统&#xff0c;它基于流匹配的非自回归生成方法&#xff0c;结合了扩散变换器 (DiT) 技术。。这一系统能够在没有额外监督…

poi处理多选框进行勾选操作下载word以及多word文件压缩

一、场景 将数据导出word后且实现动态勾选复选框操作 eg: word模板 导出后效果&#xff08;根据数据动态勾选复选框&#xff09; 二、解决方案及涉及技术 ① 使用poi提供的库进行处理&#xff08;poi官方文档&#xff09; ② 涉及依赖 <!-- excel工具 --><depen…

关于使用FastGPT 摸索的QA

近期在通过fastGPT&#xff0c;创建一些基于特定业务场景的、相对复杂的Agent智能体应用。 工作流在AI模型的基础上&#xff0c;可以定义业务逻辑&#xff0c;满足输出对话之外的需求。 在最近3个月来的摸索和实践中&#xff0c;一些基于经验的小问题点&#xff08;自己也常常…

开放词汇检测新晋SOTA:DOSOD实时检测算法详解

在计算机视觉领域&#xff0c;目标检测技术一直是研究的热点与难点。随着应用场景的不断拓展&#xff0c;传统的闭集检测逐渐显露出其局限性&#xff0c;开放词汇检测&#xff08;Open-Vocabulary Object Detection&#xff09;应运而生&#xff0c;为行业带来了新的活力与可能…

Spring 项目 基于 Tomcat容器进行部署

文章目录 一、前置知识二、本地Idea运行Spring项目1. 将写好的 Spring 项目先打包成 war 包2. 查看项目工件&#xff08;Artifact&#xff09;是否存在3. 配置 Tomcat3.1 添加一个本地 Tomcat 容器3.2 将项目部署到 Tomcat 4. 运行项目 三、基于 Tomcat 部署及多实例部署1. Spr…

MixDehazeNet:用于图像去雾网络的混合结构块

摘要 https://arxiv.org/pdf/2305.17654 图像去雾是低级视觉领域中的一项典型任务。先前的研究验证了大型卷积核和注意力机制在去雾中的有效性。然而&#xff0c;存在两个缺点&#xff1a;引入大型卷积核时容易忽略图像的多尺度特性&#xff0c;而注意力模块的标准串联方式没有…

浅谈云计算05 | 云存储等级及其接口工作原理

一、云存储设备 在当今数字化飞速发展的时代&#xff0c;数据已然成为个人、企业乃至整个社会的核心资产。从日常生活中的珍贵照片、视频&#xff0c;到企业运营里的关键业务文档、客户资料&#xff0c;数据量呈爆炸式增长。面对海量的数据&#xff0c;如何安全、高效且便捷地存…

反转链表题目

文章目录 反转链表题目链接&#xff1a;[在线OJ](https://leetcode.cn/problems/reverse-linked-list/description/)题目详解思路1&#xff1a;思路1算法复杂度 思路2代码实现思路2算法复杂度 结语 欢迎大家来到我的博客&#xff0c;给生活来点impetus 让我们进入《题海探骊》…

【1】Word:邀请函

目录 题目 文字解析 流程 题目 文字解析 考生文件夹☞Word.docx☞一定要用ms打开&#xff0c;wps打开作答无效☞作答完毕&#xff0c;F12或者手动另存为&#xff08;考生文件夹&#xff1a;路径文件名&#xff09; 注意&#xff1a;一定要检查&#xff0c;很有可能你前面步…

三 BH1750 光感驱动调试1

一 扫描设备 查看手册 BH1750 光感模块 寄存器地址为 0x23 官方手册 : http://rohmfs.rohm.com/en/products/databook/datasheet/ic/sensor/light/bh1750fvi-e.pdf su 然后用 i2cdetect 扫描设备: 拨,插 对比, 探测设备挂载在 /dev/i2c-5 上, 从设备地址为 0x23 二 …

学习threejs,使用TrackballControls相机控制器

&#x1f468;‍⚕️ 主页&#xff1a; gis分享者 &#x1f468;‍⚕️ 感谢各位大佬 点赞&#x1f44d; 收藏⭐ 留言&#x1f4dd; 加关注✅! &#x1f468;‍⚕️ 收录于专栏&#xff1a;threejs gis工程师 文章目录 一、&#x1f340;前言1.1 ☘️THREE.TrackballControls 相…

【Linux系统】—— vim 的使用

【Linux系统】—— vim 的使用 1 vim 的基本概念2 vim 的多模式3 命令模式下的命令集3.1 进入/退出其他模式3.2 光标移动命令集3.3 复制/剪切/粘贴/删除命令集3.4 撤销命令集3.5 查找命令集3.6 替换命令集3.7 进入与退出替换模式 4 批量化编译5 底行模式6 vim 小技巧7 vim简单配…

nginx负载均衡-基于端口的负载均衡(一)

注意&#xff1a; (1) 做负载均衡技术至少需要三台服务器&#xff1a;一台独立的负载均衡器&#xff0c;两台web服务器做集群 一、nginx分别代理后端web1 和 web2的三台虚拟主机 1、web1&#xff08;nginx-10.0.0.7&#xff09;配置基于端口的虚拟主机 [rootOldboy extra]# …

HTML5实现好看的博客网站、通用大作业网页模板源码

HTML5实现好看的博客网站、通用大作业网页模板源码 前言一、设计来源1.1 主界面1.2 列表界面1.3 文章界面 二、效果和源码2.1 动态效果2.2 源代码 源码下载结束语 HTML5实现好看的博客网站、通用大作业网页模板源码&#xff0c;博客网站源码&#xff0c;HTML模板源码&#xff0…

微调神经机器翻译模型全流程

MBART: Multilingual Denoising Pre-training for Neural Machine Translation 模型下载 mBART 是一个基于序列到序列的去噪自编码器&#xff0c;使用 BART 目标在多种语言的大规模单语语料库上进行预训练。mBART 是首批通过去噪完整文本在多种语言上预训练序列到序列模型的方…