数据智能产业创新服务媒体
——聚焦数智 · 改变商业
3月30日,由百分点科技主办的“2023数据科学峰会”在北京金隅智造工场·科技秀场成功召开。此次大会以“数据·进阶”为主题,邀请权威专家学者以科学视角和全球视野解读数据科学、数字政府建设及数字化业务,在现场重磅推出一站式数据价值实现平台——数据科学基础平台DeepMatrix,并联合IDC发布了首份数据能力进阶白皮书。
数字化业务发展“奇点时刻”已至
“奇点”(Singularity)是一个由科幻小说家弗诺·文奇提出的概念。在未来学和人工智能领域中,“奇点”通常是指一个时刻,在这一时刻技术将迅速发展,以至于传统的预测方法和规律将无法维持,这个时刻通常被称为技术奇点或智能奇点。
纵观人类社会核心技术发展史,从蒸汽动力技到信息技术,再到如今5G、云计算、大数据、人工智能等为代表的数字技术,技术进步在生产力发展和社会经济演变的升级过程中,始终扮演着不可或缺的角色。
现阶段,数字技术的发展速度越来越快,推动了各个领域的创新和变革,加速了数字经济发展的步伐,带动产业数智化转型进入纵深阶段。
峰会上,IDC中国副总裁兼首席分析师武连峰分享了IDC最新观点:数字化业务时代已经来临。在数字化转型1.0阶段,是利用技术,部分变革业务,试点创新;2.0阶段,利用技术全面变革业务,进行规模化创新。可以看到,无论是1.0阶段还是2.0阶段,其核心都是业务的数字化。进入数字化业务时代,最核心的是做好“数据”的业务化,即提供可持续创新运营可行的数字化业务。
据IDC《中国数字化转型市场预测,2021-2026》,中国2022-2026年数字化转型支出合计将达到2.38万亿美元。
但现实可能比预想发展得更快!
根据我国《“十四五”数字化经济发展规划》,提及的五年发展目标中,“千兆宽带用户数”一项的原发展目标是到2025年增至6000万户,增长规模接近8.3倍。
而在近日工信部发布2023年1-2月份通信业经济运行情况中,“千兆宽带用户数”已突破亿级规模,三大运营商仅用两年时间就超额完成了“千兆宽带用户数”原五年目标!
“千兆宽带用户数”只是我国数字经济发展总体目标下的一个细分目标,从其过往两年的表现可以明显感知到,数字经济整体发展呈指数级增长,早期规划已跟不上现实的发展速度。
数字化业务发展的“奇点时刻”已经降临。
来源:《“十四五”数字经济发展规划》
数字化业务时代浪潮激荡,无论是为数字化业务赋能的科技厂商供给方,还是亟待业务数字化转型的需求方,都需要加快思考、理解、践行数字化优先策略。对此,北京大学数学科学学院、光华管理学院教授、中国科学院院士陈松蹊认为:数字中国建设,释放数据生产力是关键。真正要把生产力释放出来,不能只靠存储和算力等基础设施建设,更需要“数据文化”建设,尤其是场景驱动的数据分析等数据科学“软”实力建设。
数据科学基础平台(DeepMatrix)为数据价值实现赋能
基于市场需求的敏锐洞察和对行业发展趋势的前瞻性预判,百分点科技在“数据·进阶”峰会上推出一站式数据价值实现平台——百分点数据科学基础平台(DeepMatrix),服务于数据工程师、数据分析师和数据科学家,助力便捷高效地将数据转化为业务知识并辅助决策和行动,最终释放数据价值。
来源:百分点科技
传统企业数字化转型过程中,可能没有相关的数字化经验和能力,从而面临“从零开始”、“没有任何经验和资源”的局面,即所谓的“冷启动”问题,比如硬件基础设施购置及升级、技术堆栈的更新和迭代、数字化响应的组织架构和人才支持、数据资产的整合和优化等,这些问题都需要投入时间、资源和人力去克服。
其中,数据资产整合和优化问题是企业数字化转型的核心。对集团型企业、政府机构来说,越来越多的业务和复杂多样的信息化系统,让政企拥有了海量数据,但是分散的数据、隔离的系统,又形成了一个个数据孤岛。于是,为了利用好数据,政企就需要建立数据仓库。
但不同业务线、不同场景的数据要如何整合到同一个数据库中呢?这就需要构建数据模型。通过高度抽象的数据模型,整合各个源系统的数据,最终形成统一、规范、易用的数据仓库。
从市场需求上来看,当下市场已不满足单点的技术和单点的工具,而是端到端的数据科学的解决方案。百分点数据科学基础平台 (DeepMatrix) 作为一站式的数据价值实现平台,它涵盖数据应用构建的全栈工具集,能够高效支撑数据收集、数据治理、数据处理、数据分析、数据可视化和数据产品开发等工作;内置行业数据标准、算法模型、知识图谱等领域知识,赋能数据价值实现的各个环节,帮助提高构建数据应用的效率及深度广度。
据百分点科技CTO刘译璟介绍,面对传统企业的“冷启动”问题,百分点数据科学基础平台(DeepMatrix)能够借助行业内已有的专业知识为其破局。此外,数据科学基础平台内置了智能辅助开发系统,可以自动化地辅助开发者选择方案以及完成数据适配,并智能化地进行方案精调和改进。同时,能够在数据治理的多个环节依托知识库及语义理解等智能技术帮助开发者提高效率。
在产品优势方面,DeepMatrix平台表现为:
第一,专业化。产品围绕数据集成、治理、建模、分析和应用的价值链条,构建了一系列功能强大的专业化工具,满足数据工程师、数据科学家和数据分析师在数据价值实现工作中的各类需求。
第二,一体化。产品功能覆盖从数据到信息、从信息到知识、从知识到决策的全过程,且所有模块都遵循一体化的技术架构和数据交换协议,支持决策端到端的数据科学解决方案构建。
第三,智能化。产品包含了很强的领域知识管理和应用能力,并结合语义分析实现智能化的数据科学解决方案构建和辅助开发。
第四,低代码。通过可视化和低代码的交互方式,降低数据管理的技术门槛,提高数据处理效率。
第五,广泛的生态适配。适配主流存储计算基础设施,如MySQL、Oracle、华为Guass等数据库,HDP、CDH、华为云MRS等大数据平台,以及国产化操作系统和芯片。
相关统计数据显示,政府及大中型国企占到数字化转型支出的 70% 左右,是数字化转型的主力军。百分点科技此次发布数据科学基础平台 (DeepMatrix)正是基于政府及大中型国企数字化转型的应用场景,以解决其数据价值实现过程中的“核心痛点”。
关于数据科学的未来
AI时代的开启,给数据科学带来了新的挑战与机遇。自2022年11月ChatGPT发布,2023年初又发布了新版本GPT4.0,其强大的信息整合和对话能力震惊世界。百分点科技董事长兼CEO苏萌认为,AI能力驱动下,数据科学将加速数智化能力进阶。
“以ChatGPT为代表的内容生成技术(简称AIGC)可能逐渐会成为新一代的基础设施,同互联网、云计算一样,很多的应用将会成长在GPT之上。新的技术和应用将会带来更加丰富的数据、更加多模态的数据,而这些数据同样需要可分析、可解释、可应用,进而参与到真正的预测和决策的场景中。”
百分点科技董事长兼CEO苏萌
对于数据科学的未来挑战和发展趋势,苏萌认为:
一是,AI生成数据会带来很多困扰。随着ChatGPT应用的不断普及,产生了有别于人类真实活动的数据。比如,人们用ChatGPT生成的论文、文学作品等,这些生成式AI数据是否会再次进入到下一轮的训练语料之中,如何评估这些数据的质量,如何实现它们的数据价值,这些都是需要重新考量的。
二是,领域知识的赋能。各个领域的科学和知识本身就是一个数据体,以数据的形式存在并且不断更新。未来数据科学将与领域知识进行更加深度的合,领域知识的自动抽取、构建和服务将成为主流,GPT终将从无所不知的写手走向知识渊博的领域高精尖专家。这也为数据科学的行业化细分带来无限商机。
三是,数据科学平民化。数据科学的通用工具的一体化和平台化,领域知识的计算机程序化和服务化,以及交互方式的自然化,这三件事情会导致未来业务和决策人员可以跨过程序员直接与数据进行交互,提高分析和决策效率,这将是革命性的变化。许多重复性工作将被智能技术替代,人们将从数据密集型、计算密集型、事务密集型的工作中被释放出来,专注于创造性高、艺术性高、价值密集型工作,追求自我实现。
四是,重塑生产关系和商业秩序。生产关系是由生产力决定的,数据科学技术在不断的迭代升级,它也会作为重要的生产力来推动商业模式和企业组织的变革。未来,全球80亿人和无数的物联网设备连接到网络并成为数据源,不断产生关于他们的活动、认知和智慧的大量数据。数据将变成普惠的生产要素,每个人都能通过数据的生产和使用获益,形成更加平等的生产关系,最终形成更加和谐的社会关系。
从苏萌的描述中,AI 技术变革加快了数据科学的迭代步伐,同时也带来了重新定义数据质量、数据价值的难题。但毋庸置疑的是,数据科学将持续与行业融合,更智能地为企业数字化转型赋能,助力数字经济宏伟蓝图徐徐展开。
在数字经济建设过程中,以百分点科技为代表的数据科学基础平台及数据智能应用提供商,将以“用数据科学构建更智能的世界”为使命,并为此不懈努力。
文:木阳 / 数据猿