今年,Chat GPT的上线引起了巨大轰动,带来了对人工智能与大数据新的关注热潮。在互联网大数据时代,“AI+X”是势不可挡的大趋势。在已有技术的基础上,如何发掘AI大模型背后更多的应用场景,探索AI在商业实践上新的发展可能,深挖AI大数据和各行业碰撞融合后的新价值,无疑成为了各企业所关心的话题。
基于这样的背景,CSDN在长沙主办了CXO技术高管闭门会,邀请了华为、阿里云、水羊、中兴通讯等多个在人工智能有着实践经验和发展意愿的公司,共同进行了深入交流。本次闭门会从AIGC为切入点,探讨了AI的发展现状和前景,以及AI如何落地应用,让AI大数据促进产业升级和行业增殖,真正实现产业赋能。
(合照)
AI模型如何进一步发展应用
目前,以ChatGPT为代表的AIGC已经走进了大众视野,并引发了广泛探讨和热烈反响。但是,如果想要实现行业增殖、进一步的数字化转型,仅仅依靠目前用户只能输入数据的模式是不够的。
现在,用户只能利用已有的训练模型输入数据,从而进行内容合成。阿里解决方案架构师表示,“我们期望的不仅仅是一个API端口输入数据,而是可以进行模型调优。”大数据训练出的通用模型仅仅是人工智能的第一步,对于实现各行业的应用实践有着很多限制。只有做到可以在已有模型的基础上进行模型调优,才能够满足不同企业的实际需求。
模型调优问题是实现AI拓展应用场景、运用到各行业的实际业务中的关键。大数据模型调优的必要条件除了要有海量的优质数据,还要有优质的硬件资源、合适的算法选择等多个条件。这些条件的满足将有助于提高模型的准确性和性能,使模型在大数据环境下发挥更好的作用。
模型训练和数据存储是AI发展的重要条件,但基础设备同样值得关注。ChatGPT是由OpenAI全面研发使用的,而国内在硬件上目前还有所欠缺。华为湖南人工智能产品总监认为,每个公司都有各自的特点,华为会主要聚焦与软硬件一体化,利用独特的芯片优势领航全国,要用自己的芯片跑出一个全国产全栈的GPT,解决卡脖子的技术问题。
(发言)
从目前来看,AI最重要的优势是能够利用海量数据提供一种全面而开阔的视野。因此,有人提出了是否AI会成为新型的搜索引擎的问题。面对这个问题,在场嘉宾普遍认为,从目前来看,数据库的功能正在弱化。搜索引擎一定会集成到AI层面,因为这对普通用户一定更加便捷。但是,数据集市对企业来说仍然非常重要。
难以克服的关卡:数据质量
在更加深入地探讨人工智能的发展前景和我们目前在人工智能与大数据问题上的缺陷上,与会嘉宾提出了数据质量这一关键点。
华为湖南人工智能产品总监说,“我们总是以为我们和国外的差距出在硬件和技术上,其实不然。人工智能的发展主要依靠三个条件:算法、算力、算局。在算法、算力和算局中,我们的算法和算力并没有落后太多,关键的问题在于数据的质量。”
(图1)
拓维信息技术研究院副院长说,在成本问题上,大数据本身的价值稀疏,成本很高。“我们要找出大数据中的高质量数据,通过业务切口才能找到变现途径。我们必须提炼出有效有用的业务数据。”
数据是信息的载体好的数据质量使各种数据分析(如 OLAP 分析、数据挖掘等)能够得到有意义结果的基本条件。在制作ChatGPT的过程中,OPEN AI花费了大量的人力物力财力,专门进行数据清洗。在这种情况下,AI才能真正的发挥它合成、预测等多方面作用。不过,数据清洗不仅仅需要大量人力,在数据清洗系统的灵活框架上也有很多东西值得研究。
(图2)
目前,我们的数据质量之所以难以提高,一方面是由于我们在规范化数据上的欠缺与重视不足,存在数据残缺不全、数据不一致、数据重复等问题。另一方面,由于我们在人工智能和大数据方面较欧美国家起步较晚,积累起来的经验和数据都不够充足。
数据质量的问题不仅仅是输入采集的问题,也不仅仅是清洗筛选一步到位的问题。在整个数据生命周期中事务数据随着新数据的增加和变更,以及各种操作问题,会发生改变。原有的数据质量问题解决了往往还会发现有新的质量问题。因此,我们不仅要收集大量的用户数据,确保这些数据是真实、有效、有用的数据,还要密切关注数据质量的变化。
技术转化产品 业务“尴尬期”
就目前来看,大模型技术遇上了业务“尴尬期”。AI大模型目前仍然停留在较为初级的通用模型阶段,距离直接辅助业务实践还比较遥远。对于大部分公司来说,在当前阶段开发模型和购买服务的成本都过高,投入低于期待值。
华为湖南人工智能产品总监表示,“解决这个问题,要把AI使用划为三个批次。首先是L0,由华为阿里百度等公司制作通用大模型。其次是L1,具有丰富开发经验的公司把通用模型翻筑调优,对口各个行业。最后是L2,业务公司花钱买服务。大模型存在的意义是给各个行业降成本,通用通吃。未来的AI应用肯定不会止步于NLP/CV端,而是会面向开放域世界理解,形成多模态模式。”
(图3)
各个行业内都有很多已积累的产业数据,迫切地想通过大数据模型进行变现。把AI落实到各个应用场景,需要有丰富开发经验的公司在通用模型的基础上进行进一步包装。对于想要利用AI实现产业赋能的企业,也要做好行业分析并推行数据规范化。很多公司目前没有形成完全的、系统化的数字办公,提取调用公司内部数据可能都会遇到较大阻力。
拓维信息技术研究院副院长表示,“大模型的重要作用之一就是寻找产生价值的应用机会,只有大小模型互相补充,才能推进项目落地。在AI大模型的应用上,应该业务优先,以业务为导向,接着进行技术调优。”
AI与行业结合的应用实例
尽管现在AI的商业使用发展还不够成熟,但已经在一定程度上应用落地了。湖南齐啦科技有限公司是一家针对口腔医疗的智慧方案提供的公司,其技术总监给我们提供了一些用户应用实例。目前很多用户已经开始使用AI制作开业或义诊的海报,甚至是视频制作和内部代运营。医生们也在考虑如何用AIGC大模型通过自己生产的文章,生成可行的治疗方案来提高效率。但是这项应用风险和技术要求都比较高,只能进行尝试。
有关“AI赋能企业”的话题,在场嘉宾从电商、制造业、金融、游戏等多个行业进行了探讨。在制造业方面,湖南制造业集中在钢铁、重工等高风险行业,这些行业的部分问题可以通过自动化来解决,但对精确度要求更多的生产环节,降低风险和人工成本仍有待于AI的参与。AI能够对危险岗位进行创新应用最大程度的保证质量和安全。在游戏行业,渲染技术和3D建模因为AI时代的到来有了突破性进展,可以辅助生成游戏行业。同时,AI基于NLP算法的语言优势,也提高了很多开放或半开放世界游戏的NPC的灵活反应读,在玩家自由探索游戏世界时给予了新奇而丰富的真实体验。
总结
本次大会圆满落幕,对“AI与大模型”等相关话题进行了深入探讨。在场嘉宾积极发言,气氛热烈,并且表示通过本次大会对有关话题有了更加深刻的了解与认识,对于AI前景发展有了更多理解。看到目前AI模型背后的实质,才能找准AI发展的路线,从而实现不同企业“各司其职”,真正用AI实现产业增殖。与其他企业进行深度的交流研讨,是促进各个行业进一步发展和企业间合作共赢的重要手段。和其他公司互通有无,碰撞想法,也是促进新发展的重要手段。
CSDN会持续发掘了解各行业所关注的焦点问题,继续组织开展多行业行业前沿问题的技术闭门会,促进企业发展。如果你对闭门会模式感兴趣,欢迎关注CSDN活动资讯,第一时间获取相关活动信息,并报名参与!