文章最早发表于我自己个人公众号 软件质量报道
希望这篇文章 成为 “软件工程3.0” 开创性的宣言。
为了定义 “软件工程3.0”,让我们先定义 “软件工程1.0”、 “软件工程2.0” 。先简单说明一下,用软件版本号的方式 “1.0、2.0、3.0” 来分别定义第一代、第二代、第三代 软件工程,符合软件工程的习惯,而且简洁明了。
1. 软件工程 1.0
“软件工程1.0” 即第一代软件工程,自然是受建筑工程、水利工程等影响的传统软件工程,它的诞生可以追溯到1968年。在上个世纪五、六十年代软件出现危机,大家还记得布鲁克斯(Frederick P. Brooks)在《人月神话》一书中所描述的场景:软件开发被喻为让众多史前巨兽痛苦挣扎,却无力摆脱的焦油坑。
软件危机迫使人们去寻找产生危机的内在原因,进而找出消除危机的解决方案。面对”软件危机”,人们调查研究了软件开发的实际情况,逐步认识到采用工程化的方法从事软件系统的研发和维护的必要性。为了克服这一危机,大家走到一起,共同探讨以获得问题的解决途径,于是在1968年NATO的计算机科学家在联邦德国召开国际会议,讨论软件危机问题,正式提出了“软件工程”(software engineering)这一术语,从此一门新的工程学科诞生了,软件工程才得以不断发展,逐渐成熟起来。
传统软件工程主要向土木工程、工业工程学习,吸收其百年实践积累下来的实践方法和经验、沉淀下来的思想。软件工程1.0体现了下列一些特征:
产品化:交付符合质量标准的组件、构件和系统
过程决定结果:流程质量决定产品质量,一环扣一环,相信良好的过程产生良好的产品,关注过程胜过关注人,也非常关注过程评估和过程改进,如CMM(过程成熟度模型)是其典型代表。
阶段性明确,需求评审通过了,才能开始设计;设计评审通过了,才能开始实施(编程),编程结束了再进行测试等,如瀑布模型是其典型代表。
责任明确:角色定义清楚,分工细致;
文档化:强调规范的文档,大量的文档模板;
计划性强:完整的计划,严格控制变更;
建筑工程的框架结构设计,在软件工程上表现为以架构设计为中心。
现代制造业流水线的启发——软件工厂思想。
注重项目管理:围绕项目开展管理工作,包括风险预防、里程碑控制和关键路径法等。
以顾客为中心的全面质量管理。
预防为主,检验为辅,即缺陷预防思想。
2. 软件工程 2.0
在2008年,我写的《软件工程导论》中,相对传统软件工程,我定义了现代软件工程,那时,我没能预见到今天人工智能的巨大力量。15年后,我将受互联网、开源软件运动、敏捷/DevOps开发模式所影响并最终形成的、建立在SaaS(软件即服务)、Cloud之上的软件工程定义为 “软件工程2.0”。
没有互联网(Internet),就没有Cloud、没有SaaS,我们对软件就不能部署在软件研发公司自己的数据中心,持续交付(CD)就没有意义,因为无法做到将包装盒形式的软件产品持续交付到客户手中,敏捷、DevOps也就难以实施,虽然可以在内部实现持续集成(CI),其价值会降低不少。
开源软件运动让我们认识到 “软件过程”、“软件管理”不是非常重要,至少不是第一要素,第一要素还是人,其次是软件架构(微服务、serverless等)和代码质量,使软件容易演化(如架构可扩展性、代码的可维护性)。而且客户或用户始终希望我们能够按时交付高质量的产品,又认可软件的灵活性,希望软件能够具有随需应变的能力,及时进行必要的修改来满足业务的新需求。同时,软件又是一种知识型产品,需要创造性,并依赖每个研发人员的创造力和积极性。所有这些引导人们新的思考,引导人们不断认识软件工程,从而在2001年17位软件开发轻量型流派掌门人联合签署了敏捷宣言:
之后逐渐形成了敏捷/DevOps开发模式、精益软件开发模式等,即让软件工程进入2.0时代。软件工程2.0的特征可以简单概括为下列几点:
SaaS(软件即服务):软件更多是以一种服务存在;
以人为本:个体与协作胜于流程和工具,充分发挥个人和团队的创造性和潜力;
拥抱变化:敏捷开发或轻量级过程,加速迭代,以不变应万变。
持续性:阶段性不明确,持续构建、持续集成、持续测试、持续交付,以时间换空间,消除市场风险;
融合:强调测试开发融合,开发与运维融合,推崇全栈工程师等。
真正把用户放在第一位:用户、产品经理尽可能参与团队研发过程中,注重用户体验,千人千面;
强调价值交付:只做对用户有价值的事情,加速价值流的流动;
知识管理,将软件工程纳入知识管理的范畴。
史诗般故事、用户故事、站立会议,让软件研发工作更有趣、更健康。
......
3. 软件工程 3.0
在技术突破和创新方法的推动下,软件工程的世界发展越来越快,而最近的突破就是GPT-4等人工智能(AI)语言大模型的出现。GPT-4出来了,大家都很震惊,尤其惊讶于从GPT-3到GPT-4的进化速度。GPT-4是一种基于RLHF(人类反馈强化学习) 、多模态的语言大模型,它比其前身GPT-3.5有了显著的改进,GPT-4具有强大的识图能力、文字输入限制提升至 2.5 万字、回答准确性显著提高。因此GPT-4能够执行一系列复杂的任务,如代码生成、错误检测、软件设计等。正如文章谷歌工程主管:程序员的职业生涯将在 3 年内被AIGC终结 中的观点: “ChatGPT和GitHub Copilot预示着编程终结的开始”、“这个领域将发生根本性的变化”、“当程序员开始被淘汰时,只有两个角色可以保留:产品经理和代码评审人员。”...... 这篇文章是在GPT-4发布前写的,而GPT-4要强大多,所以对软件研发的影响更为显著。
考虑到它的发展速度,在不久的将来,甚至从今天开始,AI就开始逐渐接手一些软件研发的工作,我们通过将GPT-4+(指GPT-4及其未来升级的版本)融入到软件研发生命周期中,研发人员的使命发生变化,GPT-4+重新定义了开发人员构建、维护和改进软件应用程序的方式,之后的软件开发会依赖这种全新的语言交流方式(类似chatGPT那样),让这类工具理解研发人员交待的任务、自主完成软件开发,如理解需求、自动生成UI、自动生成产品代码、自动生成测试脚本等。此后,研发团队的主要任务不是写代码、执行测试,而是训练模型、参数调优、围绕业务主题提问或给提示(prompt)。因此,我们说GPT-4将开启 “软件工程3.0” 新时代,今年是软件工程3.0元年。
先看看 GPT-4自己是如何说的,但经过我简单的实验,它能做的事比它自己说的要多。
下面,一方面我会展示GPT-4目前在软件研发所能做到的一些事情(这里要感谢海外朋友Huan、Christina的帮助),然后我们再顺着这条思路想象一下软件工程3.0是怎样的一番景象:之前一些大厂有好几万的研发人员,未来只有几千人,但可以借助其强大的私有云平台,软件研发效能真正实现10倍增长,降本增效将不再是公司的核心问题(因为已经得到解决了)。
1)GPT-4在需求分析上无所不能
你觉得它吹牛吗?不,它可以基于我们简单的描述,帮我们完成基本功能分析,也可以基于需求生成验收标准、生成测试脚本,根据需求验收标准生成BDD(行为驱动开发)标准的Gven-When-Then格式。这一切有下图为证。
2)软件设计与体系结构
GPT-4的强大功能扩展到软件设计和架构,可以帮助开发人员做出明智的决策并制定健壮的解决方案。通过处理所需应用程序的高级描述,GPT-4可以提出合适的设计模式,推荐最佳实践,甚至建议最佳的体系结构选择。此级别的指导使开发人员能够创建可伸缩、可维护和高效的软件解决方案,以满足他们的特定需求。此外,GPT-4可以促进不同设计选项的评估和比较,确保开发人员选择最合适的演化路径。
(这部分实验目前不好做,后续再补充)
3)代码生成
GPT-4能根据自然语言输入的需求及其上下文而生成代码,而且可以用不同的编程语言生成相应的代码。这一强大的特性减少了人工编码所花费的时间和精力,并支持快速原型化和概念验证开发。此外,GPT-4能够生成代码段、api,甚至整个软件模块,使开发人员能够轻松地创建复杂的应用程序,甚至可以帮助我们按敏捷开发模式推崇的TDD来完成代码的实现(周五会有单独文章介绍,敬请关注)。
(来自:https://www.youtube.com/watch?v=lomBKUojSIU,这类例子很多)
4)测试代码生成
感谢SauceLabs已经帮我完成这部分实验(见文章:https://saucelabs.com/resources/blog/chatgpt-automated-testing-conversation-to-code),我们可以让GPT-4生成Google站点测试的脚本。虽然提示中没有明确说明要在网站上测试什么,但ChatGPT仍然生成了一个脚本来测试谷歌网站的主要功能 之一“搜索功能”,甚至正确地识别了谷歌搜索栏的名称“q”。进一步,我们可以指示ChatGPT为元素定位器使用页面对象模型和类变量,指示ChatGPT可以生成与某工具平台(如Sauce Labs)兼容的测试脚本。
更进一步,消除测试脚本中的硬编码(如URL、用户名“username”和密码“password”),从场景中的特性文件中获取变量,使脚本更容易维护,这时可以让ChatGPT修复这类问题。
5)错误检测和解决
GPT-4在代码分析和理解方面的能力使其成为检测和解决软件应用程序错误的、有价值的工具。通过仔细检查代码片段和理解上下文,GPT-4可以识别错误,建议最佳解决方案,甚至为现有问题生成补丁。这种功能极大地加快了调试过程,并确保软件产品更加可靠和安全。此外,GPT-4可以与持续集成和持续部署(CI/CD)流水线集成,以增强自动化测试并促进无缝地持续交付软件。
6)协作和知识共享
在当今快节奏和相互关联的开发环境中,协作和知识共享比以往任何时候都更加重要。GPT-4通过在团队讨论、头脑风暴会议和代码审查期间提供实时帮助,形成会议纪要、总结,甚至理清楚逻辑,发现问题,提供有价值的见解,建议替代方法,甚至从其庞大的知识库中提供相关示例。这种人工智能驱动的协作提高了团队生产力,培养了持续学习的文化,并为创新铺平了道路。这类例子,可以在 GPT-4 震撼发布:能看图、能当律师、更安全、更有创意... 超过了其它大模型 一文中找到。
结语
总之,GPT-4+的引入,从而支持更智能、更高效和协作的开发方法,使软件工程领域发生革命性的变化。当我们进入软件工程3.0时,软件开发的范式将发生很大的变化,软件研发人员的工作方式发生变化,对软件人员的要求更多体现在对业务的深度理解、系统性思维、逻辑思维等方面。软件工程 3.0的体现了下列一些特征:
数字化:软件研发平台开始能够理解需求、设计、代码等,软件研发从过去的信息化进入数字化时代;
AIGC:生成软件(software)的各种ware:验收标准、测试用例、UI、代码、测试脚本等;
极致的持续交付:虽然软件工程2.0开始面向CI/CD,但还存在许多障碍,而在软件工程3.0,得益于设计、代码、测试脚本等生成,可以真正实现持续交付,即及时响应客户需求,交付客户所需的功能特性;
人机交互智能:软件研发过程就是人与计算机的交互过程;
以模型和数据为本:研发人员服务于大模型和大数据平台,包括模型创建、训练、调优、使用等;
......
通过利用GPT-4+的力量,同时解决安全、法律、伦理等方面的问题和挑战,软件工程的未来将是光明和创新的。
参考:
GPT-4 震撼发布:能看图、能当律师、更安全、更有创意... 超过了其它大模型
谷歌工程主管:程序员的职业生涯将在 3 年内被AIGC终结
编程的终结:经典计算机科学的末日即将来临
华为发布函数级代码生成模型PanGu-Coder,在中文上表现也十分出色!
BizCook 系统:首个用于工业开发的自动代码生成系统
未来十年软件工程的新技术、新趋势和新挑战
Gartner 2020年十大技术趋势之一:超级自动化