Datawhale干货
作者:“不啻微茫”团队,季军方案
前 言
大家好,我们是 飞桨星河社区 X 智海Mo平台 AI 大模型创意应用大赛 获奖团队——"不啻微茫",很荣幸能有机会与大家分享这次比赛经验,我们从零开始的过程也许会给准备尝试LLM应用落地的小伙伴们带来一些启发
赛事地址:
https://aistudio.baidu.com/competition/detail/1105/0/introduction
赛题准备与分析
调研
在项目初期我们对一切的认知都很浅薄。调研成为初期的核心任务;我们尝试在各大平台搜索我们能想到的关键词:收集包括视频,博客文章,论文,行业研究报告,论坛讨论等一切与方向相关的内容;经过对调研内容的筛选与阅读,我们对行业,市场,需求等方面的认知有了很大提升;基于调研结果,我们设计了一个以用户痛点为导向的智能人机交互知识库方案,尝试使用了 AI 的内容生成能力和个性化能力,加强产品的场景深入化,内容定制化。
方案设想
为了构建出一套完整方案,我们找来市场与开源社区中成熟的产品与项目;逐一使用体验,分析我们产品需求池中对应的业务实现方法。把分析结果记录到产品分析表当中,最后基于最初的“AI课堂助手”的设想,尝试依托大模型的强大能力构建出一款教育场景垂直,解决课堂痛点的产品。
学习
之所以说是从零开始,是因为当时的我们对于技术几乎是一片空白;但好在团队的两位成员都参与了Datawhale 11月份的组队学习;为了快速积累技术储备;我们一边读开源文档边尝试自己复现;在助教与组队队友的帮助下我们成功复现出Datawhale的开源项目“文档问答助手”,到这个时候我们对LLM开发终于建立起了一套相对完整的技术体系。
开发与协作
开发的过程比想象中要困难很多,虽然相比之前有了一定的技术储备,但由于缺乏更多的实践与积累。coding过程异常艰辛,几次全部推翻重做,好几次想直接放弃;每当这个时候我们就会开个团队小会,结束后把代码推送到仓库就开始"团队放假" ... 休整好之后第二天又继续编码;我们还会定期开展阶段性回顾:在每个开发阶段结束后进行回顾,定位实际进度的同时总结前一阶段的教训,为后续阶段的工作制定详细计划。
团队优势
我们团队叫做“不啻微茫”,意为:即便是微茫星火,奋起直追,亦可成燎原之势,即便是涓流之滴,踏实积累,亦可汇聚成江河。
团队成员均来自于专科(长江职业学院),相比于其他的团队我们几乎没有优势:没有技术,没有经验,没有突出能力...但我们始终抱着“得学点什么“的态度来面对这个过程中的一切。而在这个过程当中Datawhale帮助了我们太多:11月组队学习LLM开发,热情的助教与组队队员,开源项目--“文档问答助手”,开源教程--《LLM应用开发落地》;如果没有这些,我们的技术学习不知道会走多少弯路。
比赛过程
比赛过程可以视作项目落地过程:调研与竞品分析,功能与原型设计,技术选择与开发,测试与优化,最后是产品落地
以下是我们项目的一些亮点与经验总结:
调研与竞品分析
在项目初期,我们进行了广泛且详细地调研,深入了解现有产品与市场现状已经用户痛点;基于此我们明确了产品的定位与核心竞争力,确保产品具有场景清晰且业务定制化优势
功能与原型设计
我们深入体验了市场与开源社区中的成熟产品,结合自身定位来设计功能,同时结合实际场景来进行功能分类与分级,确保项目的功能满足实际需求,而不是闭门造车空想出来的伪需求。
技术选择与开发
我们根据团队实际情况,选择最符合当前能力的技术栈:Gradio+langchain+Ernie-bot 3.5;确保功能设计的顺利与项目的推进,我们研读文心一言的官方文档与Datawhale的开源教程,同时进行编码实现
测试与优化
在MVP构建成功后,我们邀请了专业老师与社团内同学对产品进行体验与测试,根据他们的建议与反馈进行产品优化迭代,力求产品质量与用户满意度的提升
赛后总结
成长优先,心态放宽
成长心态可能是我们这次成功的因素之一,我们以"得学点什么"的心态来应对过程当中遇到的各种难题;过程中很多问题都是在这种心态下的驱动来完成的:在决赛答辩前夕,我们主动申请与主办方的专家进行线上会议,学习ppt的优化,同时积累技巧,寻求认知进步。就如我们的队名"不啻微茫"的寓意:不放弃机会,脚踏实地积累,最终会定成长起来!
调研先行,技术紧跟
可能与其他团队不同,我们团队前期对AI产品与落地几乎一无所知,于是我们将调研与竞品分析放在了首要位置;调研的广度与深度让我们对项目整体有了相对准确的把握,详细深入地竞品体验与分析让我们对产品业务路径有了清晰的认知;正是对于项目整体与产品业务路径的把握让我们不至于被其他团队淹没
好好努力,继续加油!
团队从初赛到决赛一路走来,认知与技术相较之前提升了一个层级。但我们清楚需要学习与掌握的还有太多太多;我们会把握住更多的机会,同时参与更多的组队学习,在Datawahle的帮助下不断精进自己的认知与技术。同Datawhale与学习者们一起成长!
感谢
感谢Datawhale贡献这么多高质量的开源教程与项目,正因为Datawhale的11月组队学习活动,我们才得以在这次的项目中的LLM技术学习上不至于走太多弯路,让我们的产品构想成功落地。
同时感谢本次比赛的主办方与协办方:浙江省软件行业协会,百度与智海Mo平台,正是这次机会让我们团队以此为契机上手LLM应用开发。并感谢百度 刘聪琳老师在赛前的宝贵指导!
最后感谢在本次项目落地过程中参考的开源资料的作者们,正是这些高质量的教程与项目推动着AI领域的快速发展,也带动着我们这样的学习者不断进步。
Datawhale 不仅仅是一个技术社区,它更像一个攀登途中的战友,带领着我们学习者不断挑战一个又一个的技术与知识的山峰。
正是 Datawhale 的理念和使命,鼓励并推动了开源文化的发展,让我们这样的学习者能够在开放、共享的环境中成长,不断学习和进步。在这个平台上,我们不仅提升了知识和技能,而且更重要的是,我们还培养了团队协作和共同创造的价值观念。Datawhale 的每一次活动、每一次挑战,都激励着我们去超越自我,去追求卓越。
原创不易,点赞三连↓