近期关于AIGC方面的学习笔记和思路整理

LLM

对于LLM,我现在重点关注在这几个方面:

开源且可私有化部署的代码生成模型:

因为大部分软件企业对于安全都很重视,文档、数据、代码一般都会尽量避免被泄露。所以很难使用类似Copilot或者OpenAI的Bito这种需要连到互联网上的服务。如果能有可以私有化部署的代码生成模型,就可以很好的解决这个问题。现在有以下一些开源的模型:

  • Saleforce的CodeT5

https://github.com/salesforce/CodeT5

2021年9月,Saleforce公布了CodeT5模型。目前,Saleforce公开了4个版本的CodeT5模型,均开源可获得。

  • CodeT5-small:0.6亿参数
  • CodeT5-base:2.2亿参数
  • CodeT5-large:7.7亿参数
  • CodeT5-large-ntp-py:7.7亿参数
  • Saleforce的CodeGen/CodeGen2

https://github.com/salesforce/CodeGen

2022年5月,Saleforce再次发布了一个新的编程模型CodeGen。该模型是一系列模型,参数有4个版本:3.5亿、20亿、60亿和160亿。而训练的数据也有三个:

  1. nl版本:基于Pile数据训练
  2. multi版本:在nl基础上继续在多个编程语言组成的数据集上训练
  3. mono版本:继续在multi版本上基于Python代码数据训练

上述12个模型全部在HuggingFace上开源。

2023年5月3日,Saleforce开源第二代CodeGen:CodeGen2发布。该系列模型包含4个版本,分别是10亿参数、37亿参数、70亿参数和160亿参数四个版本。CodeGen2可以进行infilling,并且支持更多的编程语言。这里的infilling应该是在插入代码的含义。

CodeGen2也是全部开源,其中160亿参数版本开源文件大小66GB左右~

  • MetaAI的InCoder

GitHub - dpfried/incoder: Generative model for code infilling and synthesis

InCoder: A Generative Model for Code Infilling and Synthesis

InCoder是MetaAI在2022年4月发布的一个编程大模型。模型训练数据仅包含来自在线来源(如GitHub、GitLab和StackOverflow)的开放许可代码(Apache 2.0、MIT、BSD-2和BSD-3许可),其中重点是Python和JavaScript,但总共包括28种语言 - 总共约200GB的数据。公开的模型预训练结果共2个版本,一个是67亿参数一个是13亿参数。

尽管InCoder的训练数据都是开放许可代码数据,但是MetaAI的InCoder模型确实开源的不可商用的!

  • 国内的智谱AI开发的CodeGeeX

https://codegeex.cn/

https://github.com/THUDM/CodeGeeX

CodeGeeX - a Hugging Face Space by THUDM

CodeGeeX是一个具有130亿参数的多编程语言代码生成预训练模型。CodeGeeX采用华为MindSpore框架实现,在鹏城实验室“鹏城云脑II”中的192个节点(共1536个国产昇腾910 AI处理器)上训练而成。截至2022年6月22日,CodeGeeX历时两个月在20多种编程语言的代码语料库(>8500亿Token)上预训练得到。CodeGeeX有以下特点:

  • 高精度代码生成:支持生成Python、C++、Java、JavaScript和Go等多种主流编程语言的代码,在HumanEval-X代码生成任务上取得47%~60%求解率,较其他开源基线模型有更佳的平均性能。代码生成示例
  • 跨语言代码翻译:支持代码片段在不同编程语言间进行自动翻译转换,翻译结果正确率高,在HumanEval-X代码翻译任务上超越了其它基线模型。代码翻译示例
  • 自动编程插件:CodeGeeX插件现已上架VSCode插件市场(完全免费),用户可以通过其强大的少样本生成能力,自定义代码生成风格和能力,更好辅助代码编写。插件下载
  • 模型跨平台开源: 所有代码和模型权重开源开放,用作研究用途。CodeGeeX同时支持昇腾和英伟达平台,可在单张昇腾910或英伟达V100/A100上实现推理。申请模型权重

全新多编程语言评测基准HumanEval-X:HumanEval-X是第一个支持功能正确性评测的多语言、多任务的基准,包含820个人工编写的高质量代码生成题目、测试用例与参考答案,覆盖5种编程语言(Python、C++、Java、JavaScript、Go),支持代码生成与代码翻译能力的评测。如何使用

在HumanEval-X代码生成任务上,与其它开源基线模型相比,CodeGeeX取得了最佳的平均性能。

Replit的Replit Code

模型:replit/replit-code-v1-3b · Hugging Face

2023年5月3日,Replit Code V1-3b正式发布,并在HuggingFace上开源。Replit-finetuned-v1-3b是Replit开发的一个编程大模型,与Replit-code-v1-3b一同宣布。官方确定Replit-code-v1-3b会是一个开源的模型,但是没有明确说Replit-finetuned-v1-3b是否开源。

BigCode的StarCoder/StarCoderBase

在5月4日,BigCoder在HuggingFace的支持下发布了开源代码生成模型Starcoder。BigCode是由Hugging Face和ServiceNow共同领导的开放科学合作项目,致力于负责任地开发大型代码语言模型。StarCoder 和 StarCoderBase 是代码的大型语言模型 (Code LLM),使用来自 GitHub 的许可数据进行训练。具体请看我的文章:

北方的郎:Starcoder:愿源码与你同在, 最新的开源代码生成LLM来了

可商用的开源LLM

训练LLM要花很多资源,例如MPT-7B训练的时候尽管采取了很多降低资源需求的技术,仍然要在440 GPU上训练了9.5 天花费了20万美元。而在大模型基础上进行微调的费用就小很多。

所以对于可商用的LLM就有很大的需求,而且有很好的应用前景,例如在开源LLM基础上训练某个大企业的客服模型等。很高兴看到近期MPT和RedPajama分别发布了可商用的LLM模型。

北方的郎:MPT-7B:开源,商业可用,性能堪比LLaMA-7B的LLM新成员

北方的郎:不止是数据,RedPajama的模型也出来了,RedPajama 7B, 一个开源的高效LLM模型

LLM as a Controller

我感觉现在LLM的一个重要趋势就是LLM as a Controller(这个叫法是我自己拍脑袋想的,不知道学术界是怎么称呼的),就是把LLM放在前面作为控制器,其他专业模型作为工具,实现1+1>2更好的解决问题。HuggingGPT就是一个很好的尝试。

北方的郎:HugingGPT 模型整合,贾维斯来了

其他LLM进展:

其他的模型也都各有特色

北方的郎:HuggingChat来了-各种Chat这么火Huggingface终于也忍不住了

北方的郎:IBM也下场LLM了,低成本、高效率的单峰驼Dromedary来了

AI绘画:

Stable Diffusion

主流的开源模型还是Stable Diffusion,因为它的生态非常丰富,各种Checkpoint和Lora都很多,可以生成非常漂亮的图。

北方的郎:深入浅出讲解Stable Diffusion原理,新手也能看明白

DeepFloyd IF

对于需要精确控制的图片,例如需要显示特定的文字,因为Stable Diffusion使用的是潜空间(latent space),所以有些力有不逮。这时就可以使用DeepFloyd IF,它复现了Google的Imagen(Text-to-Image Diffusion Models),采用像素空间,效果会更好。例如:

prompt:landscape of newyork with words "hello"

Midjourney

Stable Diffusion

这个实验只有DeepFloyd IF正确显示了文字。

北方的郎:新的生图模型DeepFloyd IF来了,可以拳打Stable Diffusion,脚踢Dall-E?

多模态

MiniGPT4:

北方的郎:MiniGPT-4来了、脱胎于LLama、开源且好用

LLaVA:

北方的郎:找GPT-4作老师的LLaVA多模态大模型,学的很不错

其他多模态模型:

北方的郎:玩LLM和StableDiffusion常说的LoRA到底是什么

北方的郎:DINOv2: A Self-supervised Vision Transformer Model

北方的郎:继针对图像的分割一切之后,针对视频的Track-Anything(追踪一切)来了

演进路径:

LLM进化树:

很高兴有人做了这张图,让大家可以对LLM的发展一目了然。

北方的郎:大语言模型(LLM)的进化树,学习LLM看明白这一张图就够了

我自己的一些总结和感想:

北方的郎:Transformer类模型应用情况的简单综述

北方的郎:AI内容检测工具评测集合

北方的郎:常用ChatGPT类模型的总结

北方的郎:从GPT-1到GPT-4,GPT系列模型详解

北方的郎:数据即模型,模型即数据

感觉有帮助的朋友,欢迎赞同、关注、分享三连。^-^

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/54579.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

AgentGPT安装使用教程

简介 AgentGPT允许您配置和部署自主人工智能代理。命名你自己的自定义人工智能,让它实现任何可以想象的目标。它将试图通过思考要做的任务、执行这些任务并从结果中学习来达到目标🚀. AgentGPT英文官方网站:reworkd/AgentGPT AgentGPT中文安…

用热爱,走一些“远”路!

相伴:开源十四载,更适合成长中企业的项目管理工具 盛夏来临,2023年也过去了一半。回顾上半年,禅道团队不断突破,拥抱变化,迎接新的机遇和挑战,一些来之不易的突破,让我们惊叹、思考…

告别过去,拥抱未来:一个Java开发者的成长之路

时光飞逝,不知不觉已经到了大四毕业的时候。回顾这四年的学生生涯,Java开发是让我最为热爱和投入的一部分。在这里,我想和大家分享我在Java开发方面的收获、经验和感悟,同时也向过去的自己告别,迎接未来的挑战。 从入门…

俩小伙一晚上写了个AI应用,月入两万??(文末附开发教程)

开发出一款能够与 AI 对话生成和编辑思维导图的工具,听起来似乎只能是一群专业的 AI 背景团队花费大量的时间和精力训练模型,打磨应用才能完成的事情。 但是,两名大学生却在一夜之间完成了,就像炼金术士将庸俗的材料转化成黄金一样…

俩小伙一晚上写了个 AI 应用,月入两万??(文末附开发教程)

开发出一款能够与 AI 对话生成和编辑思维导图的工具,听起来似乎只能是一群专业的 AI 背景团队花费大量的时间和精力训练模型,打磨应用才能完成的事情。 但是,两名大学生却在一夜之间完成了,就像炼金术士将庸俗的材料转化成黄金一…

【CNN基础】一文读懂批归一化(Batch Normalization)

目录 1、批归一化(Batch Normalization)的含义以及如何理解 2、批归一化(BN)算法流程 3、什么时候使用Batch Normalization 总结 1、批归一化(Batch Normalization)的含义以及如何理解 Batch Normaliza…

桌面安装包里的安装程序都包含什么?

下图是安装包里面的内容: ArcGIS Coordinate Systems Data – 包含 GEOCON 变换方法所需要的数据文件以及美国(VERTCON 和 GEOID12B)和世界 (EGM2008) 的垂直变换文件 我们一般不采用GEOCON方法转换数据,所以对我们来说这个包用处…

chatgpt赋能python:Python股票买入指南:如何用Python优化股票交易

Python股票买入指南:如何用Python优化股票交易 在当今的数字时代,称为“量化交易”的股票交易战略越来越受欢迎。这种交易方式基于数据分析和算法,利用计算机快速处理信息和大数据量的优势,从而提高投资回报率。 Python作为一种…

靠AI六小时搞出蝙蝠侠动画电影,小哥喜提百万浏览量

詹士 发自 凹非寺量子位 | 公众号 QbitAI 用ChatGPT和MidJourney制作动画电影,6小时足矣。 一位名叫Ammaar Reshi的湾区设计师用上述两个生成AI模型,成功做出一部蝙蝠侠的动画小电影,效果也是相当可。 片头雷鸣电闪,直接把蝙蝠侠阴…

基于大模型来构建自己非结构化数据集的问答数据对

在instruct gpt 出来以前文本生成的输入只有原文。出现了instruct gpt以后。我们需要做一个特征丰富工程。通过特征丰富工程来提升文本生成任务的效果。如果仅仅是问答那就不要做这么大的模型。问答一般长度在1024以内可以解决掉。你见过什么样子的对话是长到没边际的吗。我想&…

9000万美元的天价酬劳!马斯克起诉撮合推特收购的律所“趁火打劫”

整理 | 朱珂欣 出品 | CSDN程序人生(ID:coder_life) 最近,马斯克又搞新事情了。 据 CNBC 报道,7 月 5 日,马斯克向加州三藩市高等法院提起诉讼,指控负责 Twitter 收购案的美国律所 Wachtell,…

如何获得英语单词的发音?增加 IPA-SAMPA

简 介: 为了获得英文单词的读音并进行显示,使用 eng_to_ipa 或者单词的 IPA, 然后通过自行编写的转换程序,将IPA 转换成 sampa并进行显示。 关键词: sampa,ipa #mermaid-svg-GwdfYZF6FSFzojGQ {font-family…

英语口语测试评分软件,7款超人气英语口语app深度测评

来源 | 泼辣有图 在英语的学习中,口语是我们不可忽视的一个重要环节。现在用手机app学习也是特别的流行,市面上也开始出现了各式各样的app,苏格特地选择了7款现在比较火的app来做个测评,大家可以根据测评选择最适合自己的一款app。 01 英语流利说 [ IOS&Android ] 界面…

英语口语评测技术在学习产品中的设计应用

语音评测技术又称口语评测技术、口语自动评估技术,通俗来说,就是利用计算机辅助语言学习(Computer Assisted Language Learning),是一种通过机器自动对发音进行评分、检错并给出矫正指导的技术。 该技术可以弥补人工评…

计算机英语口语app,最实用五大英语口语app,强烈推荐

No.1 英语流利说 推荐指数:★★★★★ 这是app store多次推荐的app。英语流利说是一款口语模仿并可以智能口语打分软件。 内置各种以场景为主题的课程,你可以模仿跟读,它会根据你发音的情况给你打分。另外还有各种英语兴趣学习圈子&#xff0…

浙大与微软发布的 HuggingGPT 在线演示惊艳亮相,可完成多模态复杂任务,将带来哪些影响?...

击上方关注 “终端研发部” 设为“星标”,和你一起掌握更多数据库知识 本文首发于知乎:httpss://www.zhihu.com/question/594533230/answer/2975554866 GPT-4的横空出世,让很多人为止着迷,许多人浅尝到了大型语言模型的强大能力&a…

终于,小灰招到了公司的第一位员工!

小灰做自媒体创业很久了,但一直是在单打独斗。周围有很多朋友建议我组建团队,我也一直没有去尝试。 为什么呢?一方面,小灰独来独往惯了,总觉得组建团队太麻烦,很多事情自己一个人也能搞得还不错。 另一方面…

如何看待深度学习泰斗、神经网络之父 Hinton 离职 Google?

击上方关注 “终端研发部” 设为“星标”,和你一起掌握更多数据库知识 首发于我的知乎:https://www.zhihu.com/question/598709243/answer/3009509071 一觉醒来,整个科技圈惊掉了下巴!!! Hinton的介绍 Hint…

谷歌解雇高职位员工,开源专家被炒,61岁程序员被迫线上求职

编|陈萍、杜伟源|机器之心 谷歌最近的裁员对最优秀和最聪明的计算机科学家和工程师造成了沉重打击。 最近几个月,裁员似乎已经成为了科技巨擘们的代名词,微软、谷歌、亚马逊、Meta 等无一幸免,不禁让人们对于经济发展的…

4年经验新手程序员用 GPT-4 和 Copilot“ 淘汰”拥有 19 年编程经验的老程序员

编译 | 核子可乐、Tina 出处 | infoQ 图片 | SD 一个成本低速度快,一个代码质量高程序可扩展性好,你会怎么选? 一位名叫 Ab Advany 的技术人员最近接了个小活儿,帮他的一位好友在其工作单位监督编程案例研究。这项案例研究总共花…