AIGC(AI Generated Content)即人工智能生成内容。近期爆火的 AI 聊天机器人 ChatGPT,以及 Dall·E 2、Stable Diffusion 等文生图模型,都属于 AIGC 的典型案例,它们通过借鉴现有的、人类创造的内容来快速完成内容创作。
“新晋流量”ChatGPT的背后,AIGC是“昙花一现”?还是将引领人工智能进入新的时代?「AIGC 周报」将从【技术前瞻】【企业动态】【政策法规】【专家观点】带你快速跟进 AIGC 世界。
01 技术前瞻
让AI画一画《海贼王》
如今,随着大型语言模型和扩散模型的快速发展,人们有能力生成具有有趣故事情节的漫画,同时保持艺术家的艺术风格。
在该研究中,研究团队使用ChatGPT来生成《海贼王》的故事情节,然后使用Stable Diffusion生成漫画。
此外,他们引入了一种新的方法来评估AI生成的故事,通过使用LoRA、ControlNet等微调Stable Diffusion,在人物保真度和艺术风格上达到了SOTA表现。
论文链接:
https://arxiv.org/abs/2305.11067
收藏!一篇关于GPT的全面回顾
这是一篇关于GPT的综述文章,由一个多国联合团队联合发表。该综述详细介绍了GPT的结构、工作过程、训练程序、使能技术,以及它对各种应用的影响。
在这篇综述中,他们还探讨了GPT的潜在挑战和局限,并讨论了潜在的解决方案和未来方向。
论文链接:
https://arxiv.org/abs/2305.10435
快300-2500倍,高效、个性化和高质量多主体图像生成模型
扩散模型在文生图方面表现出色,但仍然存在因微调而效率低下、因计算密集而难以部署等问题,而且常常在多主体生成方面表现不佳。
该研究提出了FastComposer,它能实现高效、个性化、多主题的文本-图像生成,而无需进行微调。实验表明,其可以生成具有不同风格、动作和背景的多个未见过的人物图像,比如爱因斯坦和牛顿坐在一起、同被誉为“深度学习三巨头”之一的 Yoshua Bengio 和 Geoffrey Hinton 在海滩等。
与基于微调的方法相比,FastComposer的速度提高了300-2500倍,为高效、个性化和高质量的多主体图像生成打下了坚实的基础。
论文链接:
https://arxiv.org/abs/2305.10431
02 企业动态
iOS版ChatGPT上线
5月19日凌晨,OpenAI官方推出了iOS版ChatGPT。
据官方博客介绍,iOS版ChatGPT供用户免费使用,并在不同设备(移动端和网页端)上同步聊天历史。同时,它还集成了开源语音识别系统Whisper,可以语音输入。另外,ChatGPT Plus用户能在iOS版ChatGPT上继续享受GPT-4的服务,提前获得各种功能和更快的响应时间。
然而,遗憾的是,目前只有iOS用户(美区)可以使用iOS版ChatGPT,安卓用户还要再等一等了。值得注意的是,iOS版ChatGPT依然会生成存在事实性错误的内容。官方也提醒,用户最好不要在app内分享任何敏感数据。
苹果出手了,限制员工在公司内使用ChatGPT
据《华尔街日报》消息,苹果已限制员工在公司内使用ChatGPT和其他外部AI工具,目前苹果正开发自家的类似技术。文件指出,苹果担心使用外部程序的员工“可能会泄露机密数据”。据悉,苹果还告知员工不要使用微软的GitHub Copilot。
Meta将建设一个新的AI数据中心
扎克伯格表示,Meta将建设一个新的AI数据中心,该数据中心将配备支持液冷硬件的设备,以处理大规模的训练和推理;Meta设计了“Meta训练和推理加速器”首代定制芯片,为AI推荐系统提供动力;此外,Meta也开发了名为“CODECOMPOSE”的生成式AI编码助手,帮助工程师在编写代码时提高效率。
Hippocratic AI获得5000万美元融资,聚焦医疗教学领域
5月17日,生成式AI平台Hippocratic AI宣布获得5000万美元(约3.5亿元)种子轮融资,由General Catalyst和Andreessen Horowitz共同领投。Hippocratic AI基于大语言模型开发的AI聊天机器人主要聚焦在医疗教学领域,提供类ChatGPT问答服务。Hippocratic AI能模拟各种类型的病人、语气、性格与医生对话,帮助医生提升医学知识。
腾讯音乐:正探索大语言模型应用 已推出两款AI音乐制作产品
近日,在腾讯音乐今晚2023年第一季度业绩会上,腾讯音乐CEO梁柱表示,本季度,腾讯音乐探索了大语言模型在AIGC领域落地的多元应用,推出了“TME Studio音乐创作助手”与“音色制作人”两款产品,协助音乐人在作词、作曲、音乐内容分析与剪辑等制作环节的效率提升。
WPS AI接入文字、表格、PPT、PDF四大组件
生成式AI应用WPS AI对外展示了类微软Copilot的能力,接入了文字、海外版表格、PPT演示文稿、PDF四大日常办公组件。未来几个月,WPS 产品将逐渐上线这些功能,国内和海外版有所区别,海外版直接使用OpenAI的接口,而国内在知识库构建上可能会更快一点。
智谱AI、清华大学KEG实验室开源多模态对话模型VisualGLM-6B
近日,智谱AI和清华大学KEG实验室开源了基于ChatGLM-6B的多模态对话模型VisualGLM-6B。
据介绍,VisualGLM-6B是一个开源的、支持图像、中文和英文的多模态对话语言模型,不仅可以进行图像的描述及相关知识的问答,也能结合常识或提出有趣的观点。
值得关注的是,结合模型量化技术,用户可以在消费级的显卡上进行本地部署该模型(INT4量化级别下最低只需8.7G显存)。
03 政策法规
北京就促进通用人工智能发展若干措施征集意见
近日,北京市科委、中关村管委会就《北京市促进通用人工智能创新发展的若干措施(2023-2025年)(征求意见稿)》公开征集意见。
《征求意见稿》在“加强算力资源统筹供给能力”“提升高质量数据要素供给能力”“系统布局大模型技术体系,持续探索通用人工智能路径”“推动通用人工智能技术创新场景应用”“探索营造包容审慎的监管环境” 5 个方面提出了 21 项具体措施。
上海:支持中小企业购买智能工厂诊断咨询及AI算力等服务
近日,上海市服务企业联席会议办公室印发《上海市助力中小微企业稳增长调结构强能力若干措施》,提出加大数字能力供给。支持中小企业使用线上会议软件、工业软件等“小快轻准”数字化解决方案和产品。实施智评券、算力券等,支持中小企业购买智能工厂诊断咨询及AI算力等服务。对在上海数据交易所首次挂牌数据产品、优秀数据品牌和数商给予资金补助,培育不少于300家中小数商企业,形成不少于30个品牌数据产品。
教育部:培养一大批具有创新能力和合作精神的AI高端人才
近日,教育部部长怀进鹏在第七届世界智能大会开幕式上表示,非常愿意与世界各国以及产业界、科技界积极合作,共同推进教育数字化、教育智能化,推进学习型社会和终身学习,不断加强教育改革与创新,面对未来我们将研判AI发展态势,聚焦AI前沿问题,持续加强AI相关学科专业和平台载体建设,培养一大批具有创新能力和合作精神的AI高端人才,以支撑智能科技和产业发展。
科技部:加大AI基础理论和前沿技术研发布局
近日,科技部部长王志刚在第七届世界智能大会开幕式上表示,将紧紧把握全球AI发展的新机遇,尊重科技创新和AI发展的规律,加大AI基础理论和前沿技术研发布局,打造一批AI区域高地和技术平台,深化企业牵头的产学研用融合,推动AI赋能经济社会发展。
美国纽约市公立学校取消了ChatGPT禁令
近日,美国纽约市公立学校在最初禁止使用ChatGPT后,解除了对该技术的禁令。“纽约市公立学校将鼓励和支持我们的教育工作者和学生学习和探索这种改变游戏规则的技术,同时创建一个存储库和社区,在我们的学校分享他们的发现,”纽约市教育部长大卫·班克斯在教育网站Chalkbeat的一篇专栏文章中说。班克斯为他早些时候禁止这项技术的决定辩护,称最初的谨慎是必要的,但他承认,这种反应是一种“下意识的恐惧”,没有认识到生成式AI的可能性及其支持学生和教育工作者的能力。
04 专家观点
Sam Altman:AI仍处于早期阶段,仍会犯错
OpenAI首席执行官Sam Altman表示,AI技术仍然处于早期阶段,仍然会犯错;ChatGPT-4将使一些工作实现自动化,同时将带来新的工作机会;最担心的是科技会带来重大的伤害;“一些监管将是非常明智的”。
Satya Nadella:AI将创造新机会,或出现10亿技术开发者
近日,微软首席执行官Satya Nadella表示,关于对AI的担忧,“整个社会”必须团结起来,“最大限度地利用这项技术带来的机会并降低危险”。Nadella说,每当一项新的颠覆性技术出现时,就业市场都可能出现很大的变化。不过他也相信,AI能创造出新的就业机会,可能会出现10亿技术开发者。
DeepMind联合创始人:传统搜索引擎将在10年内消失
日前,DeepMind联合创始人Mustafa Suleyman表示,互联网即将发生根本性变革,传统搜索引擎将在10年内消失,对话式互动产品将引发新一轮技术浪潮。另外,Suleyman预计,每个人都将在未来几年中拥有自己的个人AI,包括商业AI、非营利性AI、网红AI和品牌AI等。
李彦宏:不担心大模型会让工作消失
近日,百度创始人、董事长兼首席执行官李彦宏表示,AI不会让工作机会减少,会带来全球经济的下一个增长奇迹。每一次科技革命,都会让一部分工作消失,同时创造更多新工作岗位。他举例说,汽车取代马车,的确让马车夫的工作消失了,但在今天,汽车产业成为了全球最大的工业体系之一,创造了数以亿计的就业岗位。“我不担心大模型会让工作消失,我认为,未来会有更多的工作产生。”
曾毅:算力底座是下一阶段最需要解决的一个重大问题
在第七届世界智能大会上,中国电子董事长曾毅在演讲中表示,AI离不开三个东西(算力、算法、模型)。“我的观点是,算法的问题应该会得到比较妥善的解决,模型的问题有难度,从全球资源来看,英文为主体的数据资源仍然占80%、90%以上,但我们也能解决。现在,我觉得最卡脖子、最难受的是算力底座的问题,算力底座可能是我们下一阶段最需要解决的一个重大问题。”
高盛分析师:AI可以在未来十年内将标普500企业的利润提高30%
日前,高盛资深分析师Ben Snider在接受CNBC采访时提到,“未来10年,每年AI生产力将增长1.5%,这意味着可能会使标普500企业的利润在未来十年内增加30%或更多。”他还表示,“许多推升标普500企业获利的有利因素可能正在逆转,但真正可以保持乐观的原因,在于AI将提高生产力。”
刘庆峰:讯飞星火大模型会在10月实现中文超越ChatGPT
科大讯飞董事长刘庆峰表示,认知大模型已经成为通用人工智能的曙光,目前纯大模型仍存在缺陷,包括无法及时更新知识、事实类问答容易“张冠李戴”、对传统典籍容易出现编造情节等。他还表示,现在讯飞星火离ChatGPT只有一步之遥,与100分相比只差两分,在今年10月份之前就会超越它。