3·15特辑 | 少侠,可曾听说ChatGPT也有“食品安全问题”?

701c0ea6c4eb4edabfe27e9e140a0cbe.png

3月15日,有两件事情最吸引国内网民的眼球:一件是牵动所有消费者的3·15晚会,另一件则是ChatGPT母公司OpenAI于当日凌晨发布了再次爆火出圈的GPT-4

据媒体报道,相比于ChatGPT之前所使用的GPT-3.5 架构,GPT-4实现了以下几个方面的飞跃式提升:强大的识图能力;文字输入限制提升至 2.5 万字;回答准确性显著提高;能够生成歌词、创意文本,实现风格变化。 

这两个看似毫不相关的事情凑在了一起,也算是一段“奇妙的缘分”。

b12da9f7de3856ec2703387ff6d70c3a.png

人工智能也需要重视“食品安全”

3eb7a2b9719867695c1db6e37bafd079.png

众所周知,作为央视3·15晚会的常客,食品安全问题几乎从未缺席

例如,在2022年,晚会提及了两件食品安全问题,分别是“老坛酸菜造假”与“木薯粉冒充红薯粉”两类问题。

7de02c5486b9cf68a2d154e3e89e0a41.png

在2021年,晚会曝出蜜雪冰城被曝篡改食品日期,华莱士炸鸡掉地捡起重炸等。

45c75f76360d1d8234450df2fca40f0d.jpeg

2020年,南昌汉堡王被曝出没有按照规定使用足量食材,并且将已经过期的食材修改保质期后继续使用。

2019年,劣质辣条成为了食品安全曝光的第一枪。

……

说一个“热知识”,除了3·15已经曝光的这些食品安全问题之外,人工智能也是需要“进食”的,同样有食品安全问题。

f3614e0f0d32a5ede814c50ab0056118.jpeg

作为人工智能圈子的“当红炸子鸡”,ChatGPT一经问世,就迅速火爆出圈。有人希望它能帮忙写代码,有人希望它能帮忙挖漏洞,还有人希望它能帮忙写文章甚至是周报……

7df79c5095a8196f1953a8130a14920c.png

图片来源于网络

除了这些各种被玩坏的对话框,朋友圈还经常能看到类似这样的对话,对其提出了些许“批评”。

79d8c12c65042b130f09d633c6a862ba.png

甲:这人工智能也不是很聪明啊,在某些特定领域还是需要专门的训练,至少想让我失业还有一段距离;

乙:那当然,你还要给它“投喂”专业知识。

9fe56e4106eb38c88f0b6eaf1c8d4998.png

玩笑归玩笑,这段对话却说出了一个道理,想要完成从“人工智障”到“人工智能”的蜕变,“吃掉”大量专业知识并消化吸收是一个必须的过程

比如你想让ChatGPT写文章,那么它至少应该看过数以百万记的各类体裁的文章;你想让ChatGPT写程序,那么它肯定得看过上亿行C/C++、JAVA、C#、Python等各类机器语言代码。

作为一款生成式语言预处理模型,ChatGPT通过连接大量的语料库来训练模型,这些语料库包含了真实世界中的对话,使得ChatGPT除了具备海量信息检索能力,还能更加准确理解人类语言背后的含义,并根据聊天的上下文进行互动。

这正是ChatGPT更加高明的地方,能够根据已经学习到的知识“举一反三”,完成从无到有的过程。

从这个角度上来说,用于训练人工智能模型的知识或者数据就是它的食物。用于训练的数据质量不好,必然会影响人工智能的计算结果

12dcf6e7f235e1be6b4b9740233150cb.png

从“毒饲料”到“毒AI”

ee93ed8ef1497bcf90fb816e771732c9.png

与此同时,业界也表达了对人工智能的隐忧。

全国政协委员、奇安信集团董事长齐向东在两会期间接受记者采访时表示,人工智能不仅降低了网路攻击的门槛,也让攻击的数量激增,给网络安全带来了巨大挑战。

不少人曾经做过类似的尝试,比如让ChatGPT生成一段网络攻击代码或者批量钓鱼邮件,其业务水平并不弱于资深的渗透测试工程师。

无论ChatGPT水平如何高超,和常见的网络攻击也并没有什么本质上的不同。钓鱼邮件该怎么拦截还是怎么拦截,攻击命令该怎么检测还是怎么检测。

694104235afb674445a7c1101656312b.jpeg

所以有人开始琢磨着在ChatGPT自身做文章,利用其强大的学习能力达成网络渗透的目标

公开资料显示,ChatGPT使用的GPT-3.5架构,拥有1750亿个学习参数,这就好比拥有1750亿张嘴,能够用于学习和训练的数据量是相当惊人的。

GPT-4则更加有过之而无不及。

由于人工智能需要“吃掉”大量数据,因此打入其内部最直接的方法,就是跟着这些数据进去,说白了就是“投喂”一些错误的或者具有误导性的数据字段

尽管通常情况下,数据在投入人工智能训练模型之前会经过数据清洗,即尽可能去掉无效或者错误的数据,从而提升机器学习的效率,保证计算结果的准确性。就像淘米,能够去掉其中的稻皮、米虫和石子等杂质。

但如果是故意投放的“毒大米”,淘米并不能奏效。

8f113090346597606c314752332c323e.jpeg

211c2e46760f7408ffea2b37342f9fd9.png

有研究表明,当攻击者通过将恶意数据如伪装数据、恶意样本等,注入到用于类ChatGPT模型的训练集中,会让模型产生不正确或误导性的结果。这种看似正确、实则“一本正经的胡说八道”的回复,在商业化中会造成严重后果,甚至有法律风险。

f9695ceb658470127d7ef7780b48f8ef.png

作为一款具备强大学习和主动生成能力的人工智能模型,吃掉“毒大米”后的ChatGPT生产出来的就不一定是什么了,有可能是毒米粉,有可能是毒米糕,还有可能是毒爆米花……

4b7e581990986e64d034bd2207733735.png

潜在的软件供应链风险

618befcce17f34d1d4c0b32e34be5474.png

有媒体曾列出了假如ChatGPT能够取得规模化的商业应用,那么中短期内其潜在产业化方向主要包括归纳性的文字类工作、代码开发相关工作、图像生成领域、智能客服类工作。

一打眼看过去,代码开发相关工作显得格外显眼。目前已有不少爱好者尝试使用ChatGPT写出一段代码,并且对其代码水平给出了非常高的评价:“这代码本身干净的都不知道跟谁说道理去,这让程序员咋活嘛。”

那么问题来了,ChatGPT写的代码会有漏洞吗?

88e9c3d62c6035165ceaed9adb4553d9.jpeg

答案是肯定的。无论如何,ChatGPT写代码的技术,也是从无数行手工代码里学来的。一旦ChatGPT等人工智能技术被大规模应用于应用程序辅助开发,其漏洞效应一定会被放大。

尤其需要注意的是,如果有人故意“投喂”含有未知漏洞或者后门的代码进行训练,那么问题就严重了:尽管ChatGPT具备一定的修改bug能力,但这仅局限于已知漏洞或者bug,对于从没见过的漏洞类型却无能为力,在经过反复训练的情况下,会认为这是正确的代码写法。

如此一来,同一个漏洞或者是后门,将会随着ChatGPT进入大量的应用程序中

一款夹杂着未知漏洞和后门的“毒AI”就此诞生。

如果上述过程最终实现,那么这就是一次典型的软件供应链投毒事件,而且这种攻击手法将比现在常见软件供应链攻击手法更为隐蔽

不妨对比一下近年来最严重的一起供应链攻击事件。

a3c343b875c446c62e4e3a15e7537a16.png

2020年12月13日,国外知名安全公司曝光了SolarWinds(知名软件提供商)旗下的Orion基础设施管理平台的发布环境遭到黑客组织入侵,黑客篡改了其中某个组件源码,添加了后门代码,该文件具有合法数字签名,并伴随软件更新下发到了大量客户中。

f78898f6b6a36aedcf261dc24e8b3a53.png

其流程大致如下:

eb27e1605ef89cbd6daf87b5b79b160b.jpeg

不过,无论攻击者使用了多么高明的攻击手法,由于需要攻破SolarWinds服务器并植入恶意代码,一定会留下蛛丝马迹。

比如在此次攻击事件中,调查发现攻击者通过技术手段获取了SolarWinds内网高级权限。

但攻击者如果是ChatGPT就完全不同了,没有人会怀疑它的忠诚度。即便怀疑,也找不到任何证据。

除非,安全人员能找到ChatGPT所写代码的漏洞!

787629272abc4f0929f3b3d5c1e40d5b.jpeg

这个时候你就需要奇安信代码卫士。该产品提供了一套企业级源代码缺陷分析、源代码审计、源代码缺陷修复跟踪的完整解决方案,帮助企业在软件开发测试过程中发现源代码中的安全缺陷、性能缺陷、代码质量等问题,全面提升软件安全质量。

代码卫士支持C、C++、Objective-C、C#、Java等主流编程语言的源代码缺陷分析,能够精确检出SQL注入、跨站脚本、路径遍历、缓冲区溢出、释放后使用、参数未初始化、硬编码密码等1400多种常见源代码缺陷。

有了它,用AI写代码就无后顾之忧了。

代码卫士试用地址:https://codesafe.qianxin.com

开源卫士试用地址:https://oss.qianxin.com

479581b9b612c80ba6e668ebd406abfa.png

推荐阅读

在线阅读版:《2022中国软件供应链安全分析报告》全文

奇安信入选全球《软件成分分析全景图》代表厂商

在线阅读版:《2021中国软件供应链安全分析报告》全文

供应链安全这件事,早就被朱元璋玩明白了

第三方app受陷,Atlassian 数据被盗

奇安信总裁吴云坤:构建四大关键能力 体系化治理软件供应链安全

几乎所有企业都与受陷第三方之间存在关联

热门开源Dompdf PHP 库中存在严重漏洞

命令注入漏洞可导致思科设备遭接管,引发供应链攻击

命令注入漏洞可导致思科设备遭接管,引发供应链攻击

PyTorch 披露恶意依赖链攻陷事件

速修复!这个严重的 Apache Struts RCE 漏洞补丁不完整

Apache Cassandra 开源数据库软件修复高危RCE漏洞

美国国土安全部:Log4j 漏洞的影响将持续十年或更久

Apache Log4j任意代码执行漏洞安全风险通告第三次更新

PHP包管理器Composer组件 Packagist中存在漏洞,可导致软件供应链攻击

LofyGang 组织利用200个恶意NPM包投毒开源软件

软件和应用安全的六大金科玉律

美国政府发布关于“通过软件安全开发实践增强软件供应链安全”的备忘录(全文)

OpenSSF发布4份开源软件安全指南,涉及使用、开发、漏洞报告和包管理等环节

美国政府发布联邦机构软件安全法规要求,进一步提振IT供应链安全

美国软件供应链安全行动中的科技巨头们

Apache开源项目 Xalan-J 整数截断可导致任意代码执行

谷歌推出开源软件漏洞奖励计划,提振软件供应链安全

黑客攻陷Okta发动供应链攻击,影响130多家组织机构

Linux和谷歌联合推出安全开源奖励计划,最高奖励1万美元或更多

开源web应用中存在三个XSS漏洞,可导致系统遭攻陷

开源软件 LibreOffice 修复多个与宏、密码等相关的漏洞

Juniper Networks修复200多个第三方组件漏洞

美国国土安全部:Log4j 漏洞的影响将持续十年或更久

美国国土安全部:Log4j 漏洞的影响将持续十年或更久

PyPI 仓库中的恶意Python包将被盗AWS密钥发送至不安全的站点

开源项目 Parse Server 出现严重漏洞,影响苹果 Game Center

奇安信开源软件供应链安全技术应用方案获2022数博会“新技术”奖

更好的 DevSecOps,更安全的应用

他坦白:只是为了研究才劫持流行库的,你信吗?

热门PyPI 包 “ctx” 和 PHP库 “phpass” 长时间未更新遭劫持,用于窃取AWS密钥

从美行政令看软件供应链安全标准体系的构建

研究员发现针对 GitLab CI 管道的供应链攻击

五眼联盟:管理服务提供商遭受的供应链攻击不断增多

趁机买走热门包唯一维护人员的邮件域名,我差点发动npm 软件供应链攻击

RubyGems 包管理器中存在严重的 Gems 接管漏洞

美国商务部机构建议这样生成软件供应链 “身份证”

《软件供应商手册:SBOM的生成和提供》解读

和GitHub 打官司?热门包 SheetJS出走npmjs.com转向自有CDN

不满当免费劳力,NPM 热门库 “colors” 和 “faker” 的作者设无限循环

NPM流行包再起波澜:维护人员对俄罗斯用户发特定消息,谁来保证开源可信?

NPM逻辑缺陷可用于分发恶意包,触发供应链攻击

攻击者“完全自动化”发动NPM供应链攻击

200多个恶意NPM程序包针对Azure 开发人员,发动供应链攻击

哪些NPM仓库更易遭供应链攻击?研究员给出了预测指标

NPM 修复两个严重漏洞但无法确认是否已遭在野利用,可触发开源软件供应链攻击

热门NPM库 “coa” 和“rc” 接连遭劫持,影响全球的 React 管道

速修复!热门npm 库 netmask 被曝严重的软件供应链漏洞,已存在9年

25个恶意JavaScript 库通过NPM官方包仓库分发

Pwn2Own大赛回顾:利用开源服务中的严重漏洞,攻陷西部数据My Cloud PR4100

开源网站内容管理系统Micorweber存在XSS漏洞

热门开源后端软件Parse Server中存在严重的 RCE ,CVSS评分10分

开源组件11年未更新,严重漏洞使数百万安卓按设备易遭远程监控

开源工具 PrivateBin 修复XSS 漏洞

奇安信开源组件安全治理解决方案——开源卫士

01218e92433174cc4eedc5d9823c51f1.gif

649d02d7d31ba1dbbd107ec262d80b70.jpeg

abfe03b8a7766e4ec2c3f0b05af1f994.jpeg

奇安信代码卫士 (codesafe)

国内首个专注于软件开发安全的产品线。

   3f7148c174e2ba0427c56379322e645d.gif 觉得不错,就点个 “在看” 或 "赞” 吧~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/13362.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

最佳实践 | 用腾讯云智能语音打造智能对话机器人

在AI技术的推动下,智能对话机器人逐渐成为我们工作、生活中的重要效率工具,乃至是伙伴,特别是为企业带来最原始最直观的“降本增效”落地实现。 作为开发者,你是否有想过基于语音技术打造一款智能对话机器人呢? 本文将…

大语言模型(LLM)发展历程及模型相关信息汇总(2023-07-12更新)

大语言模型(large language model,LLM)发展历程及模型相关信息汇总(2023-07-12更新) LLM发展时间轴:以下用表格形式汇总了从 BERT(2018-10-11)到 Baichuan(203-06-15)共计 58种语言大…

一些常用的搜索技巧总结

最近ChatGPT的出现让全网哗然,其对自然语言和代码的处理能力,对文字的理解能力和固定模板下的创作能力都强得离谱。但比起这些,最令我惊讶的还是他及其庞大的知识库。数以千亿计的训练数据让他切实的做到了博古通今。在我看来,拥有…

chatgpt赋能Python-pycharm改名字

PyCharm更名为JetBrains PyCharm——专属Python开发者的最佳IDE JetBrains PyCharm是一款Python开发者最喜欢使用的IDE之一。然而,在2021年初,这款世界著名的Python IDE进行了一次重大更名——PyCharm更名为JetBrains PyCharm。在这篇文章中&#xff0c…

Claude 使用教程 AI助手,可平替Chatgpt,无需魔法

今天来分享下Claude AI工具2023-4月最新使用方法, Claude是Anthropic公司开发的一种基于大型语言模型的AI助手,类似于ChatGPT。 背景:Anthropic是一家由OpenAI的前联合创始人Dario Amodei和他的妹妹Daniela Amodei创立的AI研究公司 。他们的…

使用魔法改善魔法,用chatgpt生成剪贴板保存工具减轻工作量

最近开始使用chatgpt生成代码来编写小工具,大部分时候还算靠谱,就是每次从网页上粘贴内容到编辑器中比较麻烦,尤其是chatgpt洋洋洒洒,给了若干个程序代码,一个个的粘贴真是要了老命了。 试了试cursor,发现也…

Claude 免注册教程

前 OpenAI 副总裁创建的人工智能新项目 “Claude” 来了,有望与 ChatGPT 展开激烈竞争。 Claude 是什么? Claude 是由人工智能安全创业公司 Anthropic 开发的 AI 产品。Anthropic 由多位知名高校的人工智能专家联合创立,其宗旨是研究如何设计…

天津市人工智能计算中心揭牌 天下津梁融汇AI之力

“九河下稍天津卫,三道浮桥两道关”,这是天津人熟知的一句话,意思是九河下稍的尽头是天津卫,是说天津是九条河流的入海口。自明永乐二年天津设卫以来,这座城市就是江河汇聚、贯通南北的水陆码头。天津名字的由来之一&a…

昇腾AI深耕沽上:港口辐射力之后,天津再添基础创新辐射力

作者 | 曾响铃 文 | 响铃说 AI计算正在以新基建联动产业集群的方式,加速落地。 不久前,天津市人工智能计算中心正式揭牌,该中心整体规划300P算力,2022年底首批100P算力上线投入运营,并实现上线即满载。 这是昇腾AI…

AIGC:StableLM 简介

文章目录 [toc]简介应用实践小结其他 简介 众所周知,去年初创公司 Stability AI 发布的 AI 图像生成工具 Stable Diffusion,成为一种革命性的图像模型,也使 AI“文生图”实现了飞速的发展。满载着大家对其“不再局限于开发图像生成”和“开源…

Stable Diffusion公司开源大语言模型StableLM,网友:不是我想要的!

整理 | 朱珂欣 出品 | CSDN(ID:CSDNnews) 众所周知,去年初创公司 Stability AI 发布的 AI 图像生成工具 Stable Diffusion,成为一种革命性的图像模型,也使 AI“文生图”实现了飞速的发展。 满载着大家对其“…

copilot使用教程

Copilot简介 Copilot是⼀种基于⼈⼯智能的代码⾃动补全⼯具,由OpenAI和GitHub共同开发。它使⽤⼈⼯智能算 法来分析代码库,并根据上下⽂和编程语⾔的语法提⽰,⾃动⽣成⾼质量的代码。⽬前,Copilot只能 与GitHub上的代码库集成&…

zblog负载过高导致访问不流畅处理办法

当您的zblog负载过高时,可能会导致网站响应时间过长,甚至无响应。这会影响到您的访客体验,同时也会影响您的网站排名。以下是一些应对方法: 1. 增加服务器资源:如果您的服务器配置过低,可以考虑增加资源&am…

Stable Diffusion公司开源大语言模型StableLM,网友:能把人逼疯!

整理 | 朱珂欣 出品 | CSDN(ID:CSDNnews) 众所周知,去年初创公司 Stability AI 发布的 AI 图像生成工具 Stable Diffusion,成为一种革命性的图像模型,也使 AI“文生图”实现了飞速的发展。 满载着大家对其“…

GPT 学术优化 (ChatGPT Academic)搭建过程(含ChatGLM cuda INT4量化环境和newbing cookie)

文章目录 1、GPT Academic2、chatGPT3、chatGLM4、newbing 1、GPT Academic 项目地址:地址 安装部分 git clone https://github.com/binary-husky/chatgpt_academic.git cd chatgpt_academicconda create -n gptac_venv python3.11 conda activate gptac_venv pyt…

OpenAI GPT3.5/GPT3 + Flask 制作自己的交互网页教程 | 附源码 和 Github链接

1. OpenAI GPT API 1.1 GPT 3.5 API (更新) 真正的 ChatGPT API, gpt-3.5-turbo,终于来了!不同于之前的 GPT3 text-davinci-003 的 api 版本。 GPT 3.5 版本生成的回答将十分的智能。 下图是现在OpenAI提供的模型。…

ChatGLM实战 - 文本信息抽取

1. ChatGLM介绍 ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型,基于 General Language Model (GLM) 架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存&…

【ChatGLM】本地版ChatGPT ?6G显存即可轻松使用 !ChatGLM-6B 清华开源模型本地部署教程

目录 感谢B站秋葉aaaki大佬 前言 部署资源 部署流程 实机演示 ChatGML微调(人格炼成)(个人感觉蛮有趣的地方) 分享有趣の微调人格 实机演示(潘金莲人格) 感谢B站秋葉aaaki大佬 秋葉aaaki的个人空间…

清华版Chatgpt:chatglm-6B教程——如何从训练中确定最合适的学习率

我们在使用chatglm-6B的时候,总会遇到一个问题。即学习率如何确定。我们首先先看chatglm的两个训练用sh文件的学习率是如何确定的。 一、如何第一时间确定学习率 我们可以看到在chatglm给的标准中,对于聊天的训练所默认的学习率是要小于训练广告词的&…

来自清华的ChatGPT?GLM-130B详解

原文:来自清华的ChatGPT?GLM-130B详解 - 知乎 本文会分析一下来自清华的ChatGPT,这篇论文的价值很大,为什么这么将?因为他开源了所有代码,包括模型,baseline。确实是一个不错的里程碑。 GLM-1…