拒绝白嫖!马斯克将起诉微软,称其使用 Twitter 数据“非法”训练GPT

来源:InfoQ、整理:Tina  

北京时间 4 月 20 日早间消息,埃隆·马斯克表示将对微软提起“诉讼”,理由是微软使用 Twitter 数据“非法”训练其产品。

今天早些时候微软宣布将停止在其智能广告平台上支持 Twitter,马斯克此举显然是针对微软的报复行动。微软和马斯克是当前各大平台上的“顶流”,他们之间还存在一些竞争关系,因此,马斯克的言论引起了大量吃瓜群众的关注。

事件经过

今年 2 月,Twitter 宣布不再支持免费 API 访问,将改为付费使用,其套餐价格从每月 4.2 万美元到 21 万美元(约 28.9 万元到 144.5 万元人民币)不等。

根据外媒《WIRED》报道,Twitter 在其开发者平台上提供了三种级别的企业软件包,其中最便宜的是一个小套餐,每月支付 42000 美元可以访问 5000 万条推文。套餐等级越高,研究人员或企业获得的推文数量就越多:每月支付 12.5 万美元可以获得 1 亿条、每个月支付 21 万美元可以获得 2 亿条。使用免费 API 将只能访问平台 1% 的推文,根本不足全面反映该平台上的活动。这对很多研究人员甚至一些企业来说是一种“打击”。

因为马斯克改变了 API 政策,微软今天声称面向广告主的社交媒体规划和调度工具不再支持 Twitter。微软告诉客户:“从 2023 年 4 月 25 日开始,带有多平台的智能广告系列将不再支持 Twitter,从 2023 年 4 月 25 日开始,数字营销中心(DMC)将不再支持 Twitter”。这些举措意味着用户将不再能够访问他们的 Twitter 账户,或者通过微软的免费社交媒体管理服务创建、安排或以其他方式管理推文。

凭借其 2.15 万亿美元的市值和去年年底手头约 1000 亿美元的现金,微软显然有足够的钱向 Twitter 支付它想要的东西,因此微软想表达的并不仅仅是声明中的那么简单。

07f7599a90b790f019a4d91192addfa3.png

而马斯克也好不容易才看到扭亏为盈的希望,因此对微软的封杀令十分不满,他发推文指责微软非法使用 Twitter 数据进行 AI 训练,声称要起诉微软。

目前尚不清楚马斯克究竟指控微软使用 Twitter 数据非法训练哪些 AI 产品,但很可能针对的就是 ChatGPT。根据微软与 OpenAI 的许可协议,OpenAI 用“来自互联网的大量不同文本数据”训练了其强大的 AI 模型。

马斯克本身就对微软不满,后者已成为 ChatGPT 背后的公司 OpenAI 的主要合作伙伴。尽管马斯克帮助创建了 OpenAI,但他自那以后一直抨击这家位于旧金山的实验室是一家“由微软有效控制的闭源、利润最大化的公司”。

不管马斯克是否真会去起诉,马斯克推文下的吃瓜群众反正是乐翻了天:“爆米花准备好了!”“马斯克在做正确的事情,赶紧起诉,不要只说不做!”“啊,见证历史啊,马斯克要将 Billy-Bully 的盖茨告上法庭~”“马斯克与微软在 Twitter 数据上的战斗将是一场值得关注的大战”......

12336feb8ddfeef58a078aa3b77c4d9f.png

马斯克与微软注资的 OpenAI 竞争升级

马斯克起诉微软,也有网友对此表示事情变得更有趣了,“马斯克说他要起诉微软,虽然我是 OpenAI 的粉丝……但是,我觉得马斯克的诉讼是有道理的。1) OpenAI 是用马斯克的钱 + 声誉资助的。2) 他创造了这个名字并获得了早期的雇员。3)他的名声被利用了……”

2015 年,马斯克曾参与创立 OpenAI,并坚持要求 OpenAI 技术必须是开源的。2018 年,马斯克从公司董事会辞职。2019 年马斯克宣布跟 OpenAI 彻底分道扬镳,表示由于自己与 OpenAI 在一些发展观点上发生不和,所以选择了退出。不久之后,OpenAI 宣布接受微软 10 亿美元注资,摆脱了非营利组织的地位。

马斯克曾明确地表示,“我为了创建 OpenAI 真的付出很多努力,以抗衡谷歌公司,”他说。“然后我转移了注意力。我猜,他们现在是闭源的,而且他们显然是逐利的,他们与微软合作密切。在这一点上,微软即使没有直接控制 OpenAI,也有很大的发言权。”

马斯克虽然也赞美过 ChatGPT 的表现“好得有点可怕“,但他更多的是担心人工智能带来的安全威胁,认为微软和谷歌在这方面做的都不够好:微软支持的 OpenAI 一直在“训练人工智能说谎”,而谷歌联合创始人拉里·佩奇没有认真对待人工智能安全。

今年 2 月,马斯克在 Twitter 上表示,对比 ChatGPT,“我们需要的是 TruthGPT”。至少从那时开始,马斯克一直在积极物色 AI 领域的人才,希望与 ChatGPT 展开竞争。他挖到的人才包括 Igor Babuschkin、 Manuel Kroiss 等,近期还大手笔购置 1 万张英伟达 A100 GPU,这是训练大模型必备的高性能芯片。就在前几天,马斯克在接受采访时宣布,他将推出一个名为“TruthGPT”的 AI 平台。

马斯克认为 TruthGPT 是对 OpenAI 的修正。OpenAI 对利润的追求可能会干扰其塑造 AI 模型时的道德观念。与之对应,“TruthGPT”才是更加透明的选项。TruthGPT 团队也在其 Telegram 频道上解释说,TruthGPT 的使命是“建立马斯克愿景...... 其开发已经启动,很快它将成为全世界都可以访问的诚实和真理的灯塔。”

反对大模型白嫖

数据是大模型训练中必不可少的资源,然而最近出现了许多关于数据使用权的争议,认为大模型侵犯了用户和企业的版权。

在马斯克扬言起诉微软之际,另一个社交媒体平台 Reddit 宣布计划向使用其 API 的用户收费,理由是 Reddit 用户的数据被用来训练人工智能模型。

Reddit 是 AI 聊天机器人的重要数据资源,其 API 自 2008 年以来一直免费对开发人员开放。4 月 18 日,Reddit 宣布将开始向过度使用其数据 API 的公司收费。

虽然没有直接点名 OpenAI 或谷歌这样的公司,但 Reddit 首席执行官兼联合创始人史蒂夫·霍夫曼表示,包括 Reddit 在内的社交媒体资源提供了用于训练大型语言模型 (LLM) 的一些资源,这些模型可以对人类提示提供有说服力的响应。他强调 Reddit 的数据语料库非常有价值,“是进行真实对话的地方”,“(人工智能公司)爬取 Reddit 产生价值,但不将任何价值返回给我们的用户,”霍夫曼认为,“现在是收紧政策的好时机。”

与此同时,生成式 AI 正面临艺术家集体诉讼,此前旧金山三名艺术家表示他们多年塑造的作品风格被 AI 仿效,要求绘图公司提供补偿。全球图库图片巨头 Getty Images 也对 Stable Diffusion 背后的公司 Stability AI 提起诉讼。Getty Images 声称其超过 1200 万张受版权保护的图片被用于训练 Stable Diffusion,要求 Stability AI 给予 1.8 万亿美元的赔偿。

当其他公司开始要求大模型企业付费使用时,马斯克是第一个声称微软使用 Twitter 的数据是违法的人。此后,任何公司,只要其数据被微软、谷歌等企业用来构建生成式人工智能产品,将都可以使用马斯克这一论点。

不确定 Twitter 和微软是否真的会在法庭相见,但大模型背后的公司和那些在途中无偿提供数据的公司,他们之间的诉讼将会越来越多。

参考链接

https://bgr.com/tech/elon-musk-claims-microsoft-illegally-trained-its-ai-using-twitter-data-threatens-lawsuit/

https://twitter.com/elonmusk/status/1648784955655192577

https://www.businessinsider.com/reddit-to-charge-ai-companies-api-content-use-2023-4

------

我们创建了一个高质量的技术交流群,与优秀的人在一起,自己也会优秀起来,赶紧点击加群,享受一起成长的快乐。另外,如果你最近想跳槽的话,年前我花了2周时间收集了一波大厂面经,节后准备跳槽的可以点击这里领取!

推荐阅读

  • 赠书机制大修改:人满就结束,先到先得!

  • Amazon发布个人免费的AI编程助手:CodeWhisperer !

  • 92K Star !AI 都完全不需要咱们人类了?

··································

你好,我是程序猿DD,10年开发老司机、阿里云MVP、腾讯云TVP、出过书创过业、国企4年互联网6年。从普通开发到架构师、再到合伙人。一路过来,给我最深的感受就是一定要不断学习并关注前沿。只要你能坚持下来,多思考、少抱怨、勤动手,就很容易实现弯道超车!所以,不要问我现在干什么是否来得及。如果你看好一个事情,一定是坚持了才能看到希望,而不是看到希望才去坚持。相信我,只要坚持下来,你一定比现在更好!如果你还没什么方向,可以先关注我,这里会经常分享一些前沿资讯,帮你积累弯道超车的资本。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/30339.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【GPT4技术揭秘】GPT-4 Architecture,Infrastructure,Training Dataset,Costs,Vision,MoE

本文是对《GPT-4 Architecture,Infrastructure,Training Dataset, Costs, Vision, MoE 》的中文翻译。介绍了GPT-4使用的相关技术,希望对大家有一些帮助。群友分享了总结内容如下: 13T tokens预训练语料 (llama和palm是1.4T)MoE&…

3 分钟为英语学习神器 Anki 部署一个专属同步服务器

原文链接:https://icloudnative.io/posts/anki-sync-server/ Anki 介绍 Anki 是一个辅助记忆软件,其本质是一个卡片排序工具--即依据使用者对卡片上的自定义内容进行主动测试、自我评判后,其内部算法根据评判结果更改每张卡片下次测试时间的…

chatgpt赋能python:Python中的{:>8}

Python中的 {:>8} 介绍 在Python中,{:>8}是一个字符串格式化的方法,它的作用是将字符串向右对齐,并在字符串左侧填充指定字符。这个方法非常有用,尤其是在需要对齐输出结果或者生成格式化的文本时。 这个方法在Python中非…

Heartbeat安装

安装Heartbeat前的准备 Heartbeat集群必须的硬件 从下图看出,构建一个Heartbeat集群系统必须的硬件设备有: 节点服务器; 网络和网卡; 共享磁盘。 节点服务器 安装Heartbeat至少需要两台主机,并且对主机的要求不高&…

ansible企业级实战(Markdown)

ansible经典实战 一、配置文件解释二、实战2.1 脚本分发 && 使用copy生成新文件2.2 列出所有被管理主机list2.3 基于key验证来避免每次输入密码2.3.1 机器密码不一样的解决方案 2.4 fetch 抓取被控制端的文件2.4.1 fetch 如何抓取多个文件? 2.5 file 模块设…

【Python】词云之 wordcloud库 全解析

有用的话,欢迎姗莲✨✨✨✨✨✨✨✨✨✨✨✨✨ 目录 一基础用法二、WordCloud类 形参说明2.1 常用参数2.11 字体 font_path2.12 画布尺寸 width、hight2.13 比例(缩放)scale2.14 颜色(表) colormap2.15 颜色函数 color_func2.16 词语组合频率…

【云炬COMSOL模型】自己做的激光超声的COSMOL模型

模拟结果 表面温度 等值线 表面应力 模型设置 全局定义 几何 材料 固体传热物理场 固体力学物理场 多物理场 网格 研究&计算日志 2e-06 - out- 1.43e-06 - out- 1.44e-06 - out- 1.45e-06 - out- 1.46e-06 …

uniapp生成商品分享海报

uniapp用canvas生成一个分享商品的海报 文章目录 前言一、展示效果二、使用步骤1.HTML部分2.CSS部分3.JS部分 总结 前言 uniapp用canvas生成一个分享商品的海报,因为用到了uni.downloadFile这个API,所以要注意图片在H5端跨域的问题。 以下是本篇文章正…

postman错误提示“Current request is not a multipart request”

今天在写业务进行批量上传文件时,用postman测试发现报500错误----Current request is not a multipart request,翻译了一下大概意思是 当前请求不是多部分请求,所以就很纳闷。今天特意记录一下 首先我们上传文件时,在postman里面…

如何为豆瓣FM写一个chrome的歌词插件

对于喜欢豆瓣FM的同学来说,没有歌词是件令人苦恼的事,下面我就来总结下怎样为豆瓣FM写一个chrome的歌词插件。 --------------------------------- 1.需要的技能 首先,你要会javascript,其次你要掌握一点chrome的hack&#xff…

设计师解放双手之作!3秒生成风景园林效果图,AIGC赋能景观设计

项目简介 在过去几十年,风景园林经历了从“刀耕火种”的完全手绘设计时代到当下比较流行的参数化设计时代,过去的每一轮技术革新都让风景园林作品的表现形式产生了巨大的改变。随着计算机图像技术的发展,我们有更多的建模和渲染软件辅助提升图…

有哪些中西合璧的建筑设计?

所谓中西合璧,中即中华文化,体系繁多,源远流长,浩如烟海,是世界三大文化体系之一,在历史上曾是东亚文化的中心,一度影响欧洲;西即西方文化,西方物质文明和精神文明&#…

独家 | ChatGPT可以解决分级和分类这样的简单机器学习任务

作者:Damir Yalalov 翻译:陈超 校对:赵茹萱本文约1100字,建议阅读5分钟 本文介绍了ChatGPT如何解决简单的机器学习任务并给出了鸢尾花分类和城市预测两个案例。 一句话概括: ChatGPT可以帮助你完成简单的机器学习任务…

决定AI大模型胜负的关键:解读数据在未来竞争中的角色

随着人工智能的迅猛发展,高质量数据的重要性已愈发明显。以大型语言模型为例,近年来的飞跃式进展在很大程度上依赖于高质量和丰富的训练数据集。相比于GPT-2,GPT-3在模型架构上的改变微乎其微,更大的精力是投入到了收集更大、更高…

RWKV 语言模型:具有 Transformer 优点的 RNN

RWKV 语言模型,这是一个具有巨大潜力的开源大型语言模型。由于 ChatGPT 和一般的大型语言模型最近受到了很多关注。在这篇文章中,我将尝试解释与大多数语言模型(transformer)相比,RWKV 有何特别之处。 RWKV 可视化 浅谈…

重磅活动!线下报名 | 大模型为什么是AI领域的“兵家必争之地”?

点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 离我们自己的“ChatGPT”还有多远? GPT-4 , game changer OR game over? Copilot究竟是打工人的福音还是噩梦? AI TIME今年将持续推出AIGC大咖思辨的线下活动!AIG…

火爆首发 | 微软工程师解密全球火出圈的AI科技ChatGPT

首期“支点加速营前沿技术研习社”线上直播课开启报名啦! 本次课程由苏州人工智能产业创新中心、图灵社区联合主办,苏州国际科技园和蒲公英孵化器协办,微软(亚洲)互联网工程院提供技术支持。 与此同时,课程…

百度文心大模型 3.5 斩获7个满分、三个第一;苹果正在测试 AppleGPT 产品;谷歌给员工断网,降低网络攻击风险|极客头条...

「极客头条」—— 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews) 一分钟速览新闻点&#…

如何抢演唱会门票,AI给你一套超强攻略

有的歌手的演唱会门票不会放在一个平台,以应该提前做好攻略,那么对于我这种新手小白该如何抢到票呢,其实我们可以通过AI去找到解决办法 1、打开多御浏览器、找到ChatGPT进入页面 二、提前准备好你想去看谁谁的演唱会,他会给你分析…

1天生成100个chatgpt提问prompt提示语,逆向提示语工程引爆创作火花!ChatGPT超级写手机器人助你创作惊艳之作!

1天生产出1000套提问模版,逆向提示语工程引爆创作火花!ChatGPT超级写手机器人助你创作惊艳之作! 创作内容时,找不到合适的提示词是个巨大困扰。 这限制了我们的创作潜力,无法生成满意的内容。 你是否渴望一种创作工具&…