随机种子 3407 is all you need

eab2addb5d880a2353678f86ebcbf309.png

文 | 天于刀刀

你最常用的随机种子是哪个?

在刀刀的团队里,关于随机种子的设置主要分化为两派~

玄学派,可能设置为自己的纪念日,又或者是星座预测中的本月幸运数字;

以及,自然派,随机种子是啥其实无所谓,1234或者今天的日期都可以。

深度学习知名学者 ChatGPT 也如下所说:

a93cd858a738a2c2b69d7affae806ee1.jpeg

可是近日我看到了一篇叫做《Torch.manual_seed(3407) is all you need》[1] 的论文,当时看到这个标题的时候我简直眼前一黑。

这篇论文研究了随机种子在深度学习用于计算机视觉时对精度的影响。作者对 CIFAR 10 和 ImageNet 两个数据集进行了实验,结果发现即使方差不是很大,还是很容易找到一个比平均值更好或更差的种子。

4dc74fc1a45b71330b8d9f3f923d1ef8.jpeg9776947a993c2e63752097d09da99e17.jpeg

如图所示,作者在 CIFAR10 上对500个不同的种子进行训练,其中黑线是平均值,暗红色表示标准差,浅红色表示最小值和最大值区间。

可以看到,经过 epoch 25 后,精度几乎没有增加,这意味着模型收敛了。但是浅红色的区间范围没有得到减少,意味着随着模型收敛,随机种子的不同依旧会造成最大值和最小值之间巨大的差别。

同时作者还在文中分析道:由于都是基于同一个预训练模型,因此随机种子的效果只和分类层的初始化以及后续的优化过程有关。

让我们先抛开作者在文中申明的 limitation 不谈,他的这篇文章行文结构还挺像模像样的。

(在这里我指的是抛开他只进行了少量训练,且模型最终的结果完全落后于 SOTA 的事实不谈,单独只看他发文章的科研思想

也就是说,随机种子的选择对结果的影响很大?

虽说觉得有点不靠谱,但事不宜迟,我速速打开了算力平台,新开启了一个训练任务,设置 seed 为3407之后跑了起来。

结果竟然直接 early stop 了!

当我兴致勃勃地打开训练报告时,结果发现关键指标几乎没什么变化,也根本没有发现作者所说的“模型效果获得较大提升”的现象。

结合其缩减了大约 50% 的训练时间的效果(只做了一次实验,无统计学意义),只能说改变随机种子不是完全没作用,但这作用着实不多。

40d2a73c48fe4557fdb3089461483f5a.png

这篇论文让我感到很疑惑,难道我们真的需要研究随机种子的影响吗?

在我的理解中,随机种子的作用主要是为了保证在多次实验中可以重现结果,而不是对结果产生显著影响。

我甚至认为作者是一个行为艺术者,他在嘲讽目前学术界刷论文、比赛刷榜中频频出现的过拟合乱象。

有许多研究者花费了大量的时间精力和算力去撞随机种子,故意过拟合测试集以此来得到 sota 结果,这种行为不能说是毫无意义,只能讲是步入歧途。

作为一名炼丹师,对于随机种子的修改只能是一种缺乏统计学基础知识的表现。

可是转念一想,作为一名算法工程师在工作中总会遇到无论如何绞尽脑汁也难以提分的情况。

在时间紧迫来不及清洗数据、添加数据以及干一些脏活的情况下,面对可解释性极差的 AI 魔法,也许我们选择更改随机种子的时候,心里更多想的是需要一个新的“运气”。

说不定,说不定这样就能提一点点分能让我交差了呢?

作为一名学生,也许我能获得宽裕的时间和资源去支持我按期完成学术研究;

可作为一名员工,也许我在大多数时候只能利用有限的资源去追赶去补完老板口中那个无限的大饼。

“人类是存在极限的”,有的时候并不是我不知道这样没用,但我又能有什么办法呢?

换一个 seed 吧,这就是我最后的波纹了。

# 计算天干地支获取随机幸运种子 [2]
$ pip install randluck
$ python
>>> import randluck
>>> random_seed = randluck.get_random_seed(strategy='bazi')
de767d3709bf87d4087bf83c5dc6308c.png
17260a4b78077f922c79db098ea7560c.png

卖萌屋作者:天于刀刀

注重 WLB 的工业界反卷斗士,未进化的 NLP 咸鱼一条。专注于研究在各个场景中算法模型的落地情况,希望自己编写的算法有朝一日可以改变世界。目前的兴趣点在于:假新闻检测、深度学习模型可解释性等。

作品推荐

1.腾讯薪酬改革来了!晋升≠加薪?员工到底为何工作?

2.从 Google AI 离职了,这里让我爱不起来

3.百万悬赏!寻找“模型越大,效果越差”的奇葩任务!

4.想通这点,治好 AI 打工人的精神内耗

fefff92a241ed778628254c67e104c12.jpeg后台回复关键词【入群

加入卖萌屋NLP、CV、搜推广与求职讨论群

 095a5a7b3697d768440788a4616e5b44.png

[1]torch.manual.seed(3407) is all you need: On the influence of random seeds in deep learning architectures for computer vision, David Picard, https://arxiv.org/abs/2109.08203

[2]Random Luck 基于中国传统玄学自动获取随机种子, https://github.com/Spico197/random-luck

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/20629.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

入门AI到入职,微软首席算法工程师有话要说!

原文来自:异步图书 一边呼吁停止GPT-5研发,一边大肆买入几千台GPU、招募AI牛人成立X.AI搞大模型,马斯克要和OpenAI正面对抗了! 在ChatGPT发布之前,马斯克就曾表示OpenAI已经背离了其初衷,背弃了开源理念。G…

腾讯T9级.NET Core招聘又来了,月薪30k+

朝夕Net社区 2022-09-05 18:30 今年腾讯阿里裁员消息屡见不鲜,边裁边招才是真相,随着金九银十到来,腾讯T9级.NET Core招聘又来了,月薪30k,依然香!这里推荐个.NET跳槽交流群,有技术交流&#xff…

月薪10.8K,从销售客服转行软件测试斩获4份offer,所有的惊艳都来自长久的准备

时间不会辜负努力的人,不要质疑你的付出,每一次的努力都是在为自己铺路,所有看起来的幸运,都来自于内心的坚定。今天跟大家分享的是我的转行经历,希望所有人今天的努力,在未来都可以收获一个更好的自己。 斟…

这个高薪行业正在大量招人,你会考虑吗?

作者 | 侯淼淼 出品 | 《新程序员》 当人们提及“程序员”这一职业的时候,大多数人的第一想法往往是高薪。然而近年来,随着造车势力的兴起,新一轮的高薪岗位抢人大战正式打响。2021年以来,一汽、东风等传统车厂招聘岗位数量…

月薪10.8K|销售客服转行软件测试斩获4份offer,所有的惊艳都来自长久的准备

时间不会辜负努力的人,不要质疑你的付出,每一次的努力都是在为自己铺路,所有看起来的幸运,都来自于内心的坚定。今天跟大家分享的是近期就业的韩同学的转行经历,希望所有人今天的努力,在未来都可以收获一个…

杭州一公司开出20万月薪/320万年薪抢人!ChatGPT掀起AI热潮,AIGC人才被爆抢

5年工作经历,博士学位,最高月薪20万。 最近,位于杭州未来科技城一家公司,开出了最高320万年薪,招聘AIGC方向算法工程师一名。 ChatGPT在全球掀起了AI热潮,国内互联网大厂纷纷加入战局打造国内版ChatGPT。…

ChatGPT催生的高薪职业,竟然会是它?

ChatGPT 的兴起,催生了一个“与众不同”的新职业 —— prompt engineer (提示工程师)。主要职责是负责为 AI 聊天机器人生成的文本、图片、音频等内容添加关键词和提示,从而指导 AI 聊天机器人根据特定的目标和情境生成更符合用户…

企业高薪招人,近5成岗位月薪过万

据前瞻产业研究院发布的《中国网络游戏行业商业模式创新与投资机会分析报告》显示:2020年,我国网络游戏用户规模达到5.18亿人,市场规模达到2786.9亿元。此外,我国自主研发实力增强,自主研发游戏收入规模持续增长&#…

ChatGPT-5相比ChatGPT-4,将会有哪些变化?

ChatGPT-5 将会2023年12月发布。ChatGPT-5将会是跨时代的版本,将重新彻底引爆GPT。ChatGPT-5相比ChatGPT-4,将会有哪些变化? 最近我创建了一个知识星球,叫【ChatGPT前沿玩法圈】,会把把我玩ChatGPT的经验和总结&#x…

智能GPT结合苹果Siri等于孩子们的十万个为什么,未来已来

引言: 今天是6.1儿童节,我约了朋友,让小朋友们一起到公园玩耍。在玩耍的过程中,我的孩子和其他小朋友时不时地会提出各种问题和疑惑,比如:“为什么四叶草只有三片叶子?”、“为什么长颈鹿要吃骨…

面试碰壁如何力挽狂澜,有了这份Android指南你也可以有绿色通道!

简历怎样写才能过初步筛选?大厂面试到底要求什么,关注什么?技术面试如何展示自己的实力? 95% 的面试者都有这些疑问,所以今天,给大家分享一些面试准备的干货: 一、简历要有含金量 一份漂亮的…

记录一次锁的优化

项目背景 老规矩,先讲讲项目背景。可跳过。 小工具类的微系统。 我们会有一些文本语义描述的事件。譬如某小区两户人家因为宠物发生了争吵,比如某人拨打12345热线反映小区深夜还在跳广场舞等等。这些统称事件。 小学语文老师告诉我们描述事件的叙述文三要…

腾讯云 面试题汇总_1(第一套)

腾讯云暑期实习前端开发3.23 3.27总结完后 使劲背!把不会的题全总结一遍 坐在走廊上背完 1.自我介绍(稍稍被打断了一下问了项目中的一个问题) 2.问项目,引到为什么不在上一个公司继续做 3.问我硕士专业是干啥的,硕士学…

马斯克奇葩新规激怒用户,网友气炸狂喷,推特大宕机!

省时查报告-专业、及时、全面的行研报告库 省时查方案-专业、及时、全面的营销策划方案库 【免费下载】2023年5月份全网热门报告合集 普通人如何利用ChatGPT变现赚钱? 无需翻墙,无需注册,ChatGPT4直接使用 ChatGPT提词手册,学完工…

马斯克奇葩新规激怒用户!网友气炸狂喷,推特大宕机

杨净 明敏 发自 凹非寺 抑郁马斯克,又开始与网友们对线battle。随便社交网站一看,一眼望去be like: 马斯克终于杀死了Twitter! 前脚马斯克设立新规:不登录不给看。后脚推特直接被搞崩,直至现在还有用户登不…

未来3年,请善待你的工作

作者| Mr.K 编辑| Emma 来源| 技术领导力(ID:jishulingdaoli) “如果不是现在环境差,下家不好找,我早TM跟那个傻X老板翻桌子走人了,这破公司我真是一天都不想待…”这是一位粉丝朋友给K哥私信中的一段话。类似同款的话&#xff…

从GFS到GPT,AI Infra的激荡20年

导读 最近AIGC和LLM的浪潮层层迭起,大有把AI行业过去十年画的饼,一夜之间完全变现的势头。而AI Infra(构建AI所需的基础设施),也成了讨论的焦点之一。大众对AI Infra的关注点,往往放在AI算力上——比如A100…

用Python搭配OpenAI取得油管影片摘要

也许随着AI的持续发展,这个标题在未来真的可以实现,但并不是现在。 尽管ChatGPT的出现,让写程序的门槛大幅降低;但现在还是有不少ChatGPT无法解决,或是解决不好的问题。 这篇文章会用栗子让读者理解ChatGPT在写程序上…

灵遁者诗歌集《禅在禅中》序言篇:写诗激情已去

导读:我当然不能和ChatGPT比写诗歌,我不再渴望写诗歌了,激情褪去了。但《禅在禅中》我会坚持写完。 本文为灵遁者诗歌集《禅在禅中》序言篇: 我今天做了一个奇怪又真实的梦,大概是这样的,梦见有个小伙要跟…

【工作10年+的大厂资深架构师万字长文总结 精华收藏!】怎样设计高可用、高性能系统?关于高可用高性能系统架构和设计理论和经验总结...

本文从研发规范层面、应用服务层面、存储层面、产品层面、运维部署层面、异常应急层面这六大层面去剖析一个高可用的系统需要有哪些关键的设计和考虑. O、前言 随着业务在线化互联网化的高速发展,企业对核心业务系统的稳定性、可靠性、有效性、业务连续性等有了更高的要求。采…