今晚 12:30 RLHF: From Zero to ChatGPT 直播活动

9170cbb83433a5c960b4fc1b2da6aa19.jpeg

本次演讲,我们将介绍一种称之为从人类反馈中强化学习 (RLHF, Reinforcement Learning from Human Feedback) 的基础知识,以及如何使用 RLHF 驱动实现 ChatGPT 这样的工具。我们将为大家介绍相关联的机器学习模型,涵盖自然语言处理 (NLP) 和强化学习,以带领读者了解如何在大型语言模型上使用 RLHF。我们也欢迎你在 YouTube 直播间向我们提出任何关于 RLHF 相关的问题。

演讲嘉宾

Nathan Lambert 是一名在 Hugging Face 工作的研究科学家,他获得了加州大学伯克利分校的博士学位,研究机器学习和机器人的交叉领域。他的导师是 Berkeley Autonomous Microsystems Lab 的 Kristofer Pister 教授和 Meta AI Research 的 Roberto Calandra,并于博士期间在 Meta AI 和 DeepMind 团队实习。Nathan 曾获得加州大学伯克利分校电子工程与计算机科学系的 Demetri Angelakos 利他主义纪念成就奖,以表彰他为改善社区规范所作的努力。

直播时间

2022 年 12 月 14 日 凌晨 0:30 (今晚),时长预期不会超过 1 个小时

参与直播

条件允许的情况下,我们 强烈建议 你直接到全球社区参与:
https://www.youtube.com/watch?v=2MBJOuVq380

活动转播

哔哩哔哩平台:
https://live.bilibili.com/26543157

微信视频号平台活动预告:

活动转播免责声明

我们会尽最大努力为社区成员们提供良好的转播体验,同时请参会者务必谅解,如果发生任何问题导致活动转播取消或无法进行,我们将不另行发文通知。请到上方的 YouTube 链接直接参与,会后我们会在一周内上传回放录像,敬请关注。

你也可以分享我们的活动海报到朋友圈帮助我们宣传:

交流 / 等回放群

群聊免责声明

  • 请只讨论与群聊主题相关的内容,勿讨论任何违反法律和 Hugging Face 社区规定的内容

  • 我们会非常积极的清理发送垃圾信息和违规内容的群成员,如果您认为自己被误伤,请向群主和管理员提出异议

  • 请勿在群内无故批量添加好友,一经发现,我们将永久禁止你参与任何我们的活动,如果你发现自己的隐私被侵犯,请直接拨打 110 报警

  • 本次活动完成之后,本群主题将变为深度强化学习课程讨论

  • 如果群满,请加小助手 chenglu169 拉你进群,备注 HF 1214 活动


参加 Hugging Face 深度强化学习课程

6094dd1eeae0176af798d537b42463ef.jpeg

我们在公众号成立的 首推文章 里介绍过,12 月 5 日我们将开启一个完全免费的在线课程:深度强化学习课程 v2.0,这个课程由 8 个单元组成,每单元都有理论、实践和挑战部分,学员们可以通过这个课程研究深度强化学习,以及在 SnowballFight, Huggy the Doggo 🐶, MineRL (Minecraft ⛏️), VizDoom (Doom) 和经典环境 (如 Space Invaders 和 PyBullet) 中训练 Agents。如果完成并通过了 80% 的作业,还可以获得课程证书。

这个课程的第一单元已经发布,其他单元的内容正在持续更新中,未来也将加入更多从人类反馈中强化学习 (RLHF) 的内容,我们也录制了一个针对本课程的介绍,请关注今日推送的次条查看视频。

  • 注册课程:
    http://eepurl.com/ic5ZUD

  • 课程大纲:
    https://simoninithomas.github.io/deep-rl-course/

  • 第一单元内容:
    https://hf.co/deep-rl-course/unit1/introduction


感谢社区成员「茶叶蛋蛋」为本次活动设计的的各种图像资源!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/18825.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2-24财财的财经早报!

早评0224:震荡依旧 【市场判断】 外围方面,美股三大指数收涨,道指涨0.33%,纳指涨0.72%,标普涨0.53%。消息面上,美联储官员在会议纪要中重申了其强硬的立场——与会者都同意在通胀得到实质控制之前继续加息步伐。芝商所…

一个90后关于ZG足球的思考【卡塔尔世界杯】

前言 一个月的时间过得还是非常快的,卡塔尔世界杯马上也要迎来半决赛和决赛。自己一直想动手写写自己关于足球的思考,特别是ZG足球,说得再准确一点,就是ZG男足。 正文 第一次认识足球运动 作为一名90后,自己开始认…

数据可视化之中国足球队在国际足联及亚洲的历史排名看这儿

最近最热的体育盛事莫过于世界杯了,四年一届的足球盛事,正在卡塔尔激战正酣。这时候可能会有球迷疑问:怎么没看到中国队呢?也有网友调侃说中国队被分到工程队去了。 泱泱大国,难道中国十几亿人口,一个足球队…

【花雕学AI】我们如何才能避免被ChatGPT替代?——一个跨学科的视角

ChatGPT是一个由OpenAI开发的AI文本工具,它可以理解和生成自然语言,从而与用户进行对话。ChatGPT是基于GPT-3或者GPT-4模型的,这是目前最大和最先进的语言模型之一。ChatGPT通过在大量的互联网文本数据上进行预训练和强化学习,学习…

开箱即用,ChatGPT 复现方案开源

点击上方“Java基基”,选择“设为星标” 做积极的人,而不是积极废人! 每天 14:00 更新文章,每天掉亿点点头发... 源码精品专栏 原创 | Java 2021 超神之路,很肝~中文详细注释的开源项目RPC 框架 Dubbo 源码解析网络应…

【ChatGPT】ColossalChat:目前最接近 ChatGPT 原始技术方案的实用开源项目——以 LLaMA 为基础预训练模型,推出 ColossalChat

ColossalChat:Making large AI models cheaper, faster and more accessible www.colossalai.org GitHub - hpcaitech/ColossalAI: Making large AI models cheaper, faster and more accessible 目录 Col

【hadoop】完全分布式集群部署

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言一、准备好三台虚拟机1.创建虚拟机2.配置网卡3.配置JDK和HADOOP4.修改主机名 二、修改ip、映射1.修改ip2.修改映射 三、设置免密登录四、关闭防火墙五、配置had…

体验本地部署AI绘画程序

目录 前言 一、AI绘画是什么? 二、Stable Diffusion简介 二、部署步骤 1.克隆代码 2.部署环境 3. 安装 4 一些错误提示的排除 总结 前言 随着人工智能的不断发展,尤其是chatGPT的成熟,AI绘画也获得了热捧,甚至AI画的太空歌…

chatgpt赋能python:Python单机游戏:让你爱不释手的趣味游戏

Python单机游戏:让你爱不释手的趣味游戏 在当今数码化的世界中,单机游戏越来越受欢迎。作为一名有10年Python编程经验的工程师,我想向大家介绍Python单机游戏,这是一种让你爱不释手的趣味游戏。 什么是Python单机游戏&#xff1…

生成式语言大模型压缩技术思考——以ChatGPT为例

ChatGPT引领了生成式语言大模型的应用与技术热潮,首先简单回顾ChatGPT应用范式:将其应用于指定的下游任务时(如知识问答、翻译、编码),ChatGPT需要经历三个阶段的训练(增强人类语境的猜想)&…

我,一名记者,面对ChatGPT慌得一比

出品|网易科技《智见焦点》 作者|赵芙瑶 编辑|丁广胜 人工智能诞生初期,由于技术的不成熟经常被戏谑为“人工智障”,当AI刚刚涉及内容创作领域时,人们也总有“机器缺乏情感”、“语言过于生硬”的刻板印象。…

我(程序大学生)与AI

我与AI的接触历程及感想 首次接触AI 2022年下半年,我开始自学板绘,没过多久,AI绘画横空出世,引起大量关注。在自学板绘的过程中,我逐渐了解到,学习绘画是一件以年为单位的事,有太多知识需要学…

大学生对AI的看法调查

大学生对AI的看法调查 (❗主要是对2022届大学生的小范围不全面调查❗) AI时代到来,大学生如何看待AI,如何看待AI应用领域大幅扩展后的未来? 对此我非常好奇,于是我自发开展了一次主要围绕本院&#xff08…

谈谈我对ai发展的看法

最近难得有时间,通过白话,聊聊我对AI的看法,仅代表个人观点 首先表明我的观点:人类当前的人工智能成果,仍然停留在一知半解程度。技术的发展是需要长期的积累和进步,目前AI的发展仍处于入门阶段 人类的发展…

GPT-4震撼发布,谁能革了ChatGPT的命?

今晨,OpenAI 发布了多模态预训练大模 GPT-4,OpenAI 老板 Sam Altman 直接开门见山地介绍说:“这是我们迄今为止功能最强大的模型!” GTP-4 是目前为止世界第一款高体验、强性能的先进 AI 系统。根据 OpenAI 官方的介绍&#xff0c…

【技术分享】斐讯N1盒子打造智能家居平台

智能家居的概念越来越普及,作为年轻人,尤其是对电子技术爱好者、从业者来说,更加对智能家居控制感兴趣。 斐讯就不用多说了,5-6年前可谓风光无限,无数人“入坑”,我也是其中入局者中的一员,目前…

AIGC接下来的研究思路 生成式AI投资研究框架

AIGC接下来的研究思路 | AIGC 原创 科技周竖人 科技周竖人 2023-04-26 23:22 发表于上海 文 | 科技周竖人 欢迎关注同名公众号获取更详细内容 写在前面:AIGC全称生成式AI(AI Generated Content),与传统AI最大的区别体现在其强大…

搜索趋势:微软必应新版集成AI和实时搜索

微软必应的新版已经集成了AI和实时搜索了,而且已经加入基于ChatGPT聊天的搜索功能,新必应上线48小时申请数破百万人申请加入了。大家可以先看看,下文有访问地址。 微软的新版搜索工具必应推出近一周,陆续有用户通过内测申请。与Ch…

年底量产交付 图森未来的生死一搏!

‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 2023年3月28日,全球自动驾驶科技公司图森未来(Nasdaq: TSP)正式发布基于英伟达DRIVE Orin SoC芯片设计开发的域控制器产品(TDC - TuSimple Domain Controller)。 来…