Hugging Face 每周速递: 扩散模型课程完成中文翻译,有个据说可以教 ChatGPT 看图的模型开源了...

d6b28809c8faf75b06d517315a7bd97e.jpeg

每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等,我们将其称之为「Hugging News」。

产品更新

享用由 A100 GPU 强力支持的超快速机器学习推理

f8af8a6851f22c5695543e4ba7257ec3.jpeg

Hugging Face Spaces 现已支持使用 A100 GPU,用户享受超快速机器学习推理,自助开通的价格为每小时 4.13 美元,企业客户更可以享受更低的价格。此外,未来几个月,Spaces 还将提供更多用于机器学习的超酷硬件,如果您有特定的需求,可以给我们留言。

macOS 上的 Diffusers 应用现已发布 (而且还开源了)

dd54208883c44dce5d4f1c70e4500174.png

基于隐私保障设计,所有的图片都不联网而是在本地生成;可下载模型,这些模型都基于 CPU、GPU 和 Apple 的神经计算引擎 (ANE) 进行优化。

  • 应用商店地址:
    https://apps.apple.com/app/diffusers/id1666309574

  • 开源地址:
    https://github.com/huggingface/swift-coreml-diffusers

开源库更新

Transformers 大更新

f331e53c113e66af1d6598cef542c10e.png

Transformer 4.25 引入了 ImageProcessor,让用户能够利用更为强大的图像处理能力。同时,部分 API 也更加统一,参数配置项也改为使用 dict,更直观也更方便。

  • 示例地址:
    https://github.com/huggingface/transformers/tree/main/examples/pytorch/image-classification

提名道德意识良好的 Space 应用

4e0048562302d861956374a71fc5e86f.jpeg

机器学习技术在今天的社会中发挥着越来越重要的作用,可以应用于各种领域,包括医疗、金融、社交媒体、自动驾驶等。然而,这些技术的应用也可能带来许多潜在的伦理和道德问题,比如数据隐私、算法歧视、社会影响等。因此,有必要关注和鼓励那些采用了伦理意识的机器学习项目,以确保这些项目符合社会的伦理标准和价值观。

为了展示和鼓励更好的机器学习实践,我们正在请社区的成员们提交提名那些在这方面做的很好的 Space 应用,我们正在找寻如下相关的项目:

  • 🤝 征求同意: 有意识地征求相关方的同意,并尽可能提供透明度和选择权。

  • 🌎 可持续的: 考虑其对环境和社会的影响,并采取措施减少其负面影响。

  • 🗨️ 社会责任感: 考虑对社会的影响,并采取措施以最大程度地提高其社会价值。

  • 🧑‍🤝‍🧑 具有包容性: 确保多元、平等与包容,采取措施确保其对不同背景和群体的用户和利益相关者具有包容性。

  • ✍️ 严谨性: 采用严谨的方法和流程,以确保项目的质量和有效性。

  • 🤔 探索精神: 不断追求新的想法和解决方案,并持续优化和改进项目。

你可以在这里提名:
http://hf.co/spaces/society-ethics/featured-spaces-submissions

AI 与 AI 对抗赛

51b486b899aa0b8fe06386426dd7eab1.gif

🤗 我们正在举办首场 AI 对阵 AI 的虚拟足球赛,你可以将自己的模型提交到 Hugging Face Hub 中,然后与其他队伍的作品展开一张 2v2 的足球较量赛。

首场挑战赛由 MLAgents 团队基于 Unity 引擎提供,我们会基于大家的反馈举办更多精彩的比赛。

快来加入我们的课程,并与来自世界各地的同学们踢一场精彩的 AI 球赛吧!

  • 演示地址:
    https://hf.co/spaces/unity/ML-Agents-SoccerTwosA

  • Deep RL 课程地址:
    https://hf.co/deep-rl-course/unit7/introduction

🤗 Accelerate 0.16.0 发布

d89427889531dcc43c14fb2000142016.jpeg

在这个版本中,我们提供了一款交互式配置 🤗 Accelerate 的在线小工具,帮助你快速上手。同时,当你在训练中需要跳过前几个批次的数据时,DataLoaders 现在提供了函数来直接实现。此外,我们还提供了 release_memory 函数辅助释放 PyTorch 占用的内存,以及更灵活的 load_statesave_state API。

  • 交互式体验 🤗 Accelerate 文档链接:
    https://hf.co/docs/accelerate/usage_guides/explore

  • 详细更新内容:
    https://github.com/huggingface/accelerate/releases/tag/v0.16.0

🤗 Hugging Face Hub 更易用了

9596af184ef1698f28adc6b034f3e28b.jpeg

现在,我们在模型查找页面增加了一个库 (library) 筛选的标签,这样你就能更快找到跟自己感兴趣的库相关的各种模型了!

  • 模型页面地址:
    https://hf.co/models

Tune-A-Video: 一镜成片的文字转语音模型

ccad70423e3096a56f143e63eb880a6d.gif

我们在 🤗 Hugging Face Spaces 汇总了不少优秀的 Tune-A-Video 模型,帮你轻松实现「一句话,让模型给我拍个片」。

  • 🤗 Hugging Face Spaces 网址:
    https://hf.co/spaces/Tune-A-Video-library/Tune-A-Video-Training-UI

  • 演示项目地址:
    https://hf.co/Tune-A-Video-library/a-man-is-surfing

  • Tune-A-Video 库地址:
    https://hf.co/Tune-A-Video-library

学习资源 & 内容更新

扩散模型的最后一课已经发布!

1c42e7b6011fa7aea74b74cbc32490e4.jpeg

Hugging Face 扩散模型课程的第四单元: 深入研究扩散模型已经发布,这是本课程的最后一个单元,在这个单元中,我们将探讨最新研究中出现的扩散模型的许多改进和扩展。它将比以往的单元代码更少,旨在为您提供进一步研究的起点。

在此前的推文里,我们发布了本课程的第一单元的 第一部分 和 第二部分。我们很高兴地通知大家,我们的抱抱脸本地化小组已经完成了这个课程的全部内容!我们也即将在随后的推文中陆续发布,欢迎关注我们。

Hugging Face ❤️ 计算机视觉

6fef1b6f0f9b6b6dcfc20b5735abd1f7.png

只是因为在人群中多看了你一眼,我们在计算机视觉上的投入只是从 21 年的这个 PR 开始 (huggingface/transformers#10950)。

但自去年开始,我们开始投入大量的精力投入到计算机视觉上。现如今,Hugging Face Hub 上已经有 8 个核心的计算机视觉任务、3000 多个模型和 100 多个数据集了!

我们写了篇博客介绍这些内容,不过你可以等等,我们的本地化小组的译者 AIboy1993 已经完成了这篇博客的中文版,下周就发推送 (争取不鸽)!

  • 只是因为在人群中多看了你一眼 (PR 链接):
    https://github.com/huggingface/transformers/pull/10950

  • 博客文章: The State of Computer Vision at Hugging Face 🤗:
    https://hf.co/blog/cv_state

除此之外,还有一篇关于计算机视觉和语言预训练的研究进展的博客文章 A Dive into Vision-Language Models,也已由我们本地化小组的 Matrix 同学完成了本地化,下周也将推送给大家。

  • 博客文章: A Dive into Vision-Language Models:
    https://hf.co/blog/vision_language_pretraining

文字生成音频的 AudioLM 模型

c6994447393a0cf1fa0b2cde359798fc.jpeg

现在,你可以在 🤗 Hugging Face Spaces 上体验 AudioLM 模型用文字描述生成相应音效的能力了。你只需要提供足够详细的描述,然后提交给模型进行处理即可。快去体验专属于你的独家音效吧!

  • 🤗 Hugging Face Spaces:
    https://hf.co/spaces/haoheliu/audioldm-text-to-audio-generation

  • 项目仓库:
    https://github.com/haoheliu/AudioLDM

可视化三种模型输出的结果

f062d8155b2883ddc0c7b5edee513d83.png

我们为大家提供了一款比较 Stable Diffusion v1.4、v2 和 Dall-E 2 执行文字生成图片结果的工具。你可以选择一个职业,及相应的形容词,然后对比它们三者生成的图片。

  • 体验地址:
    https://hf.co/spaces/society-ethics/Average_diffusion_faces

看图对话的模型 BLIP-2 开源!

cc848e55715121ff8741ebea9ee2e50c.jpeg

据说这可能是一个可以教 ChatGPT 看懂图片的大语言模型,BLIP-2 由 Salesforce Research 团队发布,你可以给他一张图片,然后针对图片里的内容跟 AI 进行对话。小编看了一些报道提到说 BLIP-2 可以「教会」让 ChatGPT 学会看图,真的有这么神奇吗?

快来官方的 Space 应用上试玩,找找灵感吧 (或许下一个爆火的就是它呢),点击阅读原文直达:
https://hf.co/spaces/Salesforce/BLIP2
BLIP-2 开源地址:
https://github.com/salesforce/LAVIS/tree/main/projects/blip2

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/15090.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

chatgpt赋能python:Python抢票教程:快速抢到心仪的票

Python抢票教程:快速抢到心仪的票 随着互联网的飞速发展,越来越多人选择在网上购买演唱会、球赛、展览等门票,而这些热门票常常被秒杀一空,可怎么办呢?Python帮你解决这个问题! 什么是Python抢票 Python…

[ChatGPT] 邮箱正则表达式

/^[a-zA-Z0-9.!#$%&*/?^_{|}~-][a-zA-Z0-9](?:[a-zA-Z0-9-]{0,61}[a-zA-Z0-9])?(?:\.[a-zA-Z0-9](?:[a-zA-Z0-9-]{0,61}[a-zA-Z0-9])?)*$/

ChatExcel:ChatGPT后又一个有趣的应用!

文章目录 ChatExcel:ChatGPT后又一个有趣的应用!产品特点功能实测查询,更改数据归纳统计操控多个表格 更多可能的拓展应用 ChatExcel:ChatGPT后又一个有趣的应用! 自ChatBCG(一键生成PPT)&…

【转载】陆奇最新演讲全文实录:大模型带来的新范式(附下载文档)

《新范式 新时代 新机会》为主题的分享活动,陆奇博士以“新范式”为核心,分享了他对当前技术变革的观点,基于演讲整理了文字稿,也同步分享完整的PPT和视频,欢迎大家一起交流。 下载PDF文件: 《ChatGPT研究…

掌握 ChatGPT:在几分钟内构建您自己的计算器 Web 应用程序

结果展示 希望构建自定义计算器 Web 应用程序但不想花费数小时编写 HTML、CSS 和 JavaScript 代码?那你需要试试ChatGPT,OpenAI训练的语言模型。借助 ChatGPT,您可以自动为您的计算器网络应用程序生成完整的 HTML、CSS 和 JavaScript 代码&am…

FPGA嵌入式开发一些Xilinx SDK库函数的理解

最近在测试AXI Quad SPI这个IP核的端口时序,搭建BD后导出到硬件,在SDK中导入xspi_intr_example.c的源文件,在师兄的帮助下,浅浅研究了一下代码。 首先,需要修改源程序中的错误,参照CSDN文章:ZY…

Qt文本编辑器开发------纯代码实现

目录 前言 项目分析 项目效果 项目流程 1. 先设置好文本编辑框的大小与名称 2.创建输入处理框 3.创建菜单栏 4.创建菜单按钮下的动作按钮 5.创建与动作按钮对应的槽函数 6.附件功能的实现 7.槽函数的实现 7.1文件处理读取 7.2关闭文本编辑框 7.3保存文本编辑框 …

Pytorch从零开始实现Transformer (from scratch)

Pytorch从零开始实现Transformer 前言一、Transformer架构介绍1. Embedding2. Multi-Head AttentionQuery,Key,Value 3. Transformer BlockLayerNormFeed Forward 4. Decoder Block 二、Transformer代码实现0. 导入库1. Word Embedding2. Positional Enc…

一文入门BMS(电池管理系统)

1.前言 本文章是基于曾师兄的文稿《具有组网扩展功能的新能源汽车电池管理系统》而写的文章。该文章主要是对BMS(Battery Management System,电池管理系统)做一些简要的介绍,借此助各位也助我入门BMS。 有纰漏请指出&#xff0c…

Redis数据结构

字节青训营后端打卡笔记,主题结构参照文章,以及网络上其它很多的资料所记录下来的笔记。 Redis数据结构一览 SDS(Simple Dynamic String) C语言字符串的缺陷 获取字符串长度函数strlen()时间复杂度为O(N) 字符串以\0结尾,意味着字符串里的…

手抖把Python2.7卸载了,导致了自己的yum不可用以及yum因python版本无法使用的问题

摘要: 从标题就能看到我有多心如死灰了,简单介绍下我是如何自残的过程. ①首先因为需要部署爬虫程序,然后安装Python3. ②Python3系列和Python2系列版本不向下兼容,所以我就卸载了机器自带的Python2.7,删的干干净净. ③然后我下载了Python3.8的包. ④我开始使用yum命令安装…

LangChain+LLM大模型问答能力搭建与思考

1. 背景 最近,大模型(LLMs,Large Language Models)可谓是NLP领域,甚至整个科技领域最火热的技术了。凑巧的是,我本人恰好就是NLP算法工程师,面临着被LLMs浪潮淘汰的窘境,决定在焦虑…

给AI挖坑 | 实测New Bing能否回答员工那些刁钻的问题?

ChatGPT狂飙160天,世界已经不是之前的样子。 新建了人工智能中文站https://ai.weoknow.com 每天给大家更新可用的国内可用chatGPT资源 之前玩ChatGPT,发现这玩意很擅长胡说八道,比如你让它写一段发言稿,并引用鲁迅名言&#xff0…

如何用Rosetta全家桶设计一个抗体?

新冠肆虐无药可医, 医护冒险奋战在前线。 实验室里抗体设计, 试管里混合液波光粼粼, 分子结构、细胞实验频频。 日以继夜,孜孜不倦, 只为破解疫情的难题。 我们紧密团结,努力前行, 心中不灭的信…

【ChatGPT 】《ChatGPT 后续:我开发了一个超级阅读器,免费分享给大家》- 知识点目录

《ChatGPT 后续:我开发了一个超级阅读器,免费分享给大家》 00:00 我们开发了超级阅读器 01:37 思路和开发过程 03:00 使用方式 03:43 AI 工具加持开发效率 04:14 更多可能性 04:57 局限性 1. 介绍:PandaGPT 上传文献聊天窗口提问 2. DALL…

搭建正版GPT4.0!不用ChatGPT账号,不要API!

手把手教你免费搭建正版GPT4.0!不用ChatGPT账号,不要API! 项目简介 项目地址:https://github.com/ramonvc/freegpt-webui优点: 完全免费且不需要任何 API 密钥 ❌🔑 该项目的特点是使用G4F API 的WebUI …

他做了一个「ChatGPT 杀手」,a16z 抢着投

比「GPT 侦探」更重要的是,AI 生成内容在不同行业的「容忍度」。 图片来源:由无界版图AI工具生成 作者 | 美漪编辑 | 靖宇 最近两个月,科技圈最热的话题,无疑是 OpenAI 推出的对话式 AI 应用 ChatGPT,不仅可以让它给你…

巴比特 | 元宇宙每日必读:ChatGPT「代码解释器」正式解禁,它补齐了ChatGPT的哪些短板?用户该如何使用?...

摘要:7月9日,OpenAI 的聊天机器人 ChatGPT 推出了新功能:代码解释器(Code Interpreter)。这个新功能已经对所有 Plus 订阅用户开放,其扩展了 ChatGPT 的功能,为用户带来了更好的交互式编程体验和…

ChatGPT应用组队学习来了!

Datawhale学习 联合主办:Datawhale、百度文心 Datawhale联合百度文心,五月为大家带来AIGC应用专题:大模型从入门到应用,学习大纲如下(文末整理了这次学习的所有资料): 参与学习 ▶ 活动时间&am…

阿尔法狗咬向ChatGPT七寸

图片来源:由无界AI生成 瞄准ChatGPT,谷歌的下一枚炮弹已经准备好,只待发射。而担负起发射任务的,是谷歌DeepMind。 昨天,谷歌DeepMind的CEO德米斯哈萨比斯(Demis Hassabis)在采访中放出豪言&…