BigScience bloom模型

简介

项目叫 BigScience,

模型叫 BLOOM,

BLOOM 的英文全名代表着大科学、大型、开放科学、开源的多语言语言模型。

拥有 1760 亿个参数的模型.

BLOOM 是去年由 1000 多名志愿研究人员,学者 在一个名为“大科学 BigScience”的项目中创建的.

BLOOM 和今天其他可用大型语言模型存在的一个主要区别:该模型可以理解多达 46 种人类语言,包括法语、越南语、普通话、印度尼西亚语、加泰罗尼亚语、13 种印度语言(如印地语)和 20 种非洲语言。超过 30% 的训练数据是英文的。该模型还可以理解 13 种编程语言。

下载部署步奏

  1. 新建一个Anaconda conda 环境,然后安装 pytorch >1.3版本

  1. 下载模型

模型下载:https://huggingface.co/bigscience

打开以后 Models 模块就可以看到 它不同参数级别的模型 ,B代表英文简写亿 1B1,就代表模型的参数是1亿1千万.1B3好像丢失了下不了.

这里选择单击 bloom-1b1 模型,然后在单击 Files and versions ,下载所有文件,新建文件夹取名1b1,放里面.

加载本地模型,只要写上本地模型所在的目录

#分词

tokenizer = AutoTokenizer.from_pretrained('./1b1/')

#模型

model = AutoModelForCausalLM.from_pretrained('./1b1/')

3.运行代码,代码放到1b1父级目录

cmd调用模型代码

from transformers import AutoTokenizer, AutoModelForCausalLM
from transformers import pipeline
import torch#从https://huggingface.co/bigscience/bloom-1b1/tree/main
#下载所有文件,放到新创建的文件夹1b1
checkpoint = "./1b1/"
tokenizer = AutoTokenizer.from_pretrained(checkpoint)#分词
model = AutoModelForCausalLM.from_pretrained(checkpoint)#模型
#设置为gpu,推理更快
device = torch.device('cuda')
model.to(device)
#device=0表示使用第一个可用的GPU
generator = pipeline(task="text-generation", model=model, tokenizer=tokenizer, device=0)out = generator("你是谁?", max_length=30)
print(out[0]['generated_text']) #输出 "你是谁?我:她说"

因为1B1只是一个文本生成模型,你给一个短语,它接着生成.没有问答功能.而且中文生成效果也不好.

GUI调用代码

from transformers import AutoTokenizer, AutoModelForCausalLM
from transformers import pipeline
import tkinter as tk
import torchcheckpoint = "./1b1/"
#分词
tokenizer = AutoTokenizer.from_pretrained(checkpoint)
#模型
model = AutoModelForCausalLM.from_pretrained(checkpoint)
#设置为gpu,推理更快
device = torch.device('cuda')
model.to(device)
#device=0表示使用第一个可用的GPU
generator = pipeline(task="text-generation", model=model, tokenizer=tokenizer, device=0)def clean_string(s, substr): #substr=问题,s=回答s = s.replace(substr, '')lst = s.split(',')result_lst = list(set(lst))result_lst.sort()result = ','.join(result_lst) + ','return result# 创建主窗口
root = tk.Tk()
root.title("Bloom:1亿3千万参数版")
root.geometry("800x600+{}+{}".format(root.winfo_screenwidth() // 2 - 400, root.winfo_screenheight() // 2 - 350))# 创建输入框和滚动条
input_frame = tk.Frame(root)
input_label = tk.Label(input_frame, text="用户:")input_text = tk.Text(input_frame, height=10, width=87,padx=6, pady=6)
input_scrollbar = tk.Scrollbar(input_frame)input_text.config(yscrollcommand=input_scrollbar.set)
input_scrollbar.config(command=input_text.yview)
input_label.pack(side="left")
input_text.pack(side="left",pady=10)
input_scrollbar.pack(side="right", fill="y")
input_frame.pack()# 创建按钮
button_frame = tk.Frame(root)def show_text():#清空 Tkinter Text 组件中的文本output_text.delete('1.0', 'end')input_str = input_text.get("1.0", "end-1c")# 去掉最后一个换行符if input_str.endswith('\n'):input_str = input_str[:-1]out = generator(input_str, max_length=30)print(out[0])anwer = out[0]['generated_text'] #clean_string(out[0]['generated_text']) output_text.insert("end",anwer)button = tk.Button(button_frame, text="回答", command=show_text,width=6, height=3)
button.pack(pady=10)
button_frame.pack()# 创建输出框和滚动条
output_frame = tk.Frame(root)
output_label = tk.Label(output_frame, text="bloom:")
output_text = tk.Text(output_frame, height=26, width=87,padx=6, pady=6)
output_scrollbar = tk.Scrollbar(output_frame)
output_text.config(yscrollcommand=output_scrollbar.set)
output_scrollbar.config(command=output_text.yview)
output_label.pack(side="left",pady=10)
output_text.pack(side="left",pady=10)
output_scrollbar.pack(side="right", fill="y")
output_frame.pack()def copy():global texttext.event_generate("<<Copy>>")def cut():global texttext.event_generate("<<Cut>>")def paste():global texttext.event_generate("<<Paste>>")# 创建右键菜单
menu = tk.Menu(root, tearoff=0)
menu.add_command(label="复制", command=copy)
menu.add_command(label="剪切", command=cut)
menu.add_command(label="粘贴", command=paste)# 创建右键菜单2
menu2 = tk.Menu(root, tearoff=0)
menu2.add_command(label="复制", command=copy)# 绑定鼠标右键(第一个文本框)
def show_menu1(event):global texttext = input_textmenu.post(event.x_root, event.y_root)input_text.bind("<Button-3>", show_menu1)# 绑定鼠标右键(第二个文本框)
def show_menu2(event):global texttext = output_textmenu2.post(event.x_root, event.y_root)output_text.bind("<Button-3>", show_menu2)# 创建按钮
button_frame = tk.Frame(root)
button = tk.Button(button_frame, text="回答", command=show_text,width=6, height=3)
# 响应回车键 绑定 <Return> 事件
root.bind("<Return>", lambda event: show_text())root.lift()
# 运行主循环
root.mainloop()

生成300字效果

中英翻译 效果 不堪 ,诱导式

问答

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/14765.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

全新代码编辑器,集成ChatGPT4

给大家推荐一款全新的代码编辑器&#xff0c;集成ChatGPT4&#xff0c;自动编写代码&#xff0c;自动反编译&#xff0c;自动代码审计&#xff0c;主要是免费&#xff01; 官网地址&#xff1a; Cursor | Build Fast

军事医学研究院应晓敏组招聘博士后

军事医学研究院应晓敏组诚聘博士后 应晓敏研究员&#xff0c;1997年本科毕业于国防科技大学自动控制系&#xff0c;2003年毕业于国防科技大学计算机学院并获得博士学位&#xff0c;此后一直在军事医学科学院&#xff08;现军事医学研究院&#xff09;从事生物信息学研究工作。课…

如何高效学习和阅读源码?

作者&#xff1a;明明如月学长&#xff0c; CSDN 博客专家&#xff0c;蚂蚁集团高级 Java 工程师&#xff0c;《性能优化方法论》作者、《解锁大厂思维&#xff1a;剖析《阿里巴巴Java开发手册》》、《再学经典&#xff1a;《EffectiveJava》独家解析》专栏作者。热门文章推荐&…

lora:low-rank adaption of large language models

THUNLP 领读 ICLR 低秩微调大模型&#xff08;LoRA)【OpenBMB论文速读】第3期_哔哩哔哩_bilibili&#x1f4a1;用脑图&#xff01;⏰十分钟&#xff01;OpenBMB【论文速读】第3 期来了&#xff01;本期领读人是清华大学自然语言处理实验室的本科生&#xff0c;带大家高效读完一…

ChatGPT训练流程复现

本篇文章着重于chatGPT训练流程的复现 来自&#xff1a;无数据不智能 进NLP群—>加入NLP交流群 环境安装 虚拟环境创建 conda create -n chatgpt python3.10 conda activate chatgpt 依赖包安装 git clone https://github.com/LAION-AI/Open-Assistant.git cd Open-Assista…

【试用科研好物】GPT辅助科研神器?AI助力科研?ChatPDF、有道速读

前言 近期需要阅读的论文很多&#xff0c;偶然间在微博刷到许多人推荐科研利器ChatPDF和有道速读。使用后的结论是不推荐使用&#xff0c;下面分别给出理由。 使用&评价 网页版&#xff0c;无需安装任何东西&#xff0c;两款都支持中文。 ChatPDF有道速读 下面太长不看…

10分钟读完《富爸爸穷爸爸》,用ChatGPT速读100本致富经典

你好&#xff0c;我是赤辰。本栏目是每天借助ChatGPT速读1本商业书籍或致富经典&#xff0c;让大家以最短时间汲取到优质书籍中的精华内容和核心思想&#xff0c;本期要给大家解读是致富经典《富爸爸穷爸爸》。 本篇读书笔记全程由ChatGPT辅助阅读&#xff0c;并按照核心观点-…

用ChatGPT速读100本致富经典 |《贫穷的本质》且得出解决方案

你好&#xff0c;我是赤辰。本栏目是每天借助ChatGPT速读1本商业书籍或致富经典&#xff0c;让大家以最短时间汲取到优质书籍中的精华内容和核心思想&#xff0c;本期要给大家解读是《贫穷的本质》。 本篇读书笔记全程由ChatGPT辅助阅读&#xff0c;并按照核心观点-重要引述-结…

10分钟读完《刻意练习》,用ChatGPT速读100本致富经典

本篇读书笔记全程由ChatGPT辅助按照核心观点-重要引述-结论-行动建议来完成阅读&#xff0c;并输出笔记&#xff0c;通过用AI读完一本书只耗时20分钟&#xff0c;能生成约2000字笔记&#xff1b; 书名&#xff1a;《刻意练习》 作者&#xff1a;埃里克乔根森 出版日期&#x…

10分钟读完《原则》精华,用ChatGPT速读100本致富经典

你好&#xff0c;我是赤辰。本栏目是每天借助ChatGPT速读1本商业书籍或致富经典&#xff0c;让大家以最短时间汲取到优质书籍中的精华内容和核心思想&#xff0c;本期要给大家解读是黑石集团创始人瑞达利欧写的《原则》。 本篇读书笔记全程由ChatGPT辅助阅读&#xff0c;并按照…

ChatGPT之后,下一代大型语言模型在哪里?

OpenAI 首席执行官 Sam Altman&#xff08;左&#xff09;和 Meta AI 首席执行官 Yann LeCun&#xff08;右&#xff09;对未来有不同看法... 来源&#xff1a;学术头条 【编者按&#xff1a;ChatGPT的爆火&#xff0c;让大语言模型受到了人们的关注&#xff0c;然而这些来自不…

【MARK】搜索引擎汇总

1、除了Google&#xff0c;百度外的搜索引擎 基于笔点的自制导航页 https://www.bidianer.com/searchx 通用搜索引擎☞ Bing&#xff0c;微软必应&#xff0c;壁纸不错。 Ecosia&#xff0c;可以作为Bing搜索国际版。 F搜&#xff0c;据说是谷歌中文版&#xff0c;偶尔抽风…

借用百度翻译,用pyqt5 搞定pdf和word文档翻译,排版基本不变,免费好用

以下内容均来自微信公众号&#xff1a;万能搜吧&#xff0c;关注获取更多干货分享。 其实写软件测评写多了&#xff0c;就知道哪些需求是刚需&#xff0c;今天说的是文档翻译的需求&#xff0c;这种需求是比如将英文的PDF论文全部翻译成中文&#xff0c;而且最好排版不受影响。…

Chat Support Board WordPress聊天插件 v3.5.8

功能列表 支持和聊天功能 Slack聊天完全同步 - 直接从Slack发送和接收用户信息。 立即工作 - 只需插入短码&#xff0c;即可立即安装和使用。 丰富的信息 - Dialogflow机器人发送丰富的信息。 机器人--集成一个由API.AI驱动的多语言机器人。 电子邮件通知 - 当收到回复时&#…

成本降低90%,OpenAI正式开放ChαtGΡΤ

今天凌晨&#xff0c;OpenAI官方发布ChαtGΡΤ和Whisper的接囗&#xff0c;开发人员现在可以通过API使用最新的文本生成和语音转文本功能。OpenAI称&#xff1a;通过一系列系统级优化&#xff0c;自去年12月以来&#xff0c;ChαtGΡΤ的成本降低了90%&#xff1b;现在OpenAI用…

​乐视回应四天半工作制:体感非常好;OpenAI CEO 否认在训练 GPT-5;iOS 17 或增加更多灵动岛功能|极客头条...

「极客头条」—— 技术人员的新闻圈&#xff01; CSDN 的读者朋友们早上好哇&#xff0c;「极客头条」来啦&#xff0c;快来看今天都有哪些值得我们技术人关注的重要新闻吧。 整理 | 梦依丹 出品 | CSDN&#xff08;ID&#xff1a;CSDNnews&#xff09; 一分钟速览新闻点&#…

WAIC 2023 | 拥抱大模型,助力无障碍,小米展望AI新业态

“智联世界&#xff0c;生成未来”&#xff0c;7月6日至8日&#xff0c;第六届世界人工智能大会&#xff08;WAIC 2023&#xff09;在上海举办。4位图灵奖得主与80多位国内外院士等1400位嘉宾齐聚一堂&#xff0c;共同探讨人工智能赋能产业发展的全新变化&#xff0c;展望技术新…

掘金AIGC时代,开发者更需要什么样的大模型?

当前&#xff0c;火热的AI大模型领域需要一些冷思考。 自去年年底ChatGPT掀起一轮AIGC热潮以来&#xff0c;国内科技企业扎堆发布大模型和类ChatGPT产品。截止2023年4月&#xff0c;已公开宣布发布或即将发布AI大模型的企业达数十家。多模态大模型的能力不断迭代&#xff0c;市…

智算领域惊现AI大变局,ChatGPT催生行业大洗牌

ChatGPT席卷而来&#xff0c; GPU需求过猛引发缺货涨价潮 【全球云观察 &#xff5c; 热点关注】百度已不是中国第一大桌面搜索引擎&#xff0c;这个消息来自美国数据研究机构Statcounter公布的最新统计数据分析结果。 2023年4月&#xff0c;微软旗下搜索引擎必应&#xff08…