ChatGLM-6B的P-Tuning微调详细步骤及结果验证

文章目录

    • 1. ChatGLM-6B
      • 1.1 P-Tuning v2简介
    • 2. 运行环境
      • 2.1 项目准备
    • 3.数据准备
    • 4.使用P-Tuning v2对ChatGLM-6B微调
    • 5. 模型评估
    • 6. 利用微调后的模型进行验证
      • 6.1 微调后的模型
      • 6.2 原始ChatGLM-6B模型
      • 6.3 结果对比

1. ChatGLM-6B

ChatGLM-6B仓库地址:https://github.com/THUDM/ChatGLM-6B

ChatGLM-6B/P-Tuning仓库地址:https://github.com/THUDM/ChatGLM-6B/tree/main/ptuning

1.1 P-Tuning v2简介

P-Tuning是一种较新的模型微调方法,它采用了参数剪枝的技术,可以将微调的参数量减少到原来的0.1%。具体来说,P-Tuning v2是基于P-Tuning v1的升级版,主要的改进在于采用了更加高效的剪枝方法,可以进一步减少模型微调的参数量。

P-Tuning v2的原理是通过对已训练好的大型语言模型进行参数剪枝,得到一个更加小巧、效率更高的轻量级模型。具体地,P-Tuning v2首先使用一种自适应的剪枝策略,对大型语言模型中的参数进行裁剪,去除其中不必要的冗余参数。然后,对于被剪枝的参数,P-Tuning v2使用了一种特殊的压缩方法,能够更加有效地压缩参数大小,并显著减少模型微调的总参数量。

总的来说,P-Tuning v2的核心思想是让模型变得更加轻便、更加高效,同时尽可能地保持模型的性能不受影响。这不仅可以加快模型的训练和推理速度,还可以减少模型在使用过程中的内存和计算资源消耗,让模型更适用于各种实际应用场景中。

2. 运行环境

本项目租借autoDL GPU机器,具体配置如下:

在这里插入图片描述

在这里插入图片描述

2.1 项目准备

1.创建conda环境

conda create -n tuning-chatglm python=3.8
conda activate tuning-chatglm

2.拉取ChatGLM-6B项目代码

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/12528.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

源码中常见的 where 1=1 是一种高级优化技巧?

你是否曾在 SELECT 查询中看到过 WHERE 11 条件。我在许多不同的查询和许多 SQL 引擎中都有看过。这条件显然意味着 WHERE TRUE,所以它只是返回与没有 WHERE 子句时相同的查询结果。此外,由于查询优化器几乎肯定会删除它,因此对查询执行时间没…

启动您的 MySQL 查询:ChatGPT 如何帮助您检索 MySQL 数据

本文涉及到的相关软件,dbForge Studio for MySQL和ChatGPT,在您尝操作前,请务必先确保两个程序都正常运作哦,废话不多说,开始上干货! Devart 提供包括Oracle、SQL Server、MySQL、PostgreSQL、InterBase以及Firebird在…

ChatGPT与深度学习的完美融合:打造智能化推荐系统新时代

PNN | AutoRec | 推荐算法 NFM | ChatGPT | 深度学习 新技术如ChatGPT、LLM、AIGC等的兴起,使推荐系统拥有更强的学习和预测能力。然而,推荐算法仍然是深度学习推荐系统中不可或缺的关键技术。推荐算法和这些技术应相辅相成,相互补充。推荐…

为什么有些 985 的本科学生即使在大学里混得很水,在找工作时学历却那么管用?...

大家好,我是老赵 最近网上有个话题比较有争议:「为什么有些 985、211 的本科学生即使在大学里混得很水,在找工作时学历却那么管用?」考上了重点大学,就真的能够高枕无忧了吗?让我们一起来了解一下吧。 我做…

如何使用租用的云服务器实现神经网络训练过程(超详细教程,新手小白适用)

超级感谢up主7_xun的B站教学视频:适合深度学习小白的CV实战——在AutoDL上租用云服务器跑YOLOv5的全过程 链接:https://www.bilibili.com/video/BV1jA4y1o7Ph/?spm_id_from333.1007.top_right_bar_window_history.content.click&vd_sourcee482aea0f…

FBEC大会 | 全球元宇宙CEO峰会演讲干货汇总

2023年2月24日,由广东省游戏产业协会、深圳市互联网文化市场协会指导,陀螺科技主办的FBEC未来商业生态链接大会,在深圳福田大中华喜来登酒店6楼宴会厅盛大召开! FBEC大会以“勇毅前行逐光而上”为主题,以具有行业前瞻洞…

GPT-4老板称害怕ChatGPT/ 李彦宏:文心一言符合预期/ 马斯克欠账不还…今日更多新鲜事在此...

日报君 发自 凹非寺量子位 | 公众号 QbitAI 大家好,今天是3月20日星期一,又是元气满满的一周。 经历了上一周GPT-4带来的疯狂,科技圈又发生了哪些新鲜事,一起来和日报君看看~ 李彦宏回应外界对文心一言反馈 这两天&…

芯片架构标准首次由中国企业牵头/ 周鸿祎建议大学生做AI训练师/ 港科大不禁ChatGPT…今日更多新鲜事在此...

日报君 发自 凹非寺量子位 | 公众号 QbitAI 工作日最后一天,明天就能尽情嗨皮了~ 今天科技圈都有哪些大事,一起来和日报君康康吧。 周鸿祎称大学生可做人工智能训练师 训练AI,在数据知识标注方面还有所欠缺? 周鸿祎直接…

ChatGPT吸走谷歌人才,谷歌云CEO:AI新游戏刚开场,莫慌

鱼羊 发自 凹非寺量子位 | 公众号 QbitAI ChatGPT搜索被微软抢先一步,内部AI人才又被OpenAI频繁挖角。 最近的谷歌,着实有些内忧外患。 最新曝出的信息是,谷歌的高管们,正在努力安抚员工们不安的情绪。 据Insider消息,…

寻找中国版ChatGPT,量子位邀你共同参与中国AIGC产业峰会

组委会 发自 凹非寺量子位 | 公众号 QbitAI ChatGPT一声枪响,AIGC直接起飞,晋升科技圈最热话题。 问题和争论随之而来: 谁能做出中国版ChatGPT? AIGC是概念炒作,还是真正的「互联网诞生时刻」? …… 机遇与…

总价61亿,“ChatGPT之父”即将收获一个核能公司IPO|钛媒体焦点

OpenAI CEO奥特曼(Sam Altman) ▎“20世纪是碳基能源的世纪。我相信22世纪将是原子能(核能)的世纪”,OpenAI CEO奥特曼表示。 作者|林志佳 编辑|李小年 本文首发于钛媒体APP “ChatGPT之父”、O…

ChatGPT之父:OpenAI不会很快上市 因为会限制我的决策权

雷递网 乐天 6月7日 随着ChatGPT的走红,人工智能企业OpenAI及ChatGPT之父、CEO Sam Altman也炙手可热,公司何时上市,也成为外界关注点。 据外媒披露,Sam Altman参加一场活动时表示,OpenAI不会很快走向资本市场&#xf…

ChatGPT之父提新版摩尔定律!宇宙智能数量每18个月翻一番

来源:新智元 本文约2200字,建议阅读5分钟ChatGPT之父Sam Altman提出了新版摩尔定律,即宇宙中的智能数量每18个月翻一番。 [ 导读 ] 一直以来,半导体行业有自己的摩尔定律。近期,ChatGPT之父Sam Altman提出了新版摩尔定…

【思考】ChatGPT之父:被误解的力量 The Strength of Being Misunderstood

The Strength of Being Misunderstood 被误解的力量 A founder recently asked me how to stop caring what other people think. I didn’t have an answer, and after reflecting on it more, I think its the wrong question. 一位创始人最近问我如何停止关心别人的想法。我…

“ChatGPT之父”呼吁监管ChatGPT

当地时间5月16日,美国国会参议院举行一场名为“AI监管:人工智能的规则”的听证会。有“ChatGPT之父”之称的美国人工智能技术公司OpenAI首席执行官山姆阿尔特曼首次出席美国国会听证会。 出乎一些美国议员的意料,阿尔特曼呼吁立法者监管ChatG…

Face-recognition实现人脸识别

文章目录 1.前置知识点(1)Opencv中矩形,绘制文本(2)Opencv中基础的知识点(3)face_recognition.face_locations(img1ToRGB)(4)face_recognition.face_encodings(img1ToRGB…

人脸检测之CenterFace

论文:CenterFace: Joint Face Detection and Alignment Using Face as Point Github:https://github.com/Star-Clouds/CenterFace 论文基于centerNet进行改进,提出了anchor free形式的人脸检测框架,可以同时实现人脸检测关键点检…

chatgpt赋能python:Python人脸识别:从入门到工程实践

Python人脸识别:从入门到工程实践 介绍 近年来,人脸识别技术越来越成熟,广泛应用于各行各业,如社交媒体、安防、金融等领域。Python人脸识别作为一种基于机器学习的技术,可以通过训练模型从图像中自动识别出人脸,并进…

chatgpt赋能python:Python人脸身份识别:提高安全性和效率的先进技术

Python人脸身份识别:提高安全性和效率的先进技术 随着科技的发展,人类对于安全性和效率的需求逐渐增加。而人脸身份识别技术正是一个能够满足这一需求的先进技术。在过去的几年中,这种技术已经逐渐发展成为一种普及的安全措施,这…

人脸识别之特征脸方法(Eigenface)

人脸识别之特征脸方法(Eigenface) zouxy09qq.com http://blog.csdn.net/zouxy09 因为需要,花了一点时间写了下经典的基于特征脸(EigenFace)的人脸识别方法的Matlab代码。这里仅把该代码分享出来。其实,在…