清华出品的ChatGLM-6B自开源那刻起,GLM系列的每一次更新都受到了业界的热切关注。尤其是ChatGLM第3代开源之后,其强大和适配性让很多人惊叹,之后大家对GLM的第4代模型充满了期待。终于,今天它来了!我要为大家介绍的是这一系列中最新的巨星——GLM-4-9B,并且直接为大家制作了一款GLM-4“超大杯”懒人包!(最近AI绘图又超神了,分享以下美图养眼)
ChatGLM-4简介
GLM技术团队为了让小模型(10B以下)展现出更强大的实力,进行了长达半年的探索和研发。他们不仅引入了大语言模型进入数据筛选流程,进行了高达10T的高质量多语言数据训练,数据量是ChatGLM3-6B模型的三倍以上,还采用了FP8技术进行高效的预训练,训练效率提高了惊人的3.5倍。在有限显存的情况下,技术团队通过持续的探索,最终将模型规模提升至9B,并将预训练计算量增加了5倍。
GLM-4-9B模型的推理性能、上下文处理能力得到了大幅强化,支持多语言、多模态和All Tools等多种能力。此外,GLM-4-9B系列还包括了基础版本、对话版本、超长上下文版本以及多模态版本,满足不同场景的需求。以下是GLM-4-9B的能力掠影:
我们再来具体看看GLM-4-9B的特点:
①性能方面:GLM-4-9B在中英文综合性能上相比前代提升了40%,尤其是在中文对齐能力、指令遵从和工程代码方面都有显著进步。
②在长文本能力上,GLM-4-9B模型的上下文处理能力从128K扩展到了1M token,可以同时处理高达200万字的输入,相当于两本《红楼梦》的长度!
③多语言能力:GLM-4-9B支持包括汉语、英语等26种语言,并将tokenizer的词表大小从65k扩充到了150k,编码效率提高了30%,部分能力表现甚至与GPT-4不相上下!
④All Tools能力:最引人注目的是,GLM-4-9B还整合了All Tools能力,能够智能调用网页浏览器、代码解释器等外部工具来辅助完成复杂的任务。多模态能力也得到了提升,新推出的GLM-4V-9B能够处理高达1120 x 1120分辨率的输入,这在降低计算和部署开销的同时,还保持了出色的文本和图像处理能力。
免费离线懒人包来了
为了让大家能够更方便地体验这一神奇的技术,我又出手了.jpg(
),特地为大家准备了一个离线整合包。而且,这次制作的是GLM-4“超大杯”支持上下文1M版本的懒人包,理论上支持同时处理高达200万字的输入,强无敌!这个懒人包操作非常简单,下载到本地后解压并双击“一键启动”。
系统会自动运行并打开一个已经完全汉化的用户友好界面,使用步骤也非常简单:
1. 输入提示词:在用户界面的文本框中输入你想要问的问题
2. 生成内容:点击“提交”按钮,稍等片刻,等待大模型生成答案。
以下是我亲测的结果,我先问了个比较刁钻的问题:我的蓝牙耳机坏了,我该去看牙科还是耳鼻喉科?
GLM-4-9B很快给出了结果,答案还是很靠谱的,回答如下:
如果你的蓝牙耳机出现了故障,首先需要检查耳机本身的问题,比如电池、连接线、控制按钮等是否损坏或者接触不良。如果耳机本身没有问题,但无法与手机或其他设备正常连接,可能需要联系耳机的制造商或销售商家寻求帮助。
然而,如果你的蓝牙耳机故障导致了耳朵疼痛或其他不适,或者你怀疑自己可能出现了听力问题,那么应该去耳鼻喉科就诊。耳鼻喉科医生可以帮你检查耳朵的健康状况,并提供相应的治疗建议。
如果你的症状严重或持续不改善,建议尽快就医,避免忽视潜在的的耳朵或听力问题。
我继续问一个检测大模型的标配问题:介绍一下鲁迅和周树人。以下是答案,看起来GLM-4-9B的确不是人工智障哈哈。
这一全新的GLM-4-9B模型不仅在性能上有了质的飞跃,也在使用便捷性上做了大量的优化。如果你对AI大语言模型感兴趣,不妨尝试一下这款强大的工具,相信它会给你带来不小的惊喜。
注意事项
①建议使用配有至少8GB显存的英伟达显卡,以获得最佳体验。
②确保安装路径不包含中文字符,以避免可能的兼容问题。
今天就聊到这了,我是Glen,感谢你看我的内容,欢迎大家继续支持我,请点赞、收藏、分享三连走一波吧~
关注公众号Glen,私信回复【GLM-4】,免费获得本文资源~