魔改GPT自动写网文,速度一秒十字,还能给太监作品无限续更 | 开源

博雯 发自 凹非寺
量子位 报道 | 公众号 QbitAI

如果一个人只看网文,那会写出来怎样的文字?

看了100G网文后,这个AI模型帮你试了一下。

先来一段自由创作:

6492d087dca2516025b905350734b223.gif

乍眼看去很有内味,而且基本是一秒十字甚至更快的生成速度,非常的amazing。

那再放一段经典网文故事高潮前的内容,让AI作家帮忙续一下?

dd9ee897f708c53d8cab0043627551e2.gif

‍‍呃……不是“三十年河东,三十年河西,莫欺少年穷”,没内味儿啊!

这就是开发者亲切地称之为“人工智障写作”,由GPT魔改而成的模型AI-Writer

ebbc3019cfd33aa8595492e451c1a8c6.png

一秒十字,无限续写

这一模型拥有100M参数量,基于100G网络小说训练,没有采用任何其他素材。

因此,AI-Writer相当于是一位“只看网络小说”的创作者,不具备任何网文以外的常识,行文风格自然也就比较小白。

但好在阅书无数,一句同样的开头:

6f13c4d04743337be333ee941de2479a.png

就能生成风格迥异,走向不同的多个片段:

1ba367715d36304a5b242f4098d031f8.gif

也可以自定义每次的生成字数,像上面就是每次生成200字。

9949e616bdf84419d66c54bb05309b51.png

理论上可以无限生成文字,但时间长了也会陷入“不断重复某字或某片段”的循环之中。

生成文字速度受加速方式的影响,目前支持N卡、A卡、I卡、GPU加速,可以选择最适合自己设备的方式:

bbef0f89f8f69eb6e4eeb3ac30f46547.png

像开头展示的那段动图,生成速度甚至不止一秒十字,就是通过GPU加速的效果。

如果你觉得AI写的有点太过放飞自我,也可以设置生成文字的随机程度

8a0fab1b3d82dde13a7ba781c8ef9d9a.png

要解释这里的文字生成随机性,就要说到AI-Writer所采用的一种特殊的采样方法:

  • 对于段落开头

将Top-P设置为0.995,几乎完全按照输出的概率分布采样,增强行文变化

  • 对于其他位置

先找到最高概率的字的概率P,然后移除所有概率小于 0.02×P2的字

这样,模型生成的每一个字都是一个概率分布,因此,上面的文字生成的随机程度,也就是文字生成时忽略小概率字的程度。

可以对比一下该值分别为0.01,0.1,0.9时的生成效果:

cf3816396b7f59b786e2ae84a442e474.png

当然,由于这是个只有100M参数的小模型,所以逻辑和阅读理解能力是较低的。

用开发者的话来说,就是“它是个纯智障,纯属娱乐”。

模型可直接试玩

不过,就算本着娱乐的目的,我们也来看看怎么做才让这个AI作者动笔。

在环境配置上,开发者表示,如果采用他通过C+AVX2写的纯CPU版本,就不需要Python和Pytorch,只要是2014年以后的CPU都能成功运行。

(作者已将这一版本上传至交流群)

而上述演示的动图则是在Python3.8和Pytorch1.10的环境配置下的Demo。

在环境配置完毕后,下载模型和Release文件,在模型文件中新建一个model文件夹,并将release文件解压放在model目录下。

这时你就可以运行python run.py,在终端快速生成文字:

(这里可以先安装一下DeepLearning环境)

13170d7d49b89b34d5949be009e432b0.gif

文字可以一直自由生成下去,可以通过Ctrl+C来停止。

当然,由于这里是在2.3 GHz 双核Intel Core i5的Mac本上跑的,所以并没有达到10字/秒的生成速度。

也可以在网页中进行试玩,运行python server.py,并打开下载模型web-client文件夹中的index.html。

80b2796935278826229e17cf1b66c4be.gif

然后就可以打开网页,直接在对话框中输入开头,点击按钮进行续写了:

194a2b8bfd487cc835162fc058d2e9cf.gif

现在这个网页版已经初具模型,开发者希望能有更多的人参与进来,一起将现阶段的这个“人工智障”改进成对于创作者而言的实用工具,以及对于读者而言的娱乐方式。

下载链接:
https://github.com/BlinkDL/AI-Writer/releases

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/33626.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

外星生命或智能摆在面前,你能认出来吗?——“梯径”提供的思路

导语 外星生命一定长得像人类吗?最近和你火热聊天的 ChatGPT 有智能和意识吗?当外星智慧生命出现在眼前,即使它们不是我们熟悉的样子,我们能识别出来吗?是否可以用严格的数学形式来定量描述生命和智能的复杂度&#xf…

ai智能混剪批量剪辑软件开发工具|批量视频剪辑开发分享

AI智能批量剪辑系统研发主要涉及以下技术: 1. 视频处理技术:包括视频压缩、格式转换、去水印、稳定性处理等。 2. 视频剪辑技术:包括时间轴编辑、音视频素材分离、剪辑片段拼接等。 3. AI算法技术:包括图像识别、语音识别、自然…

竞彩足球分析小工具

18年世界杯时期,自己写了一个分析足球竞彩的小工具。工具虽然简单,但是可以增加购彩的乐趣。曾经这段代码差一点就丢了,现在拿出来给分享吧,这样就不用担心找不着了。作为一个普通球迷,边看球边买足彩也算是一种非常快…

kaggle比赛:Predict California sales prices(房价预测)

目录 1、比赛介绍:2、导入数据:3、项目构建:特征选择:预处理:训练:模型推理及保存预测结果: 4、上传预测结果到kaggle:5、总结: 本文内容来源于《动手深度学习》一书。跟着沐神做kag…

实际波动率预测:kaggle比赛

实际波动率预测 1. 比赛概述1.1 背景介绍1.2 赛事目标1.3 评估指标和结果提交 2. 数据介绍2.1 book_[train/test].parquet2.2 trade_[train/test].parquet2.3 train.csv2.4 test.csv2.5 sample_submission.csv 3. Optiver提供的[官方帮助文档](https://www.kaggle.com/jiashenl…

[Kaggle比赛] 高频股价预测小结

高频股价预测 文章目录 高频股价预测问题描述问题分析数据分析数据集数据清洗 解决方案数据预处理归一化PricesVolume时间信息对于预测值的处理噪声 模型探索基于LSTM的RNN模型递归神经网络(RNN)长短期记忆(LSTM)网络模型实现参数调整 卷积神经网络卷积神…

Predict Future Sales 预测未来销量, Kaggle 比赛,LB 0.89896 排名6%

Predict Future Sales 数据分析1. 数据基本处理1.1 读入数据集1.2 基线模型预测1.3 节省存储空间 2. 数据探索2.1 训练集分析 sales_train2.1.1 每件商品的销量2.1.2 每个商店的销量2.1.3 每类商品的销量2.1.4 销量和价格的离群值 2.2 测试集分析2.3 商店特征2.3.1 商店信息清洗…

世界杯押注还得看技术流,这个预测AI把赔率也算上了

胡澎 发自 凹非寺 量子位 报道 | 公众号 QbitAI 世界杯小组赛将收官,你还依然信AI吗? 冷门频出,黑马击败豪强。不少AI模型始料未及。 到底还能不能愉快找到科学规律?或者说足球比赛乃至其他竞技体育赛事,数据科学家在A…

足球大数据预测实战之高胜率盈亏条件验证及优化算法

上周接到一位老用户,之前为他做过数据验证,给出了组合条件下的胜率回查,结果有些难看啊。这期主要介绍常用人工智能算法中在足球预测中的应用,以及数据验证后的实际效果。 由上图为用户依据条件查证后的比赛场次和概率统计。可以看…

苹果手机朝下无法唤醒Siri,这个解决方法你知道吗

Siri对于苹果手机的用户来说是一个非常大的吸引点,能够指挥苹果手机中的Siri去做很多事情,如:放一首歌曲、百度一些知识点、这句话用英语怎么说等等功能。但是,不知道你们有没有发现一般我们苹果手机朝下无法唤醒Siri。是不是觉得…

如何解决Siri无法正常运行的问题

Siri 是一位智能助理,能帮助你在 Apple 设备上更快速轻松地处理各种事务,甚至不用等你开口。 Mac 上的 Siri 可帮助您执行日常任务,如获取问题的快速***、播放音乐等。您可以询问 Siri 几乎任何内容,Siri 都可以为您执行或回答您的问题。如果在使用 Siri…

【推荐实践】多场景多任务学习在美团到店餐饮推荐的实践

省时查报告-专业、及时、全面的行研报告库 省时查方案-专业、及时、全面的营销策划方案库 【免费下载】2023年2月份热门报告合集 ChatGPT团队背景研究报告 ChatGPT的发展历程、原理、技术架构及未来方向 ChatGPT使用总结:150个ChatGPT提示此模板 ChatGPT数据集之谜 …

倒计时3天!2023新榜AIGC生态大会看点剧透

倒计时3天!「AIGC赋能重塑内容生态」2023新榜AIGC生态大会将于7月14日在北京丽都皇冠假日酒店重磅登场。 内容行业正在步入AI时代。 AIGC(AI Generated Content,即人工智能生成内容)被认为是继OGC、PGC和UGC之后的新型内容生产方式…

携程平台增长部总经理王绩强:原生互联网企业正在经历一场数字升级丨数据猿专访...

‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 以大数据和人工智能为核心,众多新兴技术开始赋能数字营销。于是,智能营销已然从工具化走向了业务化。 如今,数字化营销已经成为了企业数字化转型中的重要一环。相较于传统营销逻辑&#x…

技术总监亲自上阵,手撸了个推荐系统!

省时查报告-专业、及时、全面的行研报告库 省时查方案-专业、及时、全面的营销策划方案库 【免费下载】2023年2月份热门报告合集 从0到1详解推荐系统基础知识和框架 推荐技术在vivo互联网商业化业务中的实践.pdf 推荐系统基本问题及系统优化路径.pdf 大规模推荐类深度学习系统的…

融合GPT大模型产品,WakeData新一轮产品升级

近期,WakeData惟客数据(以下简称 “ WakeData ” )完成了新一轮的产品能力升级。就 ToB 企服公司如何融合GPT 大模型,WakeData 给出了自己的答案。 在2022年11月的产品发布会上,已传递出WakeData的“三个坚定”&#x…

借助chatGPT强大的源码理解能力,来快速学习elasticsearch 7.11.1整体源码结构(用chatGPT学源码太香了)

ES阅读学习源码的难处 es的源码非常之多。能够查阅的资料非常少。如果是我们一行一行的去扒着源码看,在我看来至少需要2年的时间,并且至少要耗费四分之一的头发。源码读起来很枯燥,特别是在我们一头雾水的时候。很容易产生放弃的念头。很少有…

大语言模型中的涌现现象是不是伪科学?

深度学习在理论上的孱弱一直被诟病,但科学史上存在大量先有应用再有理论的事例,而其中不能解释的重大实验现象往往预示着理论创新的契机。我们首先从现象出发,来看下LLM中最神秘的emergent ability,如图 上图中x、y轴分别表示模型…

自制开源的 Midjourney、Stable Diffusion “咒语”作图工具

本篇文章聊聊如何通过 Docker 和八十行左右的 Python 代码,实现一款类似 Midjourney 官方图片解析功能 Describe 的 Prompt 工具。 让你在玩 Midjourney、Stable Diffusion 这类模型时,不再为生成 Prompt 描述挠头。 写在前面 本文将提供两个版本的工…

【区块链技术社区】区块链微信群

磨链mochain社区-区块链技术讨论交流不定期进行线上的技术交流学习,技术分享。线下技术交流,成员主要在北京、上海、浙江、广东等地。欢迎:区块链技术大咖、区块链爱好者、区块链技术爱好者、想了解区块链技术的小白不欢迎:广告党…