跨越时空的对话:如何使用AI阅读工具ChatDOC快速建立数字化身?

跨越时空的对话:如何使用 ChatDOC 快速建立数字化身?以史蒂夫·乔布斯 AI 为例

开门见山,这篇文章主要介绍如何将 AI 改造为靠谱、好用、基于某个人物的数字化身。比如,乔布斯 AI、马斯克 AI、张一鸣 AI、王兴 AI、佛陀 AI、孔子 AI.

想象一下,和乔布斯聊产品,和释迦摩尼论佛法,和孔子聊人生哲学,和张爱玲聊爱情……那岂不是能够快速全面提升我们的视野和能力

让各个领域的精英群体或者名人,成为你的专属 AI 助手,便是这篇文章的写作目的

目前,全世界最出名的 AI 工具便是 ChatGPT. 直接让 ChatGPT 这样的 AI 模拟这些角色不好吗?答案是,NO. 这需要从 ChatGPT 的缺陷说起。

aee25e0e1a28b76225ce774b1686187e.jpeg

ChatGPT 模拟角色的缺陷

以 ChatGPT 为代表的 AI 产品掀起了 AI 时代的正式降临

与以前的 AI 相比,人类可以使用自然语言,像是和好友聊天那样,对 ChatGPT 发号施令。 ChatGPT 可以模拟各种角色,与用户进行互动。在这个过程中,如果对于 ChatGPT 的命令得当,我们可以获得逼真、有趣的交互体验。在某种意义上,ChatGPT 已经可以通过图灵测试。

然而,ChatGPT 对于角色模拟,只是基于角色设定的简单表演,背后的内容,依然是基于 GPT 强大的内容生成能力。如果你的提问内容,在 ChatGPT 的数据训练集中相关数据比较少,那么只能获得一些似是而非、并不准确或者高效的回答

打个粗略的比喻,没有采用专有数据训练的 ChatGPT,相当于一个表现尚可的演员。这只是形似。 如果需要进一步提升 ChatGPT 的表现,那么便需要让 ChatGPT 了解所需扮演角色的人物传记,深入了解这个角色的所思所想所行。如此,方能做到神似

为了让 ChatGPT 进化,那么便需要让 AI 阅读扮演角色所需要的垂直领域的专有数据。

ChatDOC = ChatGPT + 垂直领域数据集,打造你的专属 AI

如今,ChatGPT 通过插件也可以直接上传文档进行解析。然而,存在诸多问题。

一,只有 GPT Plus 用户才能使用插件功能。

二,Plus 价格昂贵,且支付困难。

三,无法实现多文档对话。

而 ChatDOC 则是一款基于 ChatGPT,以强化 ChatDOC 读取专业文档能力的 AI 阅读工具。

基于 ChatDOC, 便可以实现将垂直领域的专有数据集投喂给 ChatGPT, 让 ChatGPT实现深度进化。

这篇文章便是以 ChatDOC 为例,展示如何打造基于人物角色的数字化身

ChatDOC 介绍

下面是 ChatDOC 的简要介绍:

ChatDOC 是一款基于 GPT 的 AI 模型,允许 GPT 与用户所指定的文档进行对话,处理用户的专属数据的 AI 阅读辅助工具

访问地址:https://chatdoc.com

特点

  • 操作简单:一键上传,快速上手
  • 文本智能分析:文本、表格数据处理均准确高效;
  • 内容回溯功能:基于问答结果快速查看原文;
  • 多文档提问:支持上传一个文件夹,对文件夹进行整体提问;
  • 多轮追问:支持基于某一条回答展开多轮会话,方便深度探讨内容;
  • 提问支持预设自定义提示词/Prompt 功能
  • 保障用户数据安全:加密存储、数据自主;
  • 支持 PDF、Word 等多种文档格式,支持 OCR;
  • 开放的生态体系:支持 API, 允许企业用户将 ChatDOC 功能整合至自己的产品;
  • 对中文用户友好:大陆地区稳定、流畅访问,支持大陆常见的支付方式进行付费;

65047a3867c78bfc0bb41882c826fd6f.jpeg290564f0b55893ff639d6f826719fc13.jpeg

如何建立虚拟人物 AI?

主要思路如下:

  • 工具:ChatDOC
  • 数据:用户自己收集和训练。

我决定使用 ChatDOC 建立 Steve Jobs AI. 主要原因是,数据收集简单。作为科技领袖,乔布斯在全世界范围内拥有庞大的粉丝。这些人已经在互联网将乔布斯的各种演讲视频、访谈视频、纪录片、书籍或者其他文档进行整理。我只需要采用拿来主义,便可以解决数据采集问题。

当然了,这个问题也可以问问 ChatDOC. 提问及回答如下:

d694e15adb7cd7ad7a1d0c35521f9837.jpeg

对比下来,ChatDOC 比我思虑周全。

下面是具体思路介绍。

如何收集数据?

寻找数据

只有更高质量的数据,才能训练出更好的 AI. 不同资料的可信度、准确度、专业性是不同的。

以经验判断,学术论文、专业书籍、纪录片、专业博客等属于高质量数据。而很多二手信息,则必须坚决抛弃。所谓,垃圾进,垃圾出

为此,我需要收集关于乔布斯的高质量专有数据。

经过检索,我发现以下数据:

  • 综合资料:Steve Jobs Archive. 乔布斯存档内容站点,保存了关于乔布斯演讲、录音、视频、邮件、书籍。其中,Make Something Wonderful 用史蒂夫·乔布斯自己的话记录了他的一生。该书以时间轴的形式记录了这位前苹果公司 CEO 生活中的重要时刻,包括一系列以前从未向公众公开的材料。特别值得注意的是其还包含了苹果内部会议的记录和他发给自己的各种电子邮件。
  • 书籍:《史蒂夫·乔布斯传》、《成为乔布斯》等是中英文世界关于乔布斯比较重要的书籍,能帮助人们深入了解乔布斯的成长经历、思维方式、行为方式、主要观点。
  • 其他资料。主要是一些乔布斯的演讲、访谈视频及对应的文稿。

注释:Make Something Wonderful 这本书制作精良,质量很高,阅读体验非常好。强烈建议阅读。

a9bdb3571945670e072d34475b8190b5.jpeg

如图,我使用 FlowUs 多维表格整理了乔布斯的主要资料。

3053d74ad1595ac805795874e3a34270.jpeg

处理数据

Steve Jobs Archive 为公开的免费内容,直接下载即可。

至于书籍,我在全世界最大的电子书籍图书馆 Z-Library 检索关键词下载。

c7e9bd5db855bd21ab10ad960a852c7e.jpeg

由于 ChatDOC 目前只支持 PDF、Word 格式,因此,我需要将下载好的 Epub/MOBI 格式转化为 PDF 格式。

国内的格式转换工具,比较有名的便是福昕 PDF 转换大师、转转大师,两者均支持 PDF 格式的多种处理。具体参见:

福昕 PDF 转换大师:功能丰富、专业易用的 PDF 转换工具

转转大师:专业、全能的格式转换工具

其中,我使用了转转大师电子书转换功能,对我下载的文档进行了批量处理。效果如下:

8f6eeb9798904ca955c021f6f490d298.jpeg957fccb772eece10152157bf270eae71.jpeg

上传数据

随后,我便得到了我想要的数据集。最后,我将这些数据放在同一个文件夹之下,将整个文件夹一键上传至 ChatDOC.

如图,点击 Drag and Drop Folder as Collection.

e01ac4fd1d48c4870552f35a72162de2.jpeg

最终效果如图:

171ae0270b6f2d764a6ae6d83467c2a5.jpeg

如何设定对话系统?

在将 ChatDOC 上传后,我们便可以直接进行提问了。

我开始基于乔布斯的专有数据进行提问。使用 ChatDOC 的优点在于,已有的回答言之有物,有理有据,可以追溯答案背后的原文。

现在的问题是,ChatDOC 总是以一副冷冰冰的、论文式的风格回答问题。虽然目前的回答,是基于乔布斯的所思所想,但是表达风格并不是。

那么,应该如何调教 ChatDOC 做到神似乔布斯呢?

简单的来说,需要让 ChatDOC 分析乔布斯的语言风格、性格特征等信息,再根据范例进行回答。

不知道具体怎么提问?这个依然可以向 AI 提问,让 AI 化身为角色设定师。

将 AI 变身为角色设定师

我们的目标是让 AI 更好地扮演某个角色。 但是,我们并不知道如何提一个高质量的问题,以便让 AI 成功实现角色扮演? 对此,思路如下

  • 我们可以反过来询问 AI ,提出你的需求:如果我需要你扮演 XYZ, 需要哪些信息
  • 你可以让 AI 对回答进行总结。随后,我们将回答要点,反向写在提示词之中。再次进行测试。
  • 如此,循环往复。直到优化为满足你需求的提示词。

23634db996ddf907f07a32e1e165fbb2.jpeg

经过几轮调试后,角色设定提示词如下:

请以角色设定师的身份,分析已有文档,并为我创建基于这些文档的角色化身,包括角色能力、成长经历、个性特点、语言风格、领导风格、思维方式、行为特征等角色分析信息。请给出角色简介及对应的对话范例。请注意,在角色设定中,不要使用“AI、人工智能、根据相关文件片段”等关键词或者字眼。下面将由你来模仿扮演该角色。你需要的扮演的角色是:Steve Jobs.

对应的答案如下:

5ef23eccc60afb13dfa371ba4ec6cf71.jpeg

请以角色设定师的身份,分析已有文档,并为我创建基于这些文档的角色化身,包括角色能力、成长经历、个性特点、语言风格、领导风格、思维方式、行为特征等角色分析信息。请注意以下要点:

  1. 我需要你扮演的角色是 Steve Jobs.
  2. 回答内容需要基于乔布斯的语言风格、个性特点、思维方式等因素进行回答。
  3. 回答中不要使用“AI、人工智能、根据相关文件片段、首先/其次/另外/最后、作为乔布斯的化身”等关键词或者字眼。
  4. 回答要像访谈对话那样,语言偏向口语化,需要通俗易懂。
  5. 回答基于第一人称进行回答。

下面将由你来模仿扮演Steve Jobs. 我的第一个问题是:你对年轻人创业有什么建议?

57ea59dcf6c2b7cc5d43452468a2b736.jpeg

我的语言调试有点失败。目前,除了表达方式不太像日常对话。其他效果还是比较完美的。

再次尝试。这次加入对话示例

782d1706917ade486cdf7445f2e0d261.jpeg

回答如下

7f5ddb68e732e73556d29fa4c5955c4a.jpeg

貌似 ChatDOC 预设了语言表达风格,无法强制 ChatDOC 更改语言风格。目前的回答,明显是论文式风格。这可能和 ChatDOC 的用户多是科研、金融等专业领域的垂直用户有关。

使用建议

如果忽略语言风格,我们也可以直接通过 ChatDOC 这个 AI 阅读工具,与乔布斯进行跨越时空的对话

根据资料主题,与 AI 进行深度对话

比如,你可以和乔布斯聊苹果公司,聊产品,聊创业,聊设计。这些都是 Steve Jobs AI 所擅长的。

51817379b4b26ad7da6d679b8a67bebc.jpeg

当然了,对于资料库中,相关数据比较少的话题,比如亲密关系。这些乔布斯 AI 的回答可能就有些吃力。不过,再怎么差,这些数据都是基于乔布斯的已有资料,有理有据,而不是基于 GPT 的瞎编乱造。

416900278a409e693e8500069dc4a5f9.jpeg

微调或者优化提示词,多次提问

在使用 ChatDOC 过程中,基于 AI 的回答,内容质量存在一定的波动。如果你对回答不太满意,可以微调提示词,尝试再次询问。

比如,以下是基于同一个问题的 2 个回答。第二个感觉更好一些。

8eaf840f314eec306e706aeb87e63c61.jpeg56695bb78901eb82ea2e5702cb8fee90.jpeg

结语

这篇文章虽然以介绍 Steve Jobs AI 为例,但是思路也适用于你训练其他 AI. 让你和这些名人展开跨越时空的对话

除了基于名人数据训练 AI,我们每个人比较容易获取的还有自己的私人数据。比如,基于自己近几年的微信聊天记录,建立一个自己的数字分身,也未尝不可。

如果你对 ChatDOC 感兴趣,可以尝试搭建自己专属 AI.

工具箱

效率工具箱:阅读、笔记、写作 AI


AI 阅读辅助工具:ChatDOC

715049d2e5c2ff1b933cc7c18c68ff5e.jpeg

知识管理和在线协作工具:FlowUs 息流

特点

cb03c0dfe67d1aee222ca3cee8b44215.jpegb4aa56d0abfc8b0eaed63e985d282f2b.jpeg

FlowUs AI

  • 自定义问答
  • 自定义创作
  • 预设问答与创作:头脑风暴、列出执行步骤、罗列大纲、分析优缺点、内容解释、日常小记、故事创作、写文章、翻译、总结

eb0656c0a5c185f216134e87d97f5211.jpegafb6a8b481755ef729261cee8daa1221.jpeg559c4828479f719b0924675b9ab9fd5e.jpeg12eb833e0bdef4d20ec5c7ed2b066755.jpega1c3a4aad5d128e6df290e1ff3efb8ff.jpeg

使用教程

更多关于 FlowUs 使用技巧的介绍

58a1ec0675095d936c1304598f748634.jpegb60fdb605d18611ce049d61b38c98477.jpeg4488bc21d7e7979667b598139023e8c9.jpeg199bf3d56c965158eb7aadbacda056fa.jpegac48136f3dfcfade3ffd808270e4806c.jpegdae1227e6b5817907cd66512f04e993e.jpeg8395810dae688f07fe8a27451f9857c7.jpeg77cb4966a8a058d9613ad1606d8e1211.jpeg38244792663f3b17814ceec31117936d.jpegdeb7bd13a4a1501e7d404bc52f54aaaa.jpeg713aeab5f6d0cbb21ba9bf159ea31ade.jpeg

书签管理: Wetab 新标签页

Wetab 是一款基于浏览器的新标签页产品,主张辅助用户打造一个兼具效率与美观的主页。

c381a57e01c50b1683eaf41e618785f4.jpeg

产品特色与功能

0f3c15fb9958efba8fd23ef22c2ea91f.jpeg9bc0d546f67199479f5d7ce07e6ee78c.jpeg1d03c4f6cad6c5eaa0e5d047a37acdcc.jpeg

移动端使用教程

移动端·综合教程图文版

a449c8af7f61e2554a6dfae10f8b1b31.jpeg54b9268aac39135046d0df7844759474.jpeg60ed4896488737f72e7a66d47b7af8e5.jpeg

VisionOn

介绍

一款集流程图、思维导图、白板于一体的轻量级在线图形工具

特点

d706707ba8200d4745ea39b060eb9b27.jpeg

dde749ff9360536f645dbe908532baa4.jpeg

9233d503bbd40bb895b64fd60b2fefbe.jpeg

84401f6227256e9ad81501e0f74997ad.jpeg

de57063f349b594bfb20da9d4d817c46.jpeg

4b8270791c46e2816cb2466144df1319.jpeg

bc2299983e8e2b5a9154f37faf57d041.jpeg

6a0082ad94812abd218ceb4638d04b0d.jpeg

d8366d6cab24e8e00d7115c02b3221f1.jpeg

d97e5095706e34597d259f0e627f5b64.jpeg

b60f9806f7ce665db0d54fd59f67f47d.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/20212.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

《花雕学AI》16:BingGPT桌面端的另外一个惊喜—完美整合了新Bing的AI作画功能

你是否曾经想过,如果你能用语言描述你想要的画面,就能让AI为你生成一幅美丽的图画,那该有多好?你是否曾经想过,如果你能在桌面端直接与新Bing进行智能、流畅、有趣的对话,而不需要打开浏览器或安装插件&…

“上4休3”公司不建议新公司模仿;甲骨文组队,欲挑战微软OpenAI组合;Qt Creator 11 Beta发布|极客头条...

「极客头条」—— 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews) 一分钟速览新闻点&#…

我给Chat GPT写了个记忆系统

ChatGPT-LifeTime OpenAI 的模型有一个固定的 Token 限制,例如 GPT-3 的 Davinci 模型最多可以处理2049 个 Token,大约 1500 个英文单词。最新 Turbo 模型大约是 4,096 个 Token,大约是 3000 个英文单词,也就是意味着Chat GPT它会…

微软Copilot“杀疯了”:Windows引入AI助手、Bing接入ChatGPT,弯道超车的机会来了?...

来源:大数据文摘授权转载自AI前线 作者:刘燕、冬梅、核子可乐 5 月 23 日消息,微软在刚刚举办的 Build 大会上宣布了一项令人振奋的消息。毫无疑问,本届大会的重点落在了 AI 上,包括 Copilots for Windows 11 及其他一…

[使用指南]在使用MyEclipse时如何添加 更新插件

MyEclipse v2022.1.0正式版下载 通过Eclipse市场目录或各种更新站点类型添加插件,可以定制你的MyEclipse IDE(或Angular IDE)。 一、从目录中添加插件 添加额外插件最简单方法是通过Eclipse Marketplace目录。 1. 要打开目录,请从Catalog中选择Help&…

HackTheBox - TartarSauce Write Up

IP:10.10.10.88 OS:Linux DIFFICULT:Medium 0x01 Information Gathering 端口扫描指纹识别 rustscan -a 10.10.10.88 -r 1-65535 --ulimit 1000 -- -sV -sC -sT --min-rate 5000.----. .-. .-. .----..---. .----. .---. .--. .-. .…

项目准备工作、笔试题目讲解

目录 讲一下冯诺依曼体系结构输入的处理 查bug基本步骤 我希望你重点可以讲一讲处理的这个过程,该如何处理呢? 介绍一下Maven Maven如何配置阿里云镜像? 介绍一下springboot 介绍一下mybatis 为什么有些人说mybatis不是很好&#xff1f…

vscode IDE 能用的上的扩展工具功能介绍

记录分享vscode扩展,包括提升开发效率。必备。主题美化。ChatGPT等。 参考 vscode-extensions [Best] 记录分享方式,整理自己用的扩展,还有一键备份和还原方法。 ⭐快速下载和使用扩展 后面会介绍很多vscode扩展.这裡有一个技巧,…

vscode中文乱码解决方法总结

第一种方法:直接点下面的 找到GB18030(其实GB都可以,我也不懂,一个一个试吧) 运行就可以了 第二种方法:点击设置, 在上面搜索 编码 ,点击utf8 下拉找到GB 第三种方法: 这种方法我也不会&#xf…

CodeWhisperer的正确使用

重点1:推出Amazon Bedrock。这项新服务允许用户通过API访问来自AI21 Labs、Anthropic、Stability AI和亚马逊的基础模型。(Anthropic 就是之前跟 ChatGPT 掰手腕的 Claude 的模型。Stability AI 就是 Stable Diffusion 背后的公司。) 重点2&…

一分钟生成思维导图

思维导图是一种常用的工具,用于组织和表示复杂的思想和信息。它可以帮助我们更好地理清我们的思路,从而更有效地管理我们的时间和任务。在这篇博客中,我将向你展示如何在一分钟内制作一张简单的思维导图。结尾有彩蛋喔~ 必要条件&#xff1a…

ChatGPT无所不知?? 怎么可能? vscode启用括号对参考线, 他就不知道

牙叔教程 简单易懂 括号对参考线 一开始我是这样问的 问 vscode , 当我点击某个括号时, 显示配对的括号, 有一条线连接两个括号, 怎么实现? vscode自带这个功能吗? 或者用什么插件扩展 ChatGPT答 在 Visual Studio Code 中,这个功能是自带的。当你点击一个括…

ChatGPT-CURSOR(copilot)试用初体验

chatgpt相关的cursor试用记录及总结,会极大提升开发的代码开发效率(间接的对百度、google的依赖降低很多),可以与开发需求全过程结合的点很多(如占用时间较多的CR),期待大家结合自身工作的试用分…

​影视剪辑如何月入1万+?大神教你影视剪辑实操全流程!【覃小龙课堂】

您好,我是您的老朋友:覃小龙,您可以叫我覃总。我们今天给您带来的主题是: 影视剪辑如何月入1万?大神教你影视剪辑实操全流程! 影视剪辑2个账号,月1万多!教你从0做起 新手刚开始做影视…

自媒体人或初学者以及专业电影制作者最喜欢的八款制作软件推荐(会声会影)(Vegas)

无论你是拍摄爱好者,还是一位全职的专业视频人员,都需要一款功能强大、易于使用的视频编辑软件。 2020年最好的视频编辑软件: 1.Corel VideoStudio Ultimate(会声会影) 当涉及到家庭视频技术时,不管是3D、4K、360 VR,…

影视短视频剪辑的完整操作流程(普通人也能学会)

嗨喽,大家好,我是会玩运营,能写代码,文案设计样样精通的江湖美男子菜鸟哥,一名走在营销路上的小菜鸟。点击上方蓝字“关注”,每天为你分享有用的营销运营干货。 上一篇文章我们讲解了《全网最全抖音运营攻略》,相信看完这篇文章的朋友对于短视频运营多少有了一定的了解,…

影视剪辑,自学剪辑的转场与准则,掌握一门剪辑技能

今天给大家分享一期影视后期工作方法和技巧攻略 剪辑丝滑的窍门,善用10个无技巧转场! 今天讲蒙太奇中手法。 镜头剪辑后,需要用手法去衔接。但我们衔接的时候并不是毫无章法的! 让剪辑的视频更丝滑,衔接更融洽&#…

影视剪辑,视频剪辑流程,如何进行混剪

一个人如何在家自学剪辑?今天经验分享来啦! 视频剪辑流程 一、建立好项目文件夹。根据时间、地点、大体拍摄内容等分类,在不同的文件夹存入对应的物料和工程。 二、获取素材。提前收集好要用的包装素材与音乐网站,进行及时补充素…

浅谈2—SAT问题

浅谈2—SAT问题 2-SAT: 1 2 - SAT就是2判定性问题,是一种特殊的逻辑判定问题。 2 2 - SAT问题有何特殊性?该如何求解? 3 我们从一道例题来认识2 - SAT问题,并提出对一类2 - SAT问题通用的解法。 4 Poi …

Improving Language Understanding by Generative Pre-Training 论文阅读

论文题目:通过生成式预训练提高语言理解能力 GPT的全称:Generative Pre-trained Transformer。 Generative是指GPT可以利用先前的输入文本来生成新的文本。GPT的生成过程是基于统计的,它可以预测输入序列的下一个单词或字符,从而生…