这是「进击的Coder」的第 808 篇技术分享
作者:小 G
来源:GitHubDaily
“
阅读本文大概需要 5 分钟。
”为了解决文档交流和打印的问题,1993 年,Adobe 推出了第一版 PDF。
当时,为了寻找一种能够在各个计算机平台上保持文档格式不变的格式。Adobe 公司开始研发 PDF,这种格式将文本、图像、字体和布局等元素都嵌入到一个文件中,从而保证了文件在不同的操作系统和设备上能够呈现一致的效果。
自发布以来,PDF 便得到了广泛应用,我们日常接触较多的电子合同、个人简历、电子书籍都离不开 PDF 的身影。
发展至今,PDF 已成为了数字化时代的重要组成部分。
虽然 PDF 作为一种通用格式,具有很多优点和重要性,但是在实际使用过程中,仍然存在一些不太便利的地方,时常饱受诟病。
比如,PDF 需要安装指定软件才能运行、大文件加载速度慢、文本难以识别与复制、内容检索效率慢等问题。
如此种种,却被我近日发现的一款 PDF 神器,迎刃而解,那便是在前几天爆火,基于 ChatGPT 构建的 PDF 神器:ChatPDF。
地址:https://www.chatpdf.com/
它可以提取 PDF 文件中的内容,并将内容交给 ChatGPT 进行分析。待解析完成之后,你便可以跟它进行一对一对话交流,就好像它是一个完全理解内容的人一样。
这款应用非常适合从技术手册、论文、法律合同、书籍或研究论文等大型 PDF 文件中快速提取信息,以便更快搜寻、检索相关内容。
下面我将以 Scott Chacon 和 Ben Straub 编写的《Pro Git》一书,为大家做下演示。
《Pro Git》是知名的 Git 使用手册,里面详细介绍了 Git 的发展历史、环境配置、代码合并、提交、推送等基础用法,以及 Git 原理解析与 GitHub 进阶操作等内容。
使用的方法也很简单,在网站主页上传并解析 PDF 文件,完成之后,便会自动跳转到一个对话窗口。
接下来,我们便可以与 PDF 进行一对一交流。在交流过程中,你可以向它提问所有关于文档的任何信息。
我尝试向其询问了几个关于 Git 的基础使用问题,发现它都答得挺不错,在答案的末尾,还会附上 PDF 的页数参考信息,以便你进一步浏览学习。
接着,我又尝试向它询问了几个偏向主观的技术问题:
整个流程体验下来,ChatPDF 的实际反馈颇为惊艳。
不仅于此,如果你直接丢给它一个英文版的 PDF 文档,然后用中文跟它对话,它还能完成诸如内容总结、信息提取等操作。这样一来,直接连翻译流程都直接省了!
如此种种贴心功能,称其一声神器也毫不为过。
发布当天,ChatPDF 便犹如平地一声雷,炸响了整个互联网圈。
五天后,作者发推表示,该工具目前已解析 65000 份文档,且还在持续增长中。
由于使用者众多,也让作者不得不调整用户所上传的 PDF 页面限制。
作者 Twitter 上公布的限制是 20 页,但我今天实际使用发现是 200 页。
这里再多说几句。
由于现在该服务是对外免费开放提供,用的是作者申请的 API Key,因此大家最好是有需求再用,别给作者造成太大负担。
如果你有自己的 ChatGPT API Key,那就再好不过了,不仅能突破 200 页的 PDF 文档限制,还能随心所欲地使用。
上面那份《Pro Git》的文档,我就是使用自己的 Key 来完成操作演示的。
或许,你会感到疑惑,为什么作者会突发奇想,开发出这么一款应用呢?
按他的原话说:这是属于人工智能革命的时代!智能很快就会免费且无处不在,从而重构我们的社会并实现新的交互可能性。
细细品味,便可知,一个 ChatGPT 魔盒已经在互联网世界中悄然打开了。
文中所提到的所有开源项目与工具,已收录至 GitHubDaily 的开源项目列表中。
该列表包含了 GitHub 上诸多高质量、有趣实用的开源技术教程、开发者工具、编程网站等内容。
从 2015 年至今,累积分享 3500+ 个开源项目,有需要的,可访问下方 GitHub 地址或点击文末「阅读原文」自取:
GitHub:https://github.com/GitHubDaily/GitHubDaily
好了,今天的分享到此结束,感谢大家抽空阅读,我们下期再见,Respect!
End
崔庆才的新书《Python3网络爬虫开发实战(第二版)》已经正式上市了!书中详细介绍了零基础用 Python 开发爬虫的各方面知识,同时相比第一版新增了 JavaScript 逆向、Android 逆向、异步爬虫、深度学习、Kubernetes 相关内容,同时本书已经获得 Python 之父 Guido 的推荐,目前本书正在七折促销中!
内容介绍:《Python3网络爬虫开发实战(第二版)》内容介绍
扫码购买
好文和朋友一起看~