用ChatGPT处理word表格数据:直接采用ChatGPt和利用ChatGPT编写python脚本两种方法

目录

  • 摘要
  • 0. 测试数据生成
  • 1. 直接使用ChatGPT进行处理。
  • 2 使用ChatGPT生成python脚本进行处理
  • 3对比分析
  • 4 结束语

摘要

为测试ChatGP在word文档表格的处理能力,本文列举直接使用ChatGPT和利用ChatGPT编写python脚本两种方式,均比较容易的实现了预定目标。文章介绍的利用ChatGPT进行文档处理的方法和思路可以指导大家利用AI工具提升效率。

近期在工作中需要对一些表格数据进行分析处理,并生成统计文档。想到ChatGPT这个生产效率提升工具,想着就试试效果如何。

0. 测试数据生成

工作中的数据涉及很多个人信息,不适合直接进行测试,因此需要生成类似的数据进行调试。
Tips:在使用ChatGPT的过程中一定需要注意个人隐私和数据的保护,你提交的数据会被如何利用目前还不确定,已经和ChatGPT对话的数据泄露的报道,慎重点没有关系。

我把需要处理的表头提供给ChatGPT,让他给我生成随机数据,然后用他生成的数据进行测试。
输入:

按照下的数据格式,自动生成20数据
数据实例表格如下:
| 序号 | 商品     | 发货地点     | 发货时间           | 预计收货时间       | 收货人   | 快递公司 | 快递公司电话 |
| :--: | :------: | :----------: | :-----------------: | :-----------------: | :------: | :------: | :------------: |
|  1   | 苹果     | 河南省郑州市 | 2023-04-20 08:30:00 | 2023-04-22 12:00:00 |  张三  | 顺丰快递 | 10086          |

输出:

| 序号 | 商品   | 发货地点       | 发货时间           | 预计收货时间       | 收货人   | 快递公司   | 快递公司电话 |
| ---- | ---- | -------- | ------------ | ------------ | ------ | ------ | -------- |
| 1    | 牙刷   | 广东省深圳市   | 2023-04-20 10:00:00 | 2023-04-21 18:00:00 | 张三   | 申通快递   | 95543    |
| 2    | 洗发水 | 北京市海淀区   | 2023-04-20 10:30:00 | 2023-04-22 16:00:00 | 李四   | 圆通快递   | 95554    |
| 3    | 衣服   | 上海市浦东新区 | 2023-04-20 11:00:00 | 2023-04-23 14:30:00 | 王五   | 中通快递   | 95555    |
| 4    | 鞋子   | 广东省广州市   | 2023-04-20 12:00:00 | 2023-04-22 15:00:00 | 赵六   | 顺丰快递   | 95338    |
| 5    | 手机   | 河北省石家庄市 | 2023-04-20 13:00:00 | 2023-04-23 10:00:00 | 张三丰 | 韵达快递   | 95546    |
| 6    | 眼镜   | 江苏省南京市   | 2023-04-20 14:30:00 | 2023-04-23 12:00:00 | 李白   | 中通快递   | 95508    |
| 7    | 水杯   | 四川省成都市   | 2023-04-20 15:00:00 | 2023-04-22 17:30:00 | 王实甫 | 顺丰快递   | 95338    |
| 8    | 书包   | 河南省洛阳市   | 2023-04-20 16:00:00 | 2023-04-24 14:00:00 | 吕布   | 圆通快递   | 95554    |
| 9    | 帽子   | 浙江省杭州市   | 2023-04-20 17:30:00 | 2023-04-24 11:30:00 | 张飞   | 韵达快递   | 95546    |
| 10   | 耳机   | 广东省深圳市   | 2023-04-20 18:00:00 | 2023-04-21 21:00:00 | 关羽   | 中通快递   | 95555    |
| 11   | 凉鞋   | 北京市朝阳区   | 2023-04-20 19:30:00 | 2023-04-23 16:30:00 | 赵云   | 申通快递   | 95543    |
| 12   | 腰带   | 上海市长宁区   | 2023-04-20 20:00:00 | 2023-04-24 17:00:00 | 刘备   | 圆通快递   | 95554    |
| 13   | 毛巾   | 广东省广州市   | 2023-04-20 21:00:00 | 2023-04-23 15:00:00 | 孙尚香 | 顺丰快递   | 95338    |
| 14   | 餐具   | 河北省保定市   | 2023-04-20 22:00:00 | 2023-04-25 11:00:00 | 华佗   | 中通快递   | 95508    |
| 15   | 头盔   | 湖北省武汉市   | 2023-04-20 23:00:00 | 2023-04-23 13:30:00 | 典韦   | 申通快递   | 95543    |
| 16   | 手表   | 广东省深圳市   | 2023-04-21 00:30:00 | 2023-04-22 18:00:00 | 马超   | 韵达快递   | 95546    |
| 17   | 手表 | 四川省成都市   | 2023-04-21 01:00:00 | 2023-04-24 16:30:00 | 刘备   | 圆通快递   | 95554    |
| 18   | 游戏手柄 | 上海市浦东新区 | 2023-04-21 02:00:00 | 2023-04-22 21:00:00 | 王昭君 | 中通快递   | 95555    |
| 19   | 牙膏   | 北京市海淀区   | 2023-04-21 03:30:00 | 2023-04-23 12:30:00 | 曹操   | 顺丰快递   | 95338    |
| 20   | 茶杯   | 广东省广州市   | 2023-04-21 04:00:00 | 2023-04-24 10:00:00 | 关羽   | 韵达快递   | 95546    |

输出数据很快,结果也很稳定,城市的省市关系,发货与收货的时间先后顺序,快递名称是常用的快递随机重复出现,人名多是张三李四,上面的例子比较特殊,一堆三国人物,快递电话是错的,但是不影响我后面的数据处理。

1. 直接使用ChatGPT进行处理。

我试图让ChatGPT统计收件人为关羽的快递,输入:

对上面生成的数据进行分析,请完整的统计“收货人”为“关羽”的所有数据,输出格式为:
由关羽的快递有{}件,分别是:
{序号}.{发货地点}寄出的{商品},快递公司为{快递公司},收货人是{收货人},预计达到时间为{预计达到时间}

第一次输出:

收货人为“关羽”的所有数据如下:
由关羽的快递有3件,分别是:
10.广东省深圳市寄出的耳机,快递公司为中通快递,收货人是关羽,预计达到时间为2023-04-21 21:00:00;
20.广东省广州市寄出的茶杯,快递公司为韵达快递,收货人是关羽,预计达到时间为2023-04-24 10:00:00;
17.四川省成都市寄出的手表,快递公司为圆通快递,收货人是关羽,预计达到时间为2023-04-24 16:30:00;

其中一条是错误的,提醒他,输入:

你有一条数据是错误的,有一件物品的收件人并不是关羽

再次输出:

非常抱歉,我犯了一个错误。我查看一下表格,发现其实序号为17的手表的收货人不是关羽,正确的收件人应该是刘备。那么由关羽的快递应该只有2件。非常感谢您的纠正。正确的输出如下:
由关羽的快递有2件,分别是:
10.广东省深圳市寄出的耳机,快递公司为中通快递,收货人是关羽,预计达到时间为2023-04-21 21:00:00;
20.广东省广州市寄出的茶杯,快递公司为韵达快递,收货人是关羽,预计达到时间为2023-04-24 10:00:00;

我测试了很多次,基本上每次都是先错,提醒后一般能改正,但是也有时不能改正,基本上没有办法第一次就得到正确答案,特别是当数据很多的时候,多次提醒也没有办法得到正确的答案,最多的错误是漏统计。因此,个人觉得使用ChatGPT直接进行数据处理可行不高。原因有三:
一是数据保密性问题,很多数据涉及商业秘密和个人隐私;
二是数据量的问题,现在还不能实现将数千行数据通过对话框进行处理。
三是数据处理结果的不确定性,AI模型内部的机理现在还不明确,他的结果随机性问题,特别是当数据量大时,出错的概率显著增加,毕竟数千行的数据不可能进行人工校对。
因此,下面尝试通过让ChatGPT生成一个Python脚本实现我想要的功能。

2 使用ChatGPT生成python脚本进行处理

ChatGPT也能写程序,让他帮忙写一个python的脚本,像这样简单的脚本应该能胜任。
输入:

有如下一个表格,存储在名为“物流信息统计表.docx”的文件中。
| 序号 | 商品   | 发货地点       | 发货时间           | 预计收货时间       | 收货人   | 快递公司   | 快递公司电话 |
| ---- | ---- | -------- | ------------ | ------------ | ------ | ------ | -------- |
| 1    | 牙刷   | 广东省深圳市   | 2023-04-20 10:00:00 | 2023-04-21 18:00:00 | 张三   | 申通快递   | 95543    |
| 2    | 洗发水 | 北京市海淀区   | 2023-04-20 10:30:00 | 2023-04-22 16:00:00 | 李四   | 圆通快递   | 95554    |
| 3    | 衣服   | 上海市浦东新区 | 2023-04-20 11:00:00 | 2023-04-23 14:30:00 | 王五   | 中通快递   | 95555    |
| 4    | 鞋子   | 广东省广州市   | 2023-04-20 12:00:00 | 2023-04-22 15:00:00 | 赵六   | 顺丰快递   | 95338    |
| 5    | 手机   | 河北省石家庄市 | 2023-04-20 13:00:00 | 2023-04-23 10:00:00 | 张三丰 | 韵达快递   | 95546    |表格的行数不确定,请帮我编写一个python程序,实现以下功能,
完整的统计“收货人”为“关羽”的所有数据,生成以下文字:
由关羽的快递有{}件,分别是:
{序号}.{发货地点}寄出的{商品},快递公司为{快递公司},收货人是{收货人},预计达到时间为{预计达到时间};
并将上述文字保存在“物流信息处理表.docx”中。

第一次输出:

好的,你可以使用Python中的docx库实现这个功能。只需要读取并遍历“物流信息统计表.docx”中的表格数据,找到符合条件的数据进行统计,最后将统计结果保存至“物流信息处理表.docx”文件中即可。

以下是实现该功能的Python代码:

import docx# 打开物流信息统计表
doc = docx.Document("物流信息统计表.docx")# 初始化目标数据列表
target_data = []# 遍历表格数据
for row in doc.tables[0].rows[1:]:# 获取每一行的数据data = [cell.text for cell in row.cells]# 判断是否是关羽的快递if data[5] == "关羽":target_data.append({"序号": data[0],"商品": data[1],"发货地点": data[2],"发货时间": data[3],"预计收货时间": data[4],"收货人": data[5],"快递公司": data[6],"快递公司电话": data[7]})# 拼接要保存的文字
text = "由关羽的快递有{}件,分别是:\n".format(len(target_data))
for i, data in enumerate(target_data):text += "{}.{}寄出的{},快递公司为{},收货人是{},预计达到时间为{};\n".format(data["序号"], data["发货地点"], data["商品"], data["快递公司"], data["收货人"], data["预计收货时间"])# 保存拼接好的文字到文件中
docx.Document().add_paragraph(text).save("物流信息处理表.docx")

运行以上代码后,程序将会自动读取“物流信息统计表.docx”中的表格数据,并统计“收货人”为“关羽”的所有数据,最后将整理好的文字保存至“物流信息处理表.docx”文件中。

但是,第一次运行时,系统报错,
在这里插入图片描述
输入:

docx.Document().add_paragraph(text).save("物流信息处理表1.docx")
AttributeError: 'Paragraph' object has no attribute 'save'
上面是系统报错,请修改程序

输出:
非常抱歉,是我在代码中疏忽了。正确的保存方式应该是使用doc.save("物流信息处理表.docx"),并且需要在新建文档的时候添加一个段落,然后再将拼接好的文字添加到此段落中,如下所示:

import docx# 打开物流信息统计表
doc = docx.Document("物流信息统计表.docx")# 初始化目标数据列表
target_data = []# 遍历表格数据
for row in doc.tables[0].rows[1:]:# 获取每一行的数据data = [cell.text for cell in row.cells]# 判断是否是关羽的快递if data[5] == "关羽":target_data.append({"序号": data[0],"商品": data[1],"发货地点": data[2],"发货时间": data[3],"预计收货时间": data[4],"收货人": data[5],"快递公司": data[6],"快递公司电话": data[7]})# 新建一个文档,添加一个段落
new_doc = docx.Document()
new_doc.add_paragraph()# 拼接要保存的文字
text = "由关羽的快递有{}件,分别是:\n".format(len(target_data))
for i, data in enumerate(target_data):text += "{}.{}寄出的{},快递公司为{},收货人是{},预计达到时间为{};\n".format(data["序号"], data["发货地点"], data["商品"], data["快递公司"], data["收货人"], data["预计收货时间"])# 将拼接好的文字添加到段落中
new_doc.paragraphs[0].add_run(text)# 保存文档
new_doc.save("物流信息处理表.docx")

运行以上代码后,程序将会自动读取“物流信息统计表.docx”中的表格数据,并统计“收货人”为“关羽”的所有数据,最后将整理好的文字保存至“物流信息处理表.docx”文件中。

输出的结果为:
在这里插入图片描述
并没有数据?突然想起来,“关羽”这个数据前后有多个空格。
输入:

上面的程序并没有输出正确的结果,可能是数据{收货人}前面后都包含空格,需要你删除空格,请重新改上述程序

输出:
正在为您搜索:上面的程序、输出、正确的结果、数据{收货人}

好的,你可以在代码中对“收货人”数据进行strip()操作以删除空格,这样就可以避免由于数据前后有空格导致统计出错的情况。修改后的代码如下:

import docx# 打开物流信息统计表
doc = docx.Document("物流信息统计表.docx")# 初始化目标数据列表
target_data = []# 遍历表格数据
for row in doc.tables[0].rows[1:]:# 获取每一行的数据data = [cell.text.strip() for cell in row.cells]# 判断是否是关羽的快递if data[5] == "关羽":target_data.append({"序号": data[0],"商品": data[1],"发货地点": data[2],"发货时间": data[3],"预计收货时间": data[4],"收货人": data[5],"快递公司": data[6],"快递公司电话": data[7]})# 新建一个文档,添加一个段落
new_doc = docx.Document()
new_doc.add_paragraph()# 拼接要保存的文字
text = "由关羽的快递有{}件,分别是:\n".format(len(target_data))
for i, data in enumerate(target_data):text += "{}.{}寄出的{},快递公司为{},收货人是{},预计达到时间为{};\n".format(data["序号"], data["发货地点"], data["商品"], data["快递公司"], data["收货人"], data["预计收货时间"])# 将拼接好的文字添加到段落中
new_doc.paragraphs[0].add_run(text)# 保存文档
new_doc.save("物流信息处理表.docx")

运行以上代码后,程序将会自动读取“物流信息统计表.docx”中的表格数据,并统计“收货人”为“关羽”的所有数据,最后将整理好的文字保存至“物流信息处理表.docx”文件中。

这次能够输出正确的结果,任务完成。
在这里插入图片描述

3对比分析

本来想让文心一言也完成这个任务,来对比一下的,哎···文心一言、一言难尽啊~~~

4 结束语

这次测试ChatGPT是一个国内的版本,免费,号称是基于ChatGPT3.5版本,就结果来说,已经是很厉害了,因此,学习和使用这样的工具,的确是提升生产效率的工具,未来基于AI的工作模式也一定要学会。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/4395.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

用ChatGPT做excel表格真香!只需动嘴提要求和复制粘贴

来源:量子位 前排提示:文末送书 托ChatGPT的福,梦想中让Excel自己统计数据,现在成真了。 △ 图源:抖音秦远国际物流 只需输入要求、数据,ChatGPT就能从头做个表。 想要增加行列、进行表内计算,通…

ChatGPT | Word表格整体输出

本文来自欧巴Godwin的博客 ,引用必须注明出处! 用LangChain读取Word和PDF的文字内容是好的,但如果内容包含表格则读取出来的内容完全没法看。用ChatGPT往往是做企业知识库,所以会出现一个场景,即员工想让ChatGPT讲解包…

postman发送post请求一直不成功

我的post请求方式 postman结果返回415 后台springboot拦截到的路径,此时发现url中存在error 解决方案: 第一步:添加头部 第二步:使用原生的json格式,点击send 返回的正确结果

Postman模拟大量请求

一、Postman Postman 是一个款 HTTP 请求模拟工具 二、请求演示 首先演示一下 Postman 最基本的使用,创建一个 Spring Boot 项目,测试的代码如下: import org.springframework.web.bind.annotation.GetMapping; import org.springframew…

(ChatGPT)429 You are being rate limited

我们在注册或者登录chatGPT时,网页时常会出现ChatGPT 429 You are being rate limited。当您尝试在短时间内向 ChatGPT API 发送过多请求时,通常会出现此错误消息。简单来说,系统无法处理您的请求。 本文提供一些解决方案,供参考…

微软杀疯了!全家桶嵌入ChatGPT,云平台Azure强到发指

【导读】微软又双叒出大招了!ChatGPT即将整合进Azure,谷歌一个月惨遭Triple Kill 2023刚开年,微软就杀疯了! 搜索引擎必应、办公全家桶Office、云计算平台Azure,相继加入当今最火爆AI语言模型——ChatGPT。 吓得谷…

刺激!微软或将ChatGPT加入Word、PPT和Excel全家桶!

点击下方卡片,关注“CVer”公众号 AI/CV重磅干货,第一时间送达 点击进入—>CV微信技术交流群 转载自:新智元 | 编辑:编辑部 【导读】微软又憋大招了,ChatGPT或将整合进Office,谷歌一周内破防两次&#x…

王炸!微软发布Visual ChatGPT:视觉模型加持ChatGPT实现丝滑聊天

近来,AI领域迎来各个领域的大突破,ChatGPT展现出强大的语言问答能力和推理能力,然而作为一个自然语言模型,它无法处理视觉信息。 与此同时,视觉基础模型如Visual Transformer或者Stable Diffusion等,则展现…

微软下个十年的想象力,藏在ChatGPT里

解释最新科技进展,报道硅谷大事小情 点击上方“硅星人”关注我们~ 押注AI再放大招,微软要把ChatGPT嵌入旗下全家桶。 —— 文|Juny 编辑|VickyXiao 老生常谈的人工智能技术,去年终于在应用领域迎来了一次久违的爆发。…

微软支持的ChatGPT激增,但不要低估苹果和谷歌

微软和 OpenAI 可能在 AI 聊天机器人爆炸式增长的市场中具有先发优势,但不要排除其他一些可以访问大量 AI 训练数据的科技巨头,例如 Apple 和 Google。 通过其对 ChatGPT 开发商 OpenAI 的早期和持续支持,微软在AI 军备竞赛中目前处于领先地…

ChatGPT火了!微软砍掉元宇宙

来源:数据观综合 编辑:蒲蒲 ChatGPT从2022年底火到现在,在全球范围内掀起热潮,风头甚至盖过了元宇宙。 近日,投资咨询机构瑞银发布的一项最新研究报告显示,仅仅发布两个月,ChatGPT月活跃用户已达…

两款语音合成助手,微软语音合成

一点红语音合成 By:zbb2012 语音合成算是吾爱中热度比较高的一类工具了 之前推荐过一款微软语音合成助手,不过由于长时间不更新现在也不怎么好用了 这款工具调用的Edge语音合成接口,效果跟声音类型都跟微软的差不多 比较棒的是没有字数限制…

OpenPie 和 ChatGPT 聊聊云上数据计算的那些事儿

要说时下科技圈最火的新技术话题,那就非 ChatGPT 莫属了。由它引发的各类 “人工智能(AI)能否取代人工” 的讨论狂飙不停,抛开法律和道德层面的争议,ChatGPT 确实可以准确地回答用户大部分的通用知识问题。那么大家是否…

爆火的ChatGPT太强了!写代码、改bug,网友:可取代Stack Overflow了

点击上方“Java基基”,选择“设为星标” 做积极的人,而不是积极废人! 每天 14:00 更新文章,每天掉亿点点头发... 源码精品专栏 原创 | Java 2021 超神之路,很肝~中文详细注释的开源项目RPC 框架 Dubbo 源码解析网络应…

基于C# .NetCore WebApi 接入ChatGPT 方法

1.新建一个.NetCore WebApi项目,演示是基于.Net Core 6 2.添加Nuget引用 OpenAi 3.新建一个控制器 ChatGPTController using Microsoft.AspNetCore.Mvc; using OpenAI_API; using OpenAI_API.Completions;namespace ChatGPTApi.Controllers {public class ChatGPTController : …

chatgpt怎么用

前言: 随着人工智能的不断发展,聊天型语言模型成为了人机交互领域的重要技术。其中,由OpenAI开发的ChatGPT以其出色的性能和广泛的应用领域引起了广泛关注。本文将介绍ChatGPT的概况、用途、使用方法以及其优势与限制,并展望了其…

ChatGPT Plus解放程序员双手?

近年来,随着人工智能技术的迅猛发展,各种智能工具和软件开始在各个行业中得到广泛应用,其中包括程序员使用的一些智能开发工具。ChatGPT Plus就是这样一款智能开发工具,它使用自然语言处理和机器学习等技术,可以为程序…

ChatGPT + MindShow 制作PPT

🍏🍐🍊🍑🍒🍓🫐🥑🍋🍉🥝 ChatGPT MindShow 制作PPT 文章目录 🍐具体操作🐳结语 🍐具体操作 ChatGP…

外媒报道,ChatGPT的漏洞可能暴露用户的个人信息

据国外媒体报道,2023年3月20日,OpenAI的ChatGPT出现全球性故障,引发了用户的担忧。然而,在发现服务中存在严重漏洞后,OpenAI主动披露有关漏洞的详细信息。 据分享的详情称,在注意到可能会侵犯用户隐私的漏…