ChatGPT生成文本检测器-task2

ChatGPT生成文本检测器-task2

news/2025/1/10 10:10:12/文章来源:https://blog.csdn.net/try763738799/article/details/131741577

#### 任务二：对数据集字符进行可视化，统计标签和字符分布

说明：在这个任务中，你需要使用Pandas库对数据集的字符进行可视化，并统计数据集中的标签和字符的分布情况，以便更好地理解数据集。
实践步骤：
1. 使用Pandas库读取和加载数据集。
2. 使用Pandas的可视化功能，如柱状图或饼图，对数据集的字符进行可视化展示。
3. 使用Pandas的统计功能，如value_counts()方法，统计数据集中的标签和字符的分布情况。

1.查看前十频数

import pandas as pd

train_data = pd.read_csv('./ChatGPT生成文本检测器公开数据-更新/train.csv')

test_data = pd.read_csv('./ChatGPT生成文本检测器公开数据-更新/test.csv')

# 对输入的内容进行处理

train_data['content'] = train_data['content'].apply(lambda x: x[1:-1].strip().replace('\n', ' \n '))

test_data['content'] = test_data['content'].apply(lambda x: x[1:-1].strip().replace('\n', ' \n '))

train_data['content'] = train_data['content'].apply(lambda x: x.split(' '))

test_data['content'] = test_data['content'].apply(lambda x: x.split(' '))

train_data['content'] = train_data['content'].apply(lambda x: [i for i in x if i != ''])

test_data['content'] = test_data['content'].apply(lambda x: [i for i in x if i != ''])

# print(train_data)

# 统计字符出现的频次并输出前10个最常见的字符

from collections import Counter

import seaborn as sns

import matplotlib.pyplot as plt

def huatu(data, ax, title):

c = Counter()

for content in data['content']:

c.update(content)

print(c.most_common(10))

x, y = zip(*c.most_common(10))

print(x, y)

for content in test_data['content']:

c.update(content)

# plotting columns

sns.barplot(x=list(x), y=list(y), ax=ax)

ax.set_title(title)

# creating subplots

ax, (train_ax, test_ax) = plt.subplots(2, 1, figsize=(10, 10))

huatu(train_data, train_ax, 'train')

huatu(test_data, test_ax, 'test')

plt.show()

2.正负比例：正负比例近似各占一半

def label_true_or_false_counts(data):

TrueAndFalse = data['label'].value_counts().tolist()

TrueRatio = TrueAndFalse[0]/data.shape[0]

print(TrueRatio)

FalseRatio = TrueAndFalse[1]/data.shape[0]

print(FalseRatio)

label_true_or_false_counts(train_data)

# 0.8454285714285714

# 0.15457142857142858

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/53038.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

ChatGPT生成文本检测器-task8

ChatGPT生成文本检测器-task8

#### 任务八：使用Word2Vec词向量，搭建BILSTM模型进行训练和预测说明：在这个任务中，你将使用Word2Vec词向量，搭建BILSTM模型进行文本分类的训练和预测，通过双向长短期记忆网络来进行文本分类。实践步骤&am…

阅读更多...

ChatGPT生成文本检测器-task1

ChatGPT生成文本检测器-task1

### 背景介绍近年来人工智能在自然语言处理领域取得了巨大的进展。其中一项引人注目的技术是生成模型，如OpenAI的GPT-3.5。这类模型通过学习大量的文本数据，具备了生成高质量文本的能力，从而引发了一系列关于文本生成真实性的讨论。正因为…

阅读更多...

Mac GoLand打不开（闪退）也不报错

Mac GoLand打不开（闪退）也不报错

Mac用过GoLand，电脑应用初始化后就打不开了，下其他版本也不行原因就是之前的配置文件还在需要清理： /Users/你的文件/Library/Preferences/ 配置文件在这个文件下

阅读更多...

MAC 有些网址可以 ping 通，但是浏览器打不开

MAC 有些网址可以 ping 通，但是浏览器打不开

MAC 访问外网网址打不开，因为平时开着 VPN，故开始逐步排查问题： 重启电脑ping ip切换网络改 DNS 方法都试过了在公司还是不行，但是在家里能连上最后解决办法是点击网络，新建位置就一切正常了。

阅读更多...

Mac有些网址打不开问题解决办法

Mac有些网址打不开问题解决办法

搜这个问题的兄嘚是不是遇到了这样的问题，大多数网页可以打开，但是某些网页确死活打不开，将连接发给朋友，人家秒开，很气，辣鸡Mac ，，，困扰了我这么久，&#xf…

阅读更多...

Mac上Chrome登录了LT网页打不开

Mac上Chrome登录了LT网页打不开

Mac上首先登陆了LT成功的时候上面的菜单栏会显示点亮状态的LT 可是过了一段时间，发现菜单栏上的LT不见了，此时发现浏览器打开其他的网页的时候打不开经过排查发现原因如下需要退出这个LT进程解决办法： 进入活动监视器，找到…

阅读更多...

解决Mac能上微信聊QQ但是打不开网页的问题

解决Mac能上微信聊QQ但是打不开网页的问题

解决Mac能上微信聊QQ但是打不开网页的问题 1.在访达中，前往文件夹 2.操作截图复制代码 /Library/Preferences/SystemConfiguration/com.apple.Boot.plist3.在SystemConfiguration文件夹里面 4.只要留下com.apple.Boot.plist文件，其他全部删掉&#xf…

阅读更多...

Mac 电脑能联网但打不开网页

Mac 电脑能联网但打不开网页

Mac 电脑能联网但打不开网页现象描述现象分析解决方法网络高级配置DNS 现象描述今天电脑出现一个奇怪的现象，可以连接上网络，钉钉和微信可以正常收发信息，但是浏览器却怎么也访问不了网页，断网重新连接依然没作用，这…

阅读更多...

mac和window电脑解决github打不开问题

mac和window电脑解决github打不开问题

一.mac电脑（mac电脑亲测有效） 1.新建一个访达窗口，同时按住shift command G三个键，进入前往文件夹页面 2.在输入框内输入/etc/hosts 3.找到hosts文件夹 4.由于hosts文件夹不可编辑，所以复制一份hosts文件先保存到本地桌…

阅读更多...

mac升级Monterey12.3 AccessClient打不开

mac升级Monterey12.3 AccessClient打不开

搜了一圈发现是由于新系统将python2运行库移除了。解决方案:进入application之后找到accessclient 进入Contents/Resources/Scripts，进入main.scpt文件中的python修改成python3。修改完之后进入bastion，点击堡垒机跳转发现还是闪退，不成功…

阅读更多...

未来Mac下载站怎么打不开了

未来Mac下载站怎么打不开了

重要公告： 未来软件园因业务需要现更换域名原域名：Mac.orsoon.com 更为新域名：未来mac下载-Mac软件-mac软件下载-mac软件大全程序已全面转移，请访问新域名

阅读更多...

解决GitHub打不开(FastGithub，支持MAC)

解决GitHub打不开(FastGithub，支持MAC)

前言最近在想在github上查阅框架源码，发现所有github相关网址都打不开，其实之前也有过，但是直接将https更换为www就能解决，这次抽风实在厉害，更改也无用(之前就是我懒的去找方法，得过且过，哈哈…

阅读更多...

【mac】MAC下phpstorm重装后打不开、闪退

【mac】MAC下phpstorm重装后打不开、闪退

原先装的是phpstorm2019.1破解版的。后面mac升级到mac12的版本, phpstorm就时不时的意外退出，特别是开启2个项目就挂了， 无奈只能把破解版的phpstorm2019.3删除了，然后从phpstormhttps://www.jetbrains.com.cn/phpstorm/promo/?audience2113…

阅读更多...

【Mac解决方案】打不开“XXX“，因为它不是从AppStore下载

【Mac解决方案】打不开“XXX“，因为它不是从AppStore下载

从亨亨猫官网下载亨亨猫去水印苹果Mac版本软件后，安装的时候提示： 解决方案下拉 Apple 菜单并选择“系统偏好设置”，选择“安全性与隐私”，选择“通用”选项卡。单击左下角的锁定图标，解锁。在“允许从以下位置下载…

阅读更多...

MAC突然打不开Notion，你遇到过这个问题吗？

MAC突然打不开Notion，你遇到过这个问题吗？

目录解决办法为什么Notion会突然打不开呢？ Notion是一款适合记录/规划的应用，而且页面简洁，模板强大，深得大家喜爱。我也经常在Notion上制定计划、记录学习笔记等。不过，今天突然打不开了，网页版、本地…

阅读更多...

macOS 提示“***.app打不开”解决办法

macOS 提示“***.app打不开”解决办法

检查 SIP 状态 csrutil statusenabled为开启状态，disabled为关闭状态使其关闭： csrutil disable使其开启： csrutil enable查看包内容在application文件夹中找到你打不开的应用程序>右键显示包内容>MacOS文件夹>找到你打不开的a…

阅读更多...

Mac 活动监视器打不开，一打开闪退

Mac 活动监视器打不开，一打开闪退

相信很多同胞都遇到这个问题，Mac本发热十分厉害，严重影响续航能力，又不知道是怎么回事，想打开活动监视器却打不开。花了很长时间终于在某个网站上我找到解决的方法。切换系统语言。添加English 切换地区即可之后重启。你会…

阅读更多...

MacBook Pro连接个人热点，能登录微信，却打不开网页问题

MacBook Pro连接个人热点，能登录微信，却打不开网页问题

一、问题描述今天我去现场办公，拿着自己的MacBook Pro到那之后，发现自己没有带转换头，无法使用现场指定的网线进行连接上网。所以，无奈之举只能使用个人热点。但是发现Mac连接热点后，只能登录微信，网页打…

阅读更多...

MacPro微信可以使用，其他应用均不能联网，浏览器网页也打不开

MacPro微信可以使用，其他应用均不能联网，浏览器网页也打不开

MacPro微信可以使用，其他应用均不能联网，浏览器网页也打不开问题描述解决办法问题描述 1.MacPro已连接WiFi，WiFi可用； 2.微信可正常使用，其他应用如Safari、芒果TV/腾讯视频等均无法联网； 3.重启两次以上…

阅读更多...

关于macbook只能登陆微信但无法打开网络的问题解决

关于macbook只能登陆微信但无法打开网络的问题解决

遇到的问题： macbook在连接网络之后，只能登陆微信和邮箱等第三方应用软件，但是无法在浏览器中打开任何网页。尝试过：重启、更换网络连接方式、浏览器类型之后仍然无法解决。网上找到的方法： 修改DNS（http…

阅读更多...

最新文章

推荐文章