Python在文件中对字母、单词频度统计

Python在文件中对字母、单词频度统计

news/2024/12/24 1:03:09/文章来源:https://blog.csdn.net/qq_64296768/article/details/132412729

读入给定的文本文件“hamlet.txt”，编写两个函数分别实现:

1) 统计所有字母的出现频度,依据频度从高到低，显示前5个字母及其频度，同时把结果写入文件“hamlet_字母频度.txt”。

2) 统计所有单词的出现频度,依据频度从高到低，显示前10个单词及其频度，同时把结果写入文件“hamlet_单词频度.txt”。

import re
from collections import Counter
f=open("hamlet.txt", "r", encoding="utf-8")
line = f.readlines()
f.close()
txt = ""
for i in line:txt += i
txt=txt.lower()
def Read01():letters = ""for i in txt:if i.islower():letters+=iletterf = Counter(letters)letterf = sorted(letterf.items(), key=lambda x:x[1], reverse=True)of = open("./hamlet_字母频度.txt", 'w')print(letterf, file=of)of.close()print("字母频度:")counts = 0for i in letterf:counts += 1if counts > 5:breakprint(i)def Read02():words = re.split("[,， |\n]",txt)words_ = []for w in words:if re.match(r'[A-Za-z0-9_]', w):words_.append(w)wordf = Counter(words_)wordf = sorted(wordf.items(), key=lambda x: x[1], reverse=True)of = open("./hamlet_单词频度.txt", 'w')print(wordf, file=of)of.close()print("单词频度:")counts=0for i in wordf:counts+=1if counts > 10:breakprint(i)
Read01()
print("*"*50)
Read02()

字母频度统计数据：

单词频度统计数据：

运行结果：

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/101032.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

MyBatis的动态语句且如何实现模糊查询及MyBatis的结果映射---详细介绍

MyBatis的动态语句且如何实现模糊查询及MyBatis的结果映射---详细介绍

前言前面我们学习了如何使用Mybatis实现简单的增删改查。今天我们来学习如何使用动态语句来根据不同的条件生成不同的SQL语句。这在实际开发中非常有用，因为通常查询条件是多样化的，需要根据实际情况来拼接SQL语句，那什么是MyBatis动态语句呢…

阅读更多...

生物识别技术与身份认证：探讨生物识别技术在强化身份认证和访问控制方面的应用

生物识别技术与身份认证：探讨生物识别技术在强化身份认证和访问控制方面的应用

第一章：引言在数字化时代，随着信息技术的飞速发展，身份认证和访问控制变得越来越重要。传统的用户名和密码方式逐渐暴露出安全性不足的问题，为此，生物识别技术应运而生。生物识别技术利用人体生物特征来识别个体身份…

阅读更多...

解决IDEA tomcat控制台只有server日志

解决IDEA tomcat控制台只有server日志

解决IDEA tomcat控制台只有server日志确认tomcatxxx/conf/logging.properties文件是否存在，存在就会有。前提是在run configuration配置了打印多个日志

阅读更多...

CSSCI、北核期刊投稿指南（2023年更新）

CSSCI、北核期刊投稿指南（2023年更新）

该数据为经管类的期刊投稿指南，包含发表难度，文章数量，影响因子，用户评价等指标。共5份文件，分别为国内所有期刊信息库、投稿指南（CSSCI版本、CSSCI扩展版本、北大核刊版本、建议期刊版本） 一、…

阅读更多...

[.NET/WPF] CommunityToolkit.Mvvm 异步指令

[.NET/WPF] CommunityToolkit.Mvvm 异步指令

我们在开发中, 经常会有这样的需求: 点击按钮后, 进行一些耗时的工作工作进行时, 按钮不可再次被点击工作进行时, 会显示进度条, 或者 “加载中” 的动画 RelayCommand CommunityToolkit.Mvvm 中的 RelayCommand 除了支持最简单的同步方法, 还支持以 Task 作为返回值的异步方…

阅读更多...

一文详解4种聚类算法及可视化（Python）

一文详解4种聚类算法及可视化（Python）

在这篇文章中，基于20家公司的股票价格时间序列数据。根据股票价格之间的相关性，看一下对这些公司进行聚类的四种不同方式。苹果（AAPL），亚马逊（AMZN），Facebook（META&…

阅读更多...

OPTEE3.17+ubuntu20.04+qemu_v8搭建OPTEE开发环境

OPTEE3.17+ubuntu20.04+qemu_v8搭建OPTEE开发环境

参考文章： https://blog.csdn.net/capodexi/article/details/123548850 https://blog.csdn.net/qq_42557044/article/details/130973200 https://blog.csdn.net/zhuwade/article/details/125513873 https://zhuanlan.zhihu.com/p/521196386 https://blog.csdn.net/…

阅读更多...

Stable Diffusion的使用以及各种资源

Stable Diffusion的使用以及各种资源

Stable Diffsuion资源目录 SD简述sd安装模型下载关键词，描述语句插件管理controlNet自己训练模型 SD简述 Stable Diffusion是2022年发布的深度学习文本到图像生成模型。它主要用于根据文本的描述产生详细图像，尽管它也可以应用于其他任务，如…

阅读更多...

数据暴涨时代，该如何数据治理？_光点科技

数据暴涨时代，该如何数据治理？_光点科技

随着信息技术的迅猛发展，数据已经成为现代社会的核心资源。在这个被称为"数据暴涨时代"的时代里，大量的数据源源不断地被产生和积累，但如何有效地管理、分析和利用这些数据成为了一个迫切需要解决的问题。数据治理，作为…

阅读更多...

C#学习....

C#学习....

1.基础 //引用命名空间using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.Threading.Tasks;//项目名或者命名空间 namespace _01_MY_First_Demo {//Program类class Program{//程序的主入口或者Main函数static void Main(S…

阅读更多...

常见的网络设备有哪些？分别有什么作用？

常见的网络设备有哪些？分别有什么作用？

个人主页：insist--个人主页本文专栏：网络基础——带你走进网络世界本专栏会持续更新网络基础知识，希望大家多多支持，让我们一起探索这个神奇而广阔的网络世界。目录一、网络设备的概述二、常见的网络设备 1、…

阅读更多...

【高危】MarkText＜=0.17.1 存在DOM型XSS漏洞（CVE-2023-2318）

【高危】MarkText＜=0.17.1 存在DOM型XSS漏洞（CVE-2023-2318）

漏洞描述 MarkText 是热门的开源Markdown编辑器，覆盖Windows/Linux/MacOS平台。 MarkText 0.17.1及之前版本中的 pasteCtrl 类未对用户可控的 HTML 内容进行过滤，当用户将攻击者可控的 HTML 代码粘贴至 MarkText 编辑器中时，攻击者可利用DO…

阅读更多...

uni-app中监听网络状态，并在嵌入webView页面的组件中添加网络监测

uni-app中监听网络状态，并在嵌入webView页面的组件中添加网络监测

uni-app中监听网络状态，并在嵌入webView页面的组件中添加网络监测 uni-app中监听网络状态下载插件打开网络异常组件页面，点击"下载插件并导入HBuilderX"按钮，打开HBuilderX软件后，选择需要导入插件的项目&#xff…

阅读更多...

selenium +Jmeter 的性能测试

selenium +Jmeter 的性能测试

通过Jmeter快速将已有的Selenium 代码以性能测试的方式组织起来，并使用JMeter 丰富的报表展示测试结果 from selenium import webdriver from selenium.webdriver.common.action_chains import ActionChains from selenium.webdriver.common.by import By driver …

阅读更多...

第3步---MySQL的DDL和DML操作

第3步---MySQL的DDL和DML操作

第3步---MySQL的DDL和DML操作 1.DDL操作 Data Defination Language 数据定义语言。创建数据库和表的不涉及到数据的操作。 1.1DDL基本操作 1.1.1数据库相关操作 ddl：创建数据库，创建和修改表对数据库常见的操作： 操作数据库 -- 展示数据…

阅读更多...

C语言小练习（二）

C语言小练习（二）

🌞 “去努力吧，最坏的结果不过是大器晚成！” Day02 📝 一.选择题📝二.编程题 📝 一.选择题 1.🎈、以下程序段的输出结果是（ ） #include <stdio.h> int main() {…

阅读更多...

【C语言】三子棋游戏——超细教学

【C语言】三子棋游戏——超细教学

🚩纸上得来终觉浅， 绝知此事要躬行。 🌟主页：June-Frost 🚀专栏：C语言 🔥该篇将结合之前的知识来实现三子棋游戏。目录： 🌟思路框架：测试游戏 &#x1f31f…

阅读更多...

python爬虫9：实战2

python爬虫9：实战2

python爬虫9：实战2 前言 python实现网络爬虫非常简单，只需要掌握一定的基础知识和一定的库使用技巧即可。本系列目标旨在梳理相关知识点，方便以后复习。申明本系列所涉及的代码仅用于个人研究与讨论，并不会对网站产生不好…

阅读更多...

微服务基础概念【内含图解】

微服务基础概念【内含图解】

目录拓展补充： 单体架构分布式架构面向服务的体系结构云原生微服务架构什么是微服务？ 微服务定义拓展补充： 单体架构单体架构：将业务的所有功能集中在一个项目中开发，最终打成一个包部署优点&#x…

阅读更多...

leetcode1094. 拼车(差分数组-java)

leetcode1094. 拼车(差分数组-java)

差分数组 leetcode 1094 拼车差分数组代码演示： 前缀和数组 leetcode 1094 拼车难度 - 中等原题链接 - 拼车车上最初有 capacity 个空座位。车只能向一个方向行驶（也就是说，不允许掉头或改变方向） 给定整数 capacity 和一个数…

阅读更多...

最新文章

推荐文章