人工智能数据分析Python常用库 01 time、random、collections、itertools库

文章目录

  • 一、time库
    • 1、获取现在时间
    • 2、时间戳与计时器
    • 3、格式化
    • 4、睡眠
  • 二、random库
    • 1、随机种子
    • 2、产生随机整数
    • 3、产生随机浮点数
    • 4、随机序列
    • 5、概率分布——以高斯分布为例
  • 三、collections库——容器数据类型
    • 1、namedtuple——具名元组
      • (1)定义方法
      • (2)可以调用属性
      • (3)有元组的性质
      • (4)是元组的子类
    • 2、Counter——计数器工具
      • (1)示例
      • (2)是字典的一个子类
      • (3)统计最常见元素
      • (4)元素展开
      • (5)加减操作
    • 3、deque——双向队列
  • 四、itertools库——迭代器
    • 1、排列组合迭代器
      • (1)product——笛卡尔积
      • (2)permutations——排列
      • (3)combinations——组合
      • (4)combinations_with_replacement——元素可重复组合
    • 2、拉链
      • (1)zip——短拉链
      • (2)zip_longest——长拉链
    • 3、无穷迭代器
      • (1)count(start=0,step=1)——计数
      • (2)cycle(iterable)——循环
      • (3)repeat(object [,times])——重复
    • 4、其他
      • (1)chain(iterables)——锁链
      • (2)enumerate(iterable,start=0)——枚举(python内置)
      • (3)groupby(iterable, key=None)——分组

一、time库

1、获取现在时间

import time# 结构化时间
print(time.localtime()) # 本地时间
print(time.gmtime())    # UTC世界统一时间
# 北京时间比统一时间UTC早8个小时print(time.ctime()) # Sun Mar 17 15:25:51 2024 返回本地时间的字符串

2、时间戳与计时器

time.time():float型,返回从19700101 00:00:00开始的秒数
time.perf_counter():float型,随意选取一个时间点,记录现在时间到该时间点的间隔秒数,记录sleep
time.process_time():float型,随意选取一个时间点,记录现在时间到该时间点的间隔秒数,不记录sleep
time.perf_counter()比time()精度更高一些

import timet1_start = time.time()
t2_start = time.perf_counter()
t3_start = time.process_time()print(t1_start)
print(t2_start)
print(t3_start)res = 0
for i in range(100000):res += i
time.sleep(5)
t1_end = time.time()
t2_end = time.perf_counter()
t3_end = time.process_time()print("t1:",t1_end-t1_start)
print("t2:",t2_end-t2_start)
print("t3:",t3_end-t3_start)'''
1710695283.7847786
0.6724354
0.671875
t1: 5.0264506340026855
t2: 5.026069
t3: 0.015625
'''

3、格式化

print(time.strftime("%X",time.localtime())
)
# 01:13:08

4、睡眠

time.sleep(秒数)

二、random库

random库提供了各种伪随机数。

1、随机种子

(1)相同种子会产生相同的随机数。
(2)如果不设置随机种子,以系统当前时间为默认值

from random import *
seed(10)
print(random()) # 0.5714025946899135
seed(10)
print(random()) # 0.5714025946899135print(random()) # 0.4288890546751146

2、产生随机整数

(1)randint(a,b) 产生[a,b]之间的随机整数
(2)randrange(a) 产生[0,a)之间的随机整数
(3)randrange(a,b,step) 产生(a,b)之间以step为步长的随机整数

from random import *nums1 = [randint(1,4) for i in range(5)]
print(nums1)    # [2, 3, 3, 4, 1]nums2 = [randrange(1,4) for i in range(5)]
print(nums2)    # [1, 2, 2, 1, 1]nums3 = [randrange(1,4,2) for i in range(5)]
print(nums3)    # [1, 1, 1, 3, 3]

3、产生随机浮点数

(1)random() 产生[0.0, 1.0)之间的随机浮点数
(2)uniform(a, b) 产生[a,b]之间的随机浮点数

from random import *nums1 = [random() for i in range(3)]
print(nums1)    # [0.8185405295924474, 0.3084685502649297, 0.6473292231282459]nums2 = [uniform(1,2) for i in range(3)]
print(nums2)    # [1.5584797693674464, 1.7587782534434675, 1.7008288028686036]

4、随机序列

(1)choice(seq) 从序列类型中随机返回一个元素
(2)choices(seq, weights= None, k) 对序列进行k次有放回采样,可设置权重
(3)shuffle(seq) 将序列中元素随机排列,返回打乱后的序列
(4)sample(seq,k) 从seq中随机选取k个元素,无放回采样,以列表类型返回。

from random import *seq1 = choice(["win","lose","draw"])
print(seq1) # loseseq2 = choices(["win","lose","draw"],[4,4,2],k=5)
print(seq2) # ['lose', 'win', 'win', 'draw', 'win']ls = ["win","lose","draw"]
shuffle(ls)
print(ls)   # ['win', 'draw', 'lose']seq4 = sample(["win","lose","draw"],3)
print(seq4) # ['draw', 'win', 'lose']

5、概率分布——以高斯分布为例

gauss(mean, std) 产生一个平均值mean,标准差std,符合高斯分布的随机数

from random import *
import matplotlib.pyplot as plt
res = [gauss(0,1) for i in range(10000)]plt.hist(res, bins=1000) # bins=1000表示将数据分成1000个区间统计
plt.show()

在这里插入图片描述

三、collections库——容器数据类型

1、namedtuple——具名元组

就是给元组起个名字。namedtuple是元组的子类。

(1)定义方法

namedtuple(typename, field_names, *, rename=False, defaults=None, module=None)
typename:元组名字 field_names:域名

import collectionsPont = collections.namedtuple("Point",["x","y"])
p = Pont(1,y=2)
print(p)    # Point(x=1, y=2)

(2)可以调用属性

print(p.x)  # 1

(3)有元组的性质

print(p[1])  # 2
a,b = p
print(a,b)  # 1 2

(4)是元组的子类

print(isinstance(p,tuple))  # True

2、Counter——计数器工具

(1)示例

from collections import Counters = "我爱人人人人爱我"
cnt_s = Counter(s)
print(cnt_s)    # Counter({'人': 4, '我': 2, '爱': 2})

(2)是字典的一个子类

print(isinstance(cnt_s,dict))   # True

(3)统计最常见元素

cmmn = cnt_s.most_common(2)
print(cmmn) # [('人', 4), ('我', 2)]

(4)元素展开

print(list(cnt_s.elements()))
# ['我', '我', '爱', '爱', '人', '人', '人', '人']

(5)加减操作

s1 = Counter(a=1,b=3)
s2 = Counter(a=2,c=4)
s3 = s1+s2
print(s3)   # Counter({'c': 4, 'a': 3, 'b': 3})

3、deque——双向队列

双向队列可以方便地在队列两边高效、快速地增加和删除元素

from collections import dequed = deque("cde")d.append("1")       # 右端增加
d.append("2")       # 右端增加
d.appendleft("a")   # 左端增加
d.appendleft("b")   # 左端增加
print(d)    # deque(['b', 'a', 'c', 'd', 'e', '1', '2'])d.pop()     # 右端删除
d.popleft() # 左端删除
print(d)    # deque(['a', 'c', 'd', 'e', '1'])

四、itertools库——迭代器

1、排列组合迭代器

(1)product——笛卡尔积

import itertoolsfor i in itertools.product("ABC","01"):print(i)'''
('A', '0')
('A', '1')
('B', '0')
('B', '1')
('C', '0')
('C', '1')
'''
import itertoolsfor i in itertools.product("AB",repeat=3):print(i)
'''
('A', 'A', 'A')
('A', 'A', 'B')
('A', 'B', 'A')
('A', 'B', 'B')
('B', 'A', 'A')
('B', 'A', 'B')
('B', 'B', 'A')
('B', 'B', 'B')
'''

(2)permutations——排列

import itertoolsfor i in itertools.permutations("ABC",2):  # 2是排列的长度print(i)
'''
('A', 'B')
('A', 'C')
('B', 'A')
('B', 'C')
('C', 'A')
('C', 'B')
'''
import itertoolsfor i in itertools.permutations(range(3)):  # 不指定长度,默认是第一个参数的长度print(i)
'''
(0, 1, 2)
(0, 2, 1)
(1, 0, 2)
(1, 2, 0)
(2, 0, 1)
(2, 1, 0)
'''

(3)combinations——组合

import itertoolsfor i in itertools.combinations("ABCD",2):  # 2是组合的长度print(i)
'''
('A', 'B')
('A', 'C')
('A', 'D')
('B', 'C')
('B', 'D')
('C', 'D')
'''
import itertoolsfor i in itertools.combinations(range(4),2):print(i)
'''
(0, 1)
(0, 2)
(0, 3)
(1, 2)
(1, 3)
(2, 3)
'''

(4)combinations_with_replacement——元素可重复组合

import itertoolsfor i in itertools.combinations_with_replacement("ABC",2): # 2是组合的长度print(i)
'''
('A', 'A')
('A', 'B')
('A', 'C')
('B', 'B')
('B', 'C')
('C', 'C')
'''
import itertoolsfor i in itertools.product("ABC",repeat=2):print(i)
'''
('A', 'A')
('A', 'B')
('A', 'C')
('B', 'A')
('B', 'B')
('B', 'C')
('C', 'A')
('C', 'B')
('C', 'C')
'''

2、拉链

(1)zip——短拉链

长度不一时,执行到最短的对象处,就停止

for i in zip("ABCD","012","xyz"):   # zip是python内置函数print(i)'''
('A', '0', 'x')
('B', '1', 'y')
('C', '2', 'z')
'''

(2)zip_longest——长拉链

长度不一致时,执行到最长的对象处,就停止,缺省元素用None或指定字符替代。

import itertoolsfor i in itertools.zip_longest("ABC","01"):print(i)'''
('A', '0')
('B', '1')
('C', None)
'''
import itertoolsfor i in itertools.zip_longest("ABC","01",fillvalue="*"):print(i)'''
('A', '0')
('B', '1')
('C', '*')
'''

3、无穷迭代器

(1)count(start=0,step=1)——计数

创建一个迭代器,它从start值开始,返回均匀间隔的值

import itertoolsit = itertools.count(step=2)
print(it.__next__())    # 0
print(it.__next__())    # 2
print(it.__next__())    # 4

(2)cycle(iterable)——循环

创建一个迭代器,返回iterable中所有元素,无限重复

import itertoolsit = itertools.cycle("AB")
print(it.__next__())    # A
print(it.__next__())    # B
print(it.__next__())    # A

(3)repeat(object [,times])——重复

创建一个迭代器,不断重复object,除非设定参数times,否则将无限重复

import itertoolsit = itertools.repeat(4,3)
print(it.__next__())    # 4
print(it.__next__())    # 4
print(it.__next__())    # 4
print(it.__next__())    # 触发异常 StopIteration

4、其他

(1)chain(iterables)——锁链

把一组迭代对象串联起来,形成一个更大的迭代器

import itertoolsfor i in itertools.chain("ABC",[1,2]):print(i)'''
A
B
C
1
2
'''

(2)enumerate(iterable,start=0)——枚举(python内置)

产出由两个元素组成的元组,结构是(index, item),其中index从start开始,item从iterable中取。

for i in enumerate("ABC",start=1):print(i)
'''
(1, 'A')
(2, 'B')
(3, 'C')
'''

(3)groupby(iterable, key=None)——分组

创建一个迭代器,按照key指定的方式,返回iterable中连续的键和组
一般来说,要预先对数据进行排序
key为None,默认把连续重复元素分组

import itertoolsanimals = ["duck", "eagle", "rat", "giraffe", "bear"\"bat", "dolphin", "shark", "lion"]
animals.sort(key=len)   # 元素按长度排序
for key, group in itertools.groupby(animals, key=len):print(key, list(group))'''
3 ['rat']
4 ['duck', 'lion']
5 ['eagle', 'shark']
7 ['giraffe', 'bearbat', 'dolphin']
'''

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/280037.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

YOLO_you only look once

前言 计算机图形学的课程即将结束,我需要提交一份关于YOLO模型的学习报告。在这段时间里,我对YOLO进行了深入的学习和研究,并记录下了我的学习过程和心得体会。本文将详细介绍YOLO模型的原理、优缺点以及应用领域,希望能够为后续…

Day11:栈 LeedCode 20.有效的括号 1047. 删除字符串中的所有相邻重复项 150. 逆波兰表达式求值

20.有效的括号 给定一个只包括 (,),{,},[,] 的字符串 s ,判断字符串是否有效。 有效字符串需满足: 左括号必须用相同类型的右括号闭合。左括号必须以正确的顺序闭合。每个右括号都有一个对应的…

使用stream流合并多个List(根据实体类特定属性合并)

开发情景 现有多个List集合,其中都是一样的实体类,这里我想根据实体类的特定属性将它们合并在一起,形成一个最终的List集合。 这里主要用到了Stream流的flatMap方法与reduce方法。 flatMap:可以将多个Stream流合并在一起,形成一个Stream流。 reduce:可以将Stram流中的元…

基于Java+Springmvc+vue+element实现高校心理健康系统详细设计和实现

基于JavaSpringmvcvueelement实现高校心理健康系统详细设计和实现 博主介绍:多年java开发经验,专注Java开发、定制、远程、文档编写指导等,csdn特邀作者、专注于Java技术领域 作者主页 央顺技术团队 Java毕设项目精品实战案例《1000套》 欢迎点赞 收藏 ⭐…

Ubuntu Flask 运行 gunicorn+Nginx 部署

linux Ubuntu 下运行python 程序出现killed 原因:CPU或内存限制:在华为云上,你可能有CPU或内存使用的限制。例如,如果你使用的是一个固定大小的实例,那么超过该实例的CPU或内存限制可能会导致进程被杀死。 参考&am…

【Sql Server】通过Sql语句批量处理数据,使用变量且遍历数据进行逻辑处理

欢迎来到《小5讲堂》,大家好,我是全栈小5。 这是《Sql Server》系列文章,每篇文章将以博主理解的角度展开讲解, 特别是针对知识点的概念进行叙说,大部分文章将会对这些概念进行实际例子验证,以此达到加深对…

55、服务攻防——数据库安全RedisHadoopMysql未授权访问RCE

文章目录 常见服务应用的安全测试: 配置不当——未授权访问安全机制——特定安全漏洞安全机制——弱口令爆破攻击 应用服务安全测试流程: 判断服务开放情况——端口扫描&组合猜解等 端口扫描:服务开放,绑定端口没开放&#…

hot100 -- 矩阵

👂 Peter Pan - kidult. - 单曲 - 网易云音乐 👂 Bibliothque(图书馆) - Jasing Rye - 单曲 - 网易云音乐 目录 🌼前言 🌼二分模板 🎂矩阵置零 AC 标记数组 AC 标记变量 🚩…

Java使用Selenium实现自动化测试以及全功能爬虫

前言 工作中需要抓取一下某音频网站的音频,我就用了两个小时学习弄了一下,竟然弄出来,这里分享记录一下。 springboot项目 Selenium Java使用Selenium实现自动化测试以及全功能爬虫 前言1 自动化测试2 java中集成Selenium3 添加浏览器驱动4…

Word2vec 学习笔记

word2vec 学习笔记 0. 引言1. Word2vec 简介1-1. CBOW1-2. SG 2. 实战 0. 引言 最近研究向量检索,看到有同事使用 MeCab、Doc2Vec,所以把 Word2vec 这块知识学习一下。 1. Word2vec 简介 Word2vec 即 word to vector,顾名思义,…

【老话常谈之Java自学】自学Java应该怎么规划学习内容?

如果你学Java的目的是为了找到一份好工作 问这个问题之前,首先你确保自己了解了这些: IT行业都有哪些技能适合转行学习?每个技术都是做什么的?每个技术行业发展是怎样的?薪资怎么样?根据自己的情况和兴趣,选择到感兴趣的1-2个技术深入了解最终确定你就要学Java,并且有…

如何在代理的IP被封后立刻换下一个IP继续任务

目录 前言 1. IP池准备 2. 使用代理IP进行网络请求 3. 处理IP被封的情况 4. 完整代码示例 总结 前言 当进行某些网络操作时,使用代理服务器可以帮助我们隐藏真实IP地址以保护隐私,或者绕过一些限制。然而,经常遇到的问题是代理的IP可能…

Django框架的全面指南:从入门到高级【第128篇—Django框架】

👽发现宝藏 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。【点击进入巨牛的人工智能学习网站】。 Django框架的全面指南:从入门到高级 Django是一个高效、功能强大的Python Web框…

JDK21虚拟线程

目录 虚拟线程 话题 什么是平台线程? 什么是虚拟线程? 为什么要使用虚拟线程? 创建和运行虚拟线程 使用线程类和线程创建虚拟线程。生成器界面 使用Executor.newVirtualThreadPerTaskExecutor()方法创建和运行…

针对BSV区块链新推出的网络访问规则NAR和警报系统AS的解释与问答

​​发表时间:2024年2月22日 BSV区块链社区团队最近开设了一个Twitter(X)话题空间,讨论BSV区块链协会最新推出的网络访问规则和警报系统的相关问题。 本次讨论由BSV区块链社区负责人Brett Banfe主持,以便社区成员更好…

刷题DAY29 | LeetCode 491-递增子序列 46-全排列 47-全排列 II

491 递增子序列(medium) 给你一个整数数组 nums ,找出并返回所有该数组中不同的递增子序列,递增子序列中 至少有两个元素 。你可以按 任意顺序 返回答案。 数组中可能含有重复元素,如出现两个整数相等,也…

综合练习(python)

前言 有了前面的知识积累,我们这里做两个小练习,都要灵活运用前面的知识。 First 需求 根据美国/英国各自YouTube的数据,绘制出各自的评论数量的直方图 第一版 import numpy as np from matplotlib import pyplot as plt import matplo…

matlab中Signal Editor定义梯形信号输出矩形信号

matlab中Signal Editor定义梯形信号输出矩形信号,可以通过如下勾选差值数据实现梯形信号输出。

文件路径中‘/’与‘\’用法详解,与等效使用方法介绍

1、两种符号详解 在数据处理时,使用C或python语言读入数据时,涉及到文件路径的输入,文件路径在windows下,默认形式为但斜线‘\’,如下图: 若输入路径时,直接写成如下形式:“E:\codin…

JMeter 二次开发之环境准备

通过JMeter二次开发,可以充分发挥JMeter的潜力,定制化和扩展工具的能力以满足具体需求。无论是开发自定义插件、函数二次开发还是定制UI,深入学习和掌握JMeter的二次开发技术,将为接口功能测试/接口性能测试工作带来更多的便利和效…