(极好的机器学习案例)机器学习 入门实操~~

菜鸟学习法

由于我悟性不高,一般学习一个新的东西,对于初见的一些概念,很难理解其意。我总是喜欢先找个实实在在的例子,跟着跑一遍,看看流程、结果。然后再回过头来学习里面的种种算法和规则。我且称之为菜鸟学习法

我们不得不面对的是,现在机器学习、深度学习这些新的学习范式,已经闯入多个领域,也在颠覆这些领域。

感觉就像当年VASP等成熟软件的兴起一样,主流的商业软件淘汰了很多自己写代码算做量子计算的学者。接下来,机器学习的引入,各种新的软件也许马上会成为下一个“VASP”,手握资源的各路大佬都在抢占地盘。


抱歉,扯远了,我们回到学习机器学习的第一个阶段,代码测试:

案例链接

https://nbviewer.org/github/hackingmaterials/matminer_examples/blob/main/matminer_examples/machine_learning-nb/bulk_modulus.ipynb

数据集来源

数据来源于数据集 matminer,具体使用参考官网

https://hackingmaterials.lbl.gov/matminer

以及文档:

https://hackingmaterials.lbl.gov/matminer/dataset_summary.html

部分代码简单说明

1. 加载和处理数据集

from matminer.datasets.convenience_loaders import load_elastic_tensor
df = load_elastic_tensor()  # loads dataset in a pandas DataFrame object
  • 显示数据的开头部分使用head方法

df.head()

  • 显示数据的列

df.columns

  • 去掉不需要的列

unwanted_columns = ["volume", "nsites", 
"compliance_tensor","elastic_tensor", 
"elastic_tensor_original", "K_Voigt",
"G_Voigt", "K_Reuss", "G_Reuss"]
df = df.drop(unwanted_columns, axis=1)## 去掉不需要的列
df.head() #此时再观察一下这个数据集

  • 数据的描述性统计

df.describe()

2. 添加描述符(特征化)

  • 组成成分的特征化

from matminer.featurizers.conversions import StrToComposition
df = StrToComposition().featurize_dataframe(df, "formula")
df.head()

3. 线性回归

4. 随机森林

参考

大师兄科研网

https://mp.weixin.qq.com/s/U99hAXOsNob1sgAehIED3A

库的安装

一般直接使用
pip install 库名
就可以安装对应的库,我在自己电脑测试,使用pip install 比conda install这个方法好用。

简洁版测试代码下载

链接:https://pan.quark.cn/s/3b550442f061

ChatGPT 快问快答

或者读者也可以在ChatGPT里快问快答的形式学习简单的案例,也是一个不错的尝试。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/19410.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

天才数学家:陶哲轩甩出调教GPT-4聊天记录。。。

来源:量子位 天才数学家陶哲轩搞数学研究,已经离不开普通人手里的“数学菜鸡”GPT了! 就在他最新解决的一个数学难题下面,陶哲轩明确指出自己“使用了GPT-4”,后者给他提出了一种可行的解决方法。 借助GPT-4&#xff0…

人类和 AI 能够“双向奔赴”吗? | 近匠

作者 | 王启隆 责编 | 唐小引 出品 | 《新程序员》编辑部 在业界,每逢技术变革,就离不开技术布道者和科学家的身影,他们普及和阐释技术,在变革初期便预测未来技术的发展趋势。成立于 1993 年的全球软件及咨询公司 Thoughtworks…

攻防大牛在身边,这群白帽极客的故事太精彩!

在黑客电影里,神秘的黑客们在键盘上十指如飞,电脑屏幕成串代码飞快刷屏,静静操纵影响世界的走向。 在现实中,有一群白帽子黑客,与用技术恶意牟利的“黑帽子”相反,白帽子是正义的一方,“讲武德”…

人工智能轨道交通行业周刊-第34期(2023.2.13-2.19)

本期关键词:智慧地铁、枕簧检测选配机器人、智慧工地、接触网检修、工业缺陷检测 1 整理涉及公众号名单 1.1 行业类 RT轨道交通人民铁道世界轨道交通资讯网铁路信号技术交流北京铁路轨道交通网上榜铁路视点ITS World轨道交通联盟VSTR铁路与城市轨道交通RailMetro…

大脑将会代替开发者的键盘!人类和 AI 能够“双向奔赴”吗? | 近匠

作者 | 王启隆 责编 | 唐小引 出品 | 《新程序员》编辑部 在业界,每逢技术变革,就离不开技术布道者和科学家的身影,他们普及和阐释技术,在变革初期便预测未来技术的发展趋势。成立于 1993 年的全球软件及咨询公司 Thoughtworks…

最新微软薪资曝光,Run去美国还是好选择吗?

2021 年,国内大厂降薪、裁员消息频出。 美国用工荒,科技行业的人才招聘也出现困难,作为市值在全球名列前茅的公司,微软似乎并未受到影响,公司员工人数在今年增加了 2.3 万人。 目前在全世界,微软有大约 1…

微软在盈利前确认裁员

近几个月来,大大小小的科技公司都放慢了招聘计划或宣布裁员,以抵御可能出现的经济衰退,央行官员一直试图通过提高利率来抵御这种衰退。这种转变降低了投资者对微软等成长型股票的兴趣,微软的股价自今年年初以来下跌了约 22%&#…

如何通过tushare接口获取股票数据?

如何安装数据接口的过程: 1.先直接在python里面试了一下,发现是import不进来的,如图: 2.打开anaconda中的prompt界面,输入pip install tushare,来安装这个模块,安装过程如图: 3.安装…

通达信接口怎么样抓取股票实时数据?

通达信接口怎么样抓取股票实时数据?股票爬取接口在股票交易中常常使用到的一些辅助工具,股票爬取接口主要是利用l1和l2接口来执行获取股票实时行情数据的原理,将自己需要查询的需求就可以在接口软件上搜索就可以很快的获取数据了。那么&#…

金士顿服务器内存条型号解读,金士顿标签含义,如何鉴别真假?

4、内存真假难辨,想知道内存条上的每个字母是不是也有真假之分?每个字母代表什么含义?希望以金士顿为例子讲解一下。 造假者都有一个共性:只要那个品牌被消费者所青睐,他们就会伺机而动,疯狂仿冒。金士顿作…

ChatGPT有用到知识图谱吗?它自己是这样回答...

从搜索引擎到个人助手,我们每天都在使用问答系统。问答系统必须能够访问相关的知识并进行推理。通常,知识可以隐式地编码在大型语言模型(LLMs)中,例如ChatGPT、T5 和LaMDA 等大型语言模型,这些模型在未结构…

蚂蚁集团面试复盘 | 面试题复习

蚂蚁实习一面复盘总结4.13 算法题 1、设计一个算法,求第k个最大的数; 直接排序求第k个使用选择排序、冒泡排序、插入排序等排到第k个就返回更快的方法:快排的分治法、最小堆最大堆法,当场写出来还是很难的 2、写单例模式 面试…

重磅发布:2023产业互联网安全十大趋势

3月21日,中国产业互联网发展联盟、《中国信息安全》杂志、南方日报、中国网络空间新兴技术创新论坛、腾讯安全、腾讯研究院联合推出《2023产业互联网安全十大趋势》。 报告汇聚了中国产业互联网发展联盟常务副秘书长陈胜喜、《中国信息安全》杂志社执行董事温哲、南…

点击劫持:CSP frame-ancestors 缺失

点击劫持:CSP frame-ancestors 缺失 什么是Content Security Policy(CSP)启用CSP的两种方法CSP的实例CSP指令介绍限制选项default-src 点击劫持:CSP frame-ancestors 缺失参考 什么是Content Security Policy(CSP&…

chatgpt赋能python:Python如何进行DOS攻击

Python如何进行DOS攻击 随着互联网技术的快速发展,网络攻击也越来越普遍。其中,DOS攻击是一种常见的攻击方式,可以导致目标服务器无法正常工作。Python作为一种高效且易于使用的编程语言,可以用于编写DOS攻击脚本,造成…

账号和权限管理

用户帐号类型 计算机系统帐户的分类帐户共有三种类型 超级用户 指创建者用户 超级用户帐户通常称为root. 可以不受限制地管理系统,并且系统用户可以运行服务. 普通用户帐户由登录并使用系统的真实用户(人员)使用. 超级用户帐户通常称为root,您可以重新…

他们开源了GitHub上最火的双语对话模型,还说AI胡说八道不需要被纠正

衡宇 发自 凹非寺量子位 | 公众号 QbitAI 国产对话机器人ChatGLM,和GPT-4诞生于同一天。 由智谱AI和清华大学KEG实验室联合推出,开启alpha内测版。 这个巧合让智谱AI创始人兼CEO张鹏有一种说不清的复杂感觉。但看到技术被OpenAI做到这么牛,这…

2023爱分析 · 认知智能厂商全景报告 | 爱分析报告

报告编委 黄勇 爱分析合伙人&首席分析师 李进宝 爱分析高级分析师 陈元新 爱分析分析师 目录 1. 研究范围定义 2. 市场洞察 3. 厂商全景地图 4. 市场分析与厂商评估 5. 入选厂商列表 1. 研究范围定义 研究范围 人工智能的发展分为三个阶段——计算…

比尔·盖茨:AI时代已经开启,GPT是40年来最具革命性技术

Datawhale干货 选自:GatesNotes,来源:机器之能 比尔・盖茨表示:人工智能革命重要程度不亚于手机和互联网的诞生。 周二,微软公司创始人比尔・盖茨在他的博客 GatesNotes 中盛赞 OpenAI 的 GPT 模型,称其是…

ChatGPT就这样来了,你不接受它的话,时代就不接受你了

这一波来的太突然了,上个月还在聊ChatGPT会不会替代一部分人的工作,现在就已经发生了。这个周末两天没休息,周六见了在国内最大的ERP软件公司做了十几年的几个朋友,周日见了互联网的几个朋友,包括互联网大厂和游戏公司…