python糖尿病数据挖掘

有人说21世纪,我们的生活越来越便捷,电子通讯越来越发达,美食越来越多。这一点也不假。但现代生活方式也有不利一面,工作越来越忙,身体锻炼越来越少,体重一天一天增加。有一种疾病叫做糖尿病,你们听说过吗?

餐饮行业为了增加销售量,会增加食物食盐量。这样可以满足顾客重口味。

饮料厂商为了增加销售量,在饮料里添加不少糖分(碳水化合物)。糖可以刺激大脑,形成正反馈,越喝越想喝,形成对糖依耐性。

996对程序员并不陌生,一天工作太忙,下班后就葛优躺,拿着手机或看电视。体重一天天增加,我想说的是糖尿病离你还远吗?

真相是中国糖尿病数据触目惊心!下图显示2019年估算中国糖尿病患病率排名世界第二,我们不是世界第一,是不是很高兴?

不幸的是,中国人口基数是美国4倍多,因此中国糖尿病患者数量位居世界第一。中国是糖尿病最大药物研发市场。越来越多年轻人也加入糖尿病市场,成为药企摇钱树。

中国糖尿病患者数量逐年上升,呈现明显上涨态势。近年来糖尿病药物是药企一块大蛋糕。糖尿病相关食品也非常昂贵,很多不懂医学常识的患者付出了巨大代价。

糖尿病是一种富贵病,患上后无法彻底根治,只能每日用药控制。且糖尿病相关并发症多。每8秒就有1人死于糖尿病及其并发症。如果未经治疗,糖尿病可能引发许多并发症。急性并发症包括糖尿病酮酸血症与高渗透压高血糖非酮酸性昏迷;严重的长程并发症则包括心血管疾病、中风、慢性肾脏病、糖尿病足、以及视网膜病变等。

医生对于糖尿病患者的建议比较多,少吃含糖高食物,多锻炼,多休息。。。。但哪一条建议特别重要,能否量化分析么?答案是肯定的,你给我数据,我给你答案。

欢迎学习《python机器学习-糖尿病数据挖掘》课程,该课程运用多种回归算法在年龄,性别,体重指数BMI,血压, 和六个血清指标中挖掘哪个因子是最重要致病因子。这些变量有何关联。课程建立模型综合表现显著高于互联网其他课程。

作者介绍

Toby,持牌照金融公司担任模型验证专家,国内最大医药数据中心数据挖掘部门负责人!和重庆儿科医院,中科院教授,赛柏蓝保持慢病数据挖掘项目合作!管理过欧美日中印巴西等国外药典数据库,马丁代尔数据库,FDA溶解度数据库,临床试验数据库,WHO药物预警等数据库。

课程特点

平民价格,非纯商业化价格,让贫困学生也学的起国外最先进流行知识。不需要花费几千上万报天价学习班,自学也可成长。

教程目录

课时1我的所有课程介绍

课时2讲师介绍-二十个医药数据库负责人

课时3糖尿病分类_特征_预防概述

课时4机器学习模型预测糖尿病患者血糖指标

章节2python编程环境搭建

课时5Anaconda快速入门指南

课时6Anaconda下载安装

课时7python第三方包安装(pip和conda install)

章节3糖尿病数据挖掘

课时8建立糖尿病预测线性回归模型(linear regression)

课时9下载糖尿病数据方法(原始数据和清洗后数据)

课时10线性回归和误差

课时11模型验证:均方差和中值绝对误差

课时12多算法比较,模型性能提高2倍

课时13原始数据和处理后数据建模性能对比

课时14糖尿病致病因子量化分析_性别,年龄,血压,BMI指数

课时15变量相关性分析-原来s1和s2血清检测呈现高相关性

课时16长寿之道-这课程是你一生财富

课时17BMI指数python自动化计算脚本

章节4附录

课时18糖尿病中英单词汇总

课时19糖尿病患者更容易感染新冠病毒吗?

课时20最小角度回归预测糖尿病论文LeastAngleRegression

博主用python建立糖尿病血糖指标预测模型,根据用户提供的年龄,性别,血压,BMI等指标,可以预测你是否患有糖尿病。建模数据来自美国真实糖尿病临床数据,总计442条。对于模型来说,442条数据量有些偏少,如果能有1000条以上,就比较nice了。

研究此项目的美国团队(Bradley Efron, Trevor Hastie, Iain Johnstone and Robert Tibshirani)模型性能一般,MAE约为41.9,r2为0.477。而博主建立模型MAE为13.82,r2为0.9388,远远高于美国团队,模型性能非常优秀,预测数据误差小,更准确。

博主运用python语言建立糖尿病预测模型部分代码截图,代码量少,效率高快速建模和量化分析致病因子。

程序对变量相关性分析后,自动把结果保存到excel,方便日后查阅数据,我们发现S1和S2血清指标相关性非常高,模型仅选用s1或s2变量,性能下降不会太大。

好消息是绝大多数糖尿病属于二类,是可防可控的。我们只要熟悉致病因子,建立良好生活习惯就可以显著降低糖尿病患病概率。此课程对糖尿病致病因子一一分析,并量化排序,是价值含量非常高课程。

机器学习是一门充满魅力学科,让我们像甘道夫魔法师,可以预知未来。希望我的课程能够帮助到糖尿病患者,相关研发机构,或正在写此题材论文的学生。希望你们分享此课程到朋友圈,让大家重视糖尿病防控,减少政府医药预算开支,让更多人受益。

关注公众号「python风控模型」,回复关键字:学习资料

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/47356.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

数据挖掘——糖尿病预测

一、问题描述 糖尿病数据集是Sklearn 提供的数据集。它从442例糖尿病患者的资料中取10个特征:年龄、性别、体重、血压和6个血清测试量值,以及患者在一年后疾病发展的量化值(标签)。 二、实验目的 根据上述10个特征,预…

基于Python实现的糖尿病预测系统

资源下载地址:https://download.csdn.net/download/sheziqiong/86792308 资源下载地址:https://download.csdn.net/download/sheziqiong/86792308 基于Python设计的预测糖尿病 摘要和关键词 本次实验的主要内容是使用回归分析和聚类分析来预测某人患糖…

糖尿病预测

人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站 https://www.captainai.net/shuai 一、糖尿病预测 1.1问题描述 糖尿病数据集是Sklearn 提供的数据集。它从442例糖尿病患者的资料中取10个特征:年龄…

使用 Python 机器学习的糖尿病预测模型

介绍 在本文中,我们将学习如何使用 Train Test Split 模型将数据集分为四个部分,开发预测模型,并通过用例分析预测和数据集。 用例——问题陈述 我们这篇文章的目标是预测患者是否患有糖尿病。我们所有的患者都是年轻女性,她们提供的数据(即怀孕次数、血糖水平和 BMI)…

FGF21 类似物 PF-05231023 改善糖尿病并发症

光感受器细胞中拥有大量的线粒体,以满足视网膜组织高代谢速率的需求。但是,在糖尿病人体内,高血糖引发的代谢异常会增加机体的氧化压力,从而加速视网膜的微血管病变。因此,增强光感受器细胞内的抗氧化通路可以阻止 DR …

保姆级人工智能学习成长路径

文章目录 0. 前言1. 第一阶段:编程语言学习2. 第二阶段:机器学习基本理论3. 第三阶段:深度学习理论与实战4. 第四阶段:细分领域深入学习5. 第五阶段:集大成者 0. 前言 最近有很多小伙伴想学习人工智能,其中…

图书馆小程序--Alpha迭代--第六周会议记录

1.小组介绍 组长:杨坤 小组成员:杨坤、何一鸣、韦灵雅、吴卿怡、许梦真、严影、林正远 2.流程图(分模块): 3. 目前的小组分工: 许梦真:登录,验证用户信息。 1.制定数据库存储用…

【音视频架构演进:边缘计算与云原生】

在过去的一年中,我们可以看到多媒体特别是音视频技术的能力在严峻的挑战下,为各行各业带来了巨大的变化。疫情过后,又会有哪些多媒体新技术、新实践呈现在大众的视野当中?为行业的发展与应用带来哪些新的趋势与机会? 1…

跟一线高手深聊关于边缘计算的一切

这次我们把边缘计算“一线高手”都邀请到了上海,在全球边缘计算大会上海站上,关于边缘计算的一切,你好奇的、想了解的,都可以聊聊! 1. 背景 今年三月份,十三届全国人大四次会议表决通过了关于国民经济和社会…

10月23日,相约全球边缘计算大会·上海站

全球边缘计算大会上海站,将于10月23日在上海召开。 本次大会,既有前沿技术研究分享,又有边缘计算落地实践、应用案例,是一次边缘计算领域的大型综合性会议。 早上设置了1个主会场,下午设置3个分会场,主要讨…

倒计时11天!全球边缘计算大会参会指南来啦!

全球边缘计算大会•上海站 参会指南 见证边缘的力量 10月23日(周六) 上海长宁区天山西路舜元会议中心(靠近虹桥) 目录 1.大会介绍 2.主办单位 3.峰会议程 4.交通指南 4.1 飞机 4.2 高铁 5.天气指南 6.签到&用餐指南 6.1 签到…

见证边缘的力量!全球边缘计算大会•上海站顺利召开!

2021年10月23日,以“见证边缘的力量”为主题的全球边缘计算大会在上海顺利召开!本次大会由边缘计算社区主办,并得到了阿里云、亚马逊云科技、EMQ、PPIO、网宿科技、阿普奇、视美泰、九州云、谐云科技等企业联合支持,共同推动边缘计…

LiveVideoStackCon2021音视频技术大会北京站开幕在即,精彩抢鲜看

10.29-10.30,LiveVideoStackCon 2021音视频技术大会北京站将在北京丽亭华苑酒店举行。16个技术专题,67场技术分享,77位讲师,近500位多媒体生态技术代表将齐聚本届LiveVideoStackCon。本届大会主题为:新技术&#xff0c…

深度好文推荐:互联网厂商,究竟是如何看待5G的?

内容来源:2021年10月23日,由边缘计算社区主办的全球边缘计算大会上海站圆满落幕。会上,虎牙5G首席架构师林正显受邀发表了主题为《浅谈5G及边缘计算接入网络的治理》的演讲。经过整理后,分享给大家。 整理编辑:上海大学…

LiveVideoStack公众号2021年终盘点

在2021年伊始,我们翻译过Tsahi Levent-Levi关于今年WebRTC流行趋势的文章,文中提到2021年将是“还债”的一年,此前所进行的系统设计、软件架构或软件开发都将迎来最终结果;同时它也将是服务及传输质量不断优化的一年。在供给侧长期…

解读李子柒品牌:重新认识IP消费品

NEW 关注Tech逆向思维视频号 最新视频→【日本富翁抵达宇宙还秀了朋友圈,普通人可以吗?】 出品|开菠萝财经 李子柒(本名李佳佳)与其所属公司微念的诉讼在即,舆论场上围绕双方孰是孰非的讨论已持续了近150天…

浅谈5G及边缘计算接入网络的治理

内容来源:2021年10月23日,由边缘计算社区主办的全球边缘计算大会上海站圆满落幕。会上,虎牙5G首席架构师林正显受邀发表了主题为《浅谈5G及边缘计算接入网络的治理》的演讲。 分享嘉宾:虎牙 5G首席架构师 林正显 整理编辑&#x…

2022秋软工实践 团队展示与选题报告

这个作业属于哪个课程Fzusdn这个作业要求在哪里2022秋软工实践 团队展示与选题报告这个作业的目标群策群力初步完成项目设计,有效交流带来团队友好氛围团队名称小心肝队组长学号042003121组员1学号032002221组员2学号032002343组员3学号032002401组员4学号032002422…

小心肝队-冲刺日志(第一天)

这个作业属于哪个课程fzusdn这个作业要求在哪里团队作业—alpha冲刺团队名称小心肝队这个作业的目标各成员明确任务、着手设计实现 冲刺进度 组员姓名完成任务完成时长所剩时长任务遇到的问题处理方式032002221刘博完成微信小程序首页布局编写,集成腾讯位置服务相…

小心肝队-冲刺日志(第二天)

这个作业属于哪个课程fzusdn这个作业要求在哪里团队作业—alpha冲刺团队名称小心肝队这个作业的目标建立仓库,框架搭建 冲刺进度 组员姓名完成任务完成时长所剩时长任务遇到的问题处理方式032002221刘博新增捐款、答题、校友风采路由,完成登陆逻辑编写…