初窥机器学习

人工智能

近几年来,人工智能(AI)已成为家喻户晓的术语,我们在游戏、电影(还记得J.A.R.V.I.S吗?)和书籍中经常看到它的提及和描绘,但人工智能究竟是什么呢?
人工智能简单来说就是由机器展现出来的智能,这些机器被称为智能机器。智能机器是任何能感知其环境并采取行动以最大化实现某一目标成功率的设备(从小型设备如智能手机到大型设备如电视)。
简单地说,智能机器是一种能研究其环境、从中学习并适应环境变化的设备,通过调整其行动来更好地完成特定任务;这些任务是它被设计出来要完成的。
人工智能的应用
我们都在电影、游戏和书籍中看过人工智能的描绘,但人工智能在现实世界中也有应用,其中一些包括:
• 金融
• 医疗保健
• 客户服务/聊天机器人
• 教育
• 交通运输
• 技术
过去的AI仅限于一些基本功能,如错误报告等。近未来的AI预计能够处理更复杂的事务,我们在现在已经看到了其中的一些。问题是“我们如何发展到这样的AI水平?我们如何构建能够处理复杂事务的智能机器?”,答案是机器学习。
机器学习
与AI相比,“机器学习”这个术语可能不那么常见,或者即使听过,大多数人也不太了解它的含义。
机器学习(ML)是实现人工智能的一种方法。这么说,我们可以认为目标是开发智能机器,而机器学习是实现这一目标的方式。机器学习涉及开发无需明确告知具体做什么的系统,类似于人类的学习方式。

传统编程 VS 机器学习

传统编程

在这里插入图片描述
在传统编程中,我们提供规则和数据作为输入,算法则给出答案作为输出。让我用简单利息来举个快速的例子。
我们都知道数学中的简单利息,对吧?当开始学习编程时,继写出通常的“hello world”程序之后,通常下一步就是编写简单的算术程序;所以这个例子应该很直接。
现在,简单利息的公式是(PRT)/100。利用上面的图示,我们可以分析一个计算简单利息的程序:
• 数据:作为输入提供的数据将是变量P、R和T。
• 规则:规则将是公式 SI = (PRT)/100
• 答案:答案将是变量SI
这基本上就是传统编程的工作方式。

机器学习

在这里插入图片描述
在机器学习中,它与传统编程大不相同。在这里,我们提供数据和预期答案作为输入,算法则生成规则作为输出。
举个例子,比如一个区分真伪钞票的机器学习系统。利用上面的图示,我们可以这样分析这个系统:
• 数据:作为输入提供的数据将是数千张真钞和假钞的图片。
• 答案:作为输入提供的答案将是这些图片上的标签,用来指明特定图片是真钞还是假钞。
• 规则:规则将由机器学习算法生成,这些规则或多或少是算法理解如何区分真假钞票的方式。
为什么我们应该关心机器学习?
我经常被问到像“我为什么要关心机器学习?为什么它突然变得重要?为什么现在?”之类的问题,
以下是我们为什么应该关心机器学习,以及为什么它“突然”变得重要的几个原因:
• 数据可用性:现在正在产生大量数据,非常多(大数据听起来熟悉吗?)。这些数据由我们的智能设备、嵌入式系统和其他多种来源生成。现在的数据比以往任何时候都多,这些数据可以被分析,以发现模式、趋势和关联,这些可以用来做出智能决策,那我们为什么不这样做呢?
• 计算能力:当前的硬件拥有足够的计算能力来分析数据。我们拥有配置强大的个人电脑,我们的手机拥有比带人类登上月球的计算机还要强大的计算能力。
在海量数据和拥有足够计算能力分析这些数据的设备之间,我相信没有比现在更好的时机来关心机器学习。

机器学习过程

机器学习过程可以定义为一系列步骤,包括:
• 数据收集:这包括收集用作输入的数据。数据可以有不同的格式:XML、JSON、CSV、文本文件、图片等,并且可以从各种来源获取。
• 数据准备:这包括根据要开发的机器学习系统的要求分析和过滤数据,移除质量差、无效和不必要的数据。这还涉及将准备好的数据分为训练集和测试集,训练集用于训练算法,测试集用于验证。
• 训练:这是机器学习过程中使用训练集训练算法的部分。
• 评估:训练后,使用测试集评估训练好的模型。
• 优化:根据评估结果,可以优化模型以减少误差幅度并提高效率。优化可能涉及调整算法中的一些细节,引入新的变量以提高效率,或者完全更换整个模型/算法。

机器学习算法

在这里插入图片描述

机器学习算法主要分为三大类,它们是:
• 监督学习。
• 非监督学习。
• 强化学习。

监督学习

监督学习是一类用于构建预测模型的机器学习算法。之所以称为“预测模型”,是因为它们的目标是基于历史数据预测未来的结果。在监督学习中,期望的输出已知,因此数据是标记过的,机器学习模型被清楚地指示它们要学习什么以及如何学习。
监督学习中有两个主要的任务/问题,它们是:
• 分类:这是一个处理将项目分类到类别中的机器学习任务/问题。例如,真假钞票、猫和狗等。
• 回归:这是一个处理预测真实数值的机器学习任务/问题,如重量、金额等。例如,预测2023年的燃料价格,预测30英寸披萨的成本(30英寸的披萨将是一个壮观的景象!),预测2020年的降雨量等。
点击此处关于监督学习的信息。

非监督学习

非监督学习是一类用于构建描述性模型的机器学习算法。之所以称为“描述性模型”,是因为它们的目标是从非结构化和未标记的数据中确定和定义结构和相似性。在非监督学习中,期望的输出未知,因此数据未被标记,模型必须完全自行学习,而不被告知如何学习。
非监督学习中的主要任务是聚类;一个处理确定未标记数据结构的机器学习任务/问题。

强化学习

强化学习是一类用于构建模型的机器学习算法,这些模型通过尝试和错误来确定哪些行为带来最大回报。这些模型和强化学习的目标是最大化回报。强化学习模型主要用于机器人、游戏和导航,但不限于此。
其他机器学习算法包括:
• 半监督学习:这使用少量标记数据和大量未标记数据。
• 主动学习:在这里,模型交互式地查询用户以获得新知识。

开始机器学习之旅的资源

以下是一些帮助您开始机器学习之旅的资源:
• Google的机器学习速成课程:Google作为机器学习领域的大玩家之一,设计了一个旨在教授机器学习基础知识的速成课程。
• Udacity机器学习纳米学位:Udacity提供深入的机器学习纳米学位课程,通过项目带您深入了解机器学习的基础知识和原则。
• Kaggle:Kaggle是数据科学家和机器学习工程师及爱好者最大的社区之一。它提供访问大量数据集的机会,并有机会探索和构建模型、学习以及参与机器学习和数据科学竞赛。
• scikit-learn:scikit-learn是Python中的一个开源机器学习库。它提供简单易用的数据分析和构建机器学习模型的工具。它学习起来很容易,我推荐将它用于初级水平的事物。
• Zindi:Zindi是一个非洲的数据科学家和机器学习工程师及爱好者社区。Zindi提供访问源自非洲的数据集的机会,并有参与数据科学竞赛的机会。
现在是参与机器学习的最佳时机,我希望这能为您提供关于机器学习的深刻概述,并帮助您开始。祝您好运,并继续学习!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/274400.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

go语言添加代理

LiteIDE 工具->管理 https://mirrors.aliyun.com/goproxy/或https://goproxy.cn,direct 命令行 go env -w GOPROXYhttps://goproxy.cn,direct

前端页面访问后台hiveserver2,阶段性报错

1、运行环境 Windows11下安装VMware,VMware下安装CentOS7 Linux系统,三台虚拟机集群部署hadoop,安装hive; 在Linux下安装Eclipse,创建maven工程,使用hive-jdbc-2.3.2访问hiveserver2 2、在windows11下&…

​如何防止网络攻击?

应对不同类型网络攻击的最佳途径是“知己”、“知彼”,在了解它们的工作原理、能够识别其手段、方法及意图的前提下,找出针对性的应对文案。今天,就为大家总结以下防止不同类型网络攻击的有效方法,希望无论是对个人、还是企业和组…

字节跳动也启动春季校园招聘了(含二面算法原题)

字节跳动 - 春招启动 随着各个大厂陆续打响春招的响头炮,字节跳动也官宣了春季校园招聘的正式开始。 还是那句话:连互联网大厂启动校招计划尚且争先恐后,你还有什么理由不马上行动?! 先来扫一眼「春招流程」和「面向群…

RabbitMQ - 07 - 通过注解创建队列和交换机

之前消息模型的实现,都是通过rabbitMQ Management 控制台来手动创建 queue 和 exchange 的 在项目开发中有两种方式通过代码声明 创建 一种是通过 Bean 方式,这种代码量较大 稍繁琐 一种是通过注解的方式声明 先编写消费者代码 通过注解绑定了 消息队列,交换机,还有 routin…

​LeetCode解法汇总1261. 在受污染的二叉树中查找元素

目录链接: 力扣编程题-解法汇总_分享记录-CSDN博客 GitHub同步刷题项目: https://github.com/September26/java-algorithms 原题链接:. - 力扣(LeetCode) 描述: 给出一个满足下述规则的二叉树&#xff1…

小程序学习 1

pages/goods/search/home.wxml首页功能设定 1. loading入场 2. 下拉刷新 3. 搜索栏 4. 分类切换 5. 商品列表 6. 规格弹层 7. 加载更多 <view style"text-align: center; color: #b9b9b9" wx:if"{{pageLoading}}"><t-loading theme"circula…

每日一题——LeetCode2129.将标题首字母大写

方法一 个人方法 将字符串转为数组&#xff0c;遍历数组&#xff0c;对数组的每一个元素&#xff0c;先全部转为小写&#xff0c;如果当前元素长度大于2&#xff0c;将第一个字符转为大写形式 var capitalizeTitle function(title) {titletitle.split( )for(let i0;i<tit…

同学,请实现一个扫码登录

大概的流程图如下 主要涉及到的是pc端、手机端和后台服务端。由于听产品同事说手机端由原生端&#xff08;安卓和IOS&#xff09;来实现&#xff0c;因此我这边只需要开发pc端就行&#xff0c;工作量直接减半有没有。做过该功能的小伙伴肯定了解&#xff0c;pc端的实现还是比较…

python淘宝网页爬虫数据保存到 csv和mysql(selenium)

数据库连接设置&#xff08;表和字段要提前在数据库中建好&#xff09; # 数据库中要插入的表 MYSQL_TABLE goods# MySQL 数据库连接配置,根据自己的本地数据库修改 db_config {host: localhost,port: 3306,user: root,password: ma*****6,database: may2024,charset: utf8mb…

一体机电脑辐射超标整改

电脑一体机是目前台式机和笔记本电脑之间的一个新型的市场产物&#xff0c;它将主机部分、显示器部分整合到一起的新形态电脑&#xff0c;该产品的创新在于内部元件的高度集成。随着无线技术的发展&#xff0c;电脑一体机的键盘、鼠标与显示器可实现无线链接&#xff0c;机器只…

云打印下载,云打印怎么使用?

互联网的发展让许多实体业务都受到了强烈的冲击&#xff0c;这其中打印业务也是其中之一。在当前云打印技术的推广下&#xff0c;现在有越来越多有打印需求的用户都开始选择性价比更高、打印更方便的云打印服务了。那么云打印下载&#xff0c;云打印怎么使用&#xff1f;今天小…

AIGC——ComfyUI 安装与基础使用

简介 ComfyUI是一个基于节点流程的稳定扩散操作界面&#xff0c;通过流程实现了更加精准的工作流定制和完善的可复现性。每个模块都有特定的功能&#xff0c;我们可以通过调整模块连接来实现不同的出图效果。然而&#xff0c;节点式的工作流也提高了一定的使用门槛。同时&…

leetcode代码记录(有序数组两数之和

目录 1. 题目&#xff1a;2. 我的代码&#xff1a;小结&#xff1a; 1. 题目&#xff1a; 给定一个已按照 升序排列 的整数数组 numbers &#xff0c;请你从数组中找出两个数满足相加之和等于目标数 target 。 函数应该以长度为 2 的整数数组的形式返回这两个数的下标值。numb…

25.5 MySQL 聚合函数

1. 聚合函数 聚合函数(Aggregate Function): 是在数据库中进行数据处理和计算的常用函数. 它们可以对一组数据进行求和, 计数, 平均值, 最大值, 最小值等操作, 从而得到汇总结果.常见的聚合函数有以下几种: SUM: 用于计算某一列的数值总和, 可以用于整数, 小数或者日期类型的列…

SpringBoot(容器功能)

文章目录 1.Configuration 添加/注入bean1.注入bean1.编写一个JavaBean&#xff0c;Monster.java2.创建一个config文件夹&#xff08;名字任意&#xff09;&#xff0c;用于存放配置Bean的类&#xff08;相当于配置文件&#xff09;3.BeanConfig.java4.测试使用 MainApp.java2.…

通过Office Web Viewer站点在线展示Office文档内容

方法&#xff1a; https://view.officeapps.live.com/op/view.aspx?src经Url编码的文档线上Url地址 比如&#xff1a; //以下地址来自一份旧项目代码&#xff0c;可见用的就是该方案function OfficeFileViewOnline(url, file_type, file_name) {url "http://14.23.112.2…

RPC通信原理

RPC通信原理 RPC的概念 如果现在我有一个电商项目&#xff0c;用户要查询订单&#xff0c;自然而然是通过Service接口来调用订单的实现类。 我们把用户模块和订单模块都放在一起&#xff0c;打包成一个war包&#xff0c;然后再tomcat上运行&#xff0c;tomcat占有一个进程&am…

用chatgpt写论文重复率高吗?如何降低重复率?

ChatGPT写的论文重复率很低 ChatGPT写作是基于已有的语料库和文献进行训练的&#xff0c;因此在写作过程中会不可避免地引用或借鉴已有的研究成果和观点。同时&#xff0c;由于ChatGPT的表述方式和写作风格与人类存在一定的差异&#xff0c;也可能会导致论文与其他文章相似度高…

扩展学习|系统理解数字经济

文献来源&#xff1a;[1]肖静华,胡杨颂,吴瑶.成长品&#xff1a;数据驱动的企业与用户互动创新案例研究[J].管理世界,2020,36(03):183-205.DOI:10.19744/j.cnki.11-1235/f.2020.0041. [2]陈晓红,李杨扬,宋丽洁等.数字经济理论体系与研究展望[J].管理世界,2022,38(02):208-22413…