AI基础 L19 Quantifying Uncertainty and Reasoning with Probabilities I 量化不确定性和概率推理

Acting Under Uncertainty
1 Reasoning Under Uncertainty
• Real world problems contain uncertainties due to:
— partial observability,
— nondeterminism, or
— adversaries.
• Example of dental diagnosis using propositional logic
T oothache ⇒ C av ity
• However inaccurate, not all patients with toothaches have cavities
T oothache ⇒ C av ity ∨ GumP roblem ∨ Abscess . . .
• In order to make the rule true, we have to add an almost unlimited list of possible problems.
• The only way to fix the rule is to make it logically exhaustive

在现实世界中,由于部分可观察性、非确定性或对抗性,问题往往包含不确定性。例如,在牙科诊断中,我们可以使用命题逻辑来表达规则,如“牙痛 ⇒ 蛀牙”。然而,这个规则并不准确,因为并非所有有牙痛的患者都有蛀牙。

为了使这个规则在逻辑上正确,我们需要添加一个几乎无限的可能的疾病列表。例如,我们可以修改规则为“牙痛 ⇒ 蛀牙 ∨ 牙龈问题 ∨ 脓肿…”。这样,我们试图通过逻辑上详尽的方式来修复规则,使其更加准确。

在处理不确定性时,我们通常需要使用概率逻辑或模糊逻辑等技术,这些技术可以更好地处理真实世界中的不确定性和模糊性。例如,模糊逻辑允许我们表达和处理模糊的概念,如“有些”或“大多数”,而不是简单的“是”或“否”。

• Rational agents much choose the right thing, which depends on:
— relative importance of the various goals
— the likelihood that, and degree to which, goals will be achieved.
• Large domains such as medical diagnosis fail for three main reasons:
Laziness: it is too much work to list complete set of logic rules 工作量大
Theoretical ignorance: medical science has no complete theory for the domain 理论不完整
Practical ignorance: even if we know all rules, uncertainty from partial observability
• An agent only has a degree of belief in the relevant sentences. 不确定性

Probability Theory
— tool to deal with degrees of belief of relevant sentences.
— summarises the uncertainty that comes from our laziness and ignorance.
• Uncertainty and rational decisions
— An agent requires preference among different possible outcomes of various plans
Utility Theory: defines the quality of the outcome being useful
◦ Every state has a degree of usefulness/utility
◦ Agent prefers higher utility
Decision Theory: Preferences (Utility Theory) combined with probabilities
◦ Decision theory = probability theory + utility theory
◦ agent is rational if and only if it chooses the action that yields the highest expected utility,
averaged over all the possible outcomes of the action.
◦ principle of maximum expected utility (MEU).

理性代理需要在其不同的计划的各种可能结果之间进行偏好排序。效用理论(Utility Theory)定义了结果的质量,即结果的效用。

  • 效用 utility:每个状态都有一个效用度,它表示该状态对代理的有用程度。
  • 偏好 preference:代理更倾向于具有更高效用的状态。

Probability Theory 

• How can we deal with complex rules which are not always true?
• We extend propositional logic to deal with probabilities.
• We associate a degree of belief with each proposition.
— P (h) = 0.5
• Here, h is a random variable.
• It has a domain of values it can take on (e.g., {true, false})
• Random variables can be
— Boolean: as above, with domain {true, false}
— Discrete: taking on values from some countable domain. E.g. Weather can be sunny,
rainy, windy, or cloudy.
— Continuous: taking on values from the set of real numbers.

我们可以为命题“h”分配一个概率值 P(h) = 0.5。在这里,h 是一个随机变量,它有一个可以取值的域(例如,{true, false})。随机变量可以是布尔型、离散型或连续型。

  • 布尔型随机变量:如上所述,其域为 {true, false}。
  • 离散型随机变量:取值来自某个可数域。例如,天气可以是晴天、雨天、风天或多云。
  • 连续型随机变量:取值来自实数集。

通过这种方式,我们可以表达命题的不确定性。例如,如果一个命题“h”的真实性是不确定的,我们可以将其概率设置为 0.5,表示我们对这个命题的信念程度是中等的。

• In logic, we had a number of possible worlds
— one had to be true;
— all others had to be false
• Probability theory talks about how probable each possible world is:
— Ω (uppercase omega) refers to the sample space
(the set of all possible worlds)
— ω (lowercase omega) refers to one such world
• A fully specified probability model
associates a probability P (ω) ∈ [0, 1] to each possible world


— We can use logical formula to specify possible worlds and obtain the probability of all
the worlds in which the formula holds, so for any proposition φ,

我们可以使用逻辑公式来指定可能的世界,并计算公式成立的世界的概率。对于任何命题 φ,命题 φ 成立的世界的概率 P(φ) 等于所有满足 φ 的世界 ω 的概率之和

Basic Notation

• Prior, or unconditional probabilities measure the degree of belief associated with
some proposition in the absence of any other information.
• For example: P (coin = heads) = 0.5 (abbreviated P (heads) = 0.5)
• A probability distribution captures the probability of each possible value of the
proposition
E.g. Fair Coin P (coin)
— P (heads) = 0.5
— P (tails) = 0.5
— We write this P (coin) : P (coin = h) = 0.5, P (coin = t) = 0.5

  • 先验概率或无条件概率:这些概率衡量了在没有其他信息的情况下,某个命题的信念程度。
  • 示例:P(coin = heads) = 0.5(简写为 P(heads) = 0.5),这表示公平硬币出现正面的概率是 0.5。
  • 概率分布:概率分布捕捉了命题每个可能值的概率。
  • 公平硬币的例子:P(heads) = 0.5,P(tails) = 0.5。

Conditional or posterior probability: given evidence that has happened, degree of
belief of new event 

条件概率或后验概率是指在已经发生某些证据的情况下,对某个新事件的信念程度。

条件概率的表示方法:

  • 给定 b 的事件 a 的概率:P(a | b) = P(a ∧ b) / P(b)
  • 也可以写作乘积规则:P(a ∧ b) = P(a | b)P(b)

例如,掷一个公平骰子时,如果第一次骰子掷出 5,那么掷出双倍(两个骰子都是 5)的概率是 P(doubles | Die1 = 5) = P(doubles ∧ Die1 = 5) / P(Die1 = 5)。

条件概率是处理实际问题时非常重要的概念,因为它允许我们在已知某些信息的情况下,对其他事件进行概率推理。在决策制定和数据分析中,条件概率经常被用来估计未来事件的可能性。

Joint Probability Distribution 

• A joint probability distribution captures the probability distribution of a set of
variables. E.g. P (coin, die)
• In the above examples, we have seen that P (a ∧ b) = P (a) ∗ P (b)
Warning: not always true!
• This only works when a and b are independent, formally, when
P (b | a) = P (b)
• E.g. a ≡ it rains today, b ≡ it rains tomorrow:
P (b | a) > P (b)
• Thus, in general: P (a ∧ b) = P (b | a)P (a) (conditional probability)
Notice this also means that P (a ∧ b) = P (a | b)P (b)

联合概率分布(Joint Probability Distribution)捕捉了一组变量的概率分布。例如,P(coin, die) 表示同时掷一个硬币和一个骰子的概率分布。

在之前的例子中,我们看到了 P(a ∧ b) = P(a) * P(b) 的规则,这通常适用于独立事件。然而,这并不总是正确的!这个规则只有在 a 和 b 是独立事件时才成立,在数学上,这表示 P(b | a) = P(b)。

例如,考虑两个事件:a ≡ 今天下雨,b ≡ 明天下雨。在这种情况下,P(b | a)(在已知今天下雨的情况下明天也下雨的概率)通常大于 P(b)(明天下雨的概率),因为今天下雨可能增加明天也下雨的可能性。

因此,在一般情况下,P(a ∧ b) = P(b | a)P(a)(条件概率)。这也意味着 P(a ∧ b) = P(a | b)P(b),这实际上是条件概率的另一种表示形式。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/422530.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Flutter Button使用

Material 组件库中有多种按钮组件如ElevatedButton、TextButton、OutlineButton等,它们的父类是于ButtonStyleButton。 基本的按钮特点: 1.按下时都会有“水波文动画”。 2.onPressed属性设置点击回调,如果不提供该回调则按钮会处于禁…

Java | Leetcode Java题解之第401题二进制手表

题目&#xff1a; 题解&#xff1a; class Solution {public List<String> readBinaryWatch(int turnedOn) {List<String> ans new ArrayList<String>();for (int i 0; i < 1024; i) {int h i >> 6, m i & 63; // 用位运算取出高 4 位和低…

brew install node提示:Error: No such keg: /usr/local/Cellar/node

打开本地文件发现Cellar目录下无法生成 node文件&#xff0c;应该是下载时出现问题&#xff0c;重复下载无法解决问题&#xff0c;只能重新安装brew。 步骤1&#xff08;安装 brew&#xff09;&#xff1a; /bin/zsh -c “$(curl -fsSL https://gitee.com/cunkai/HomebrewCN/ra…

Android 12系统源码_窗口管理(八)WindowConfiguration的作用

前言 在Android系统中WindowConfiguration这个类用于管理与窗口相关的设置&#xff0c;该类存储了当前窗口的显示区域、屏幕的旋转方向、窗口模式等参数&#xff0c;应用程序通过该类提供的信息可以更好的适配不同的屏幕布局和窗口环境&#xff0c;以提高用户体验。 一、类定…

如何基于gpt模型抢先打造成功的产品

来自&#xff1a;Python大数据分析 费弗里 ChatGPT、gpt3.5以及gpt4&#xff0c;已然成为当下现代社会中几乎人尽皆知的话题&#xff0c;而当此种现象级产品引爆全网&#xff0c;极大程度上吸引大众注意力的同时&#xff0c;有一些嗅觉灵敏的人及时抓住了机会&#xff0c;通过快…

SpringBoot2:web开发常用功能实现及原理解析-上传与下载

文章目录 一、上传文件1、前端上传文件给Java接口2、Java接口上传文件给Java接口 二、下载文件1、前端从Java接口下载文件2、Java接口调用Java接口下载文件 一、上传文件 1、前端上传文件给Java接口 Controller接口 此接口支持上传单个文件和多个文件&#xff0c;并保存在本地…

伙房食堂电气安全新挑战:油烟潮湿环境下,如何筑起电气火灾“防火墙”?

近几年&#xff0c;随着我国经济的飞速发展&#xff0c;食堂餐饮也经历了一场变革&#xff0c;越来越多的电器走进了伙房食堂中&#xff0c;实现了电气化&#xff0c;为人们提供了高效便利的饮食服务&#xff0c;但同时也增加了火灾负荷。目前我国非常严重的电气火灾危害&#…

IBM中国研发中心撤出:挑战与机遇并存

IBM中国研发中心撤出&#xff1a;挑战与机遇并存 引言 近日&#xff0c;IBM宣布撤出在中国的两大研发中心的消息&#xff0c;引起了广泛关注。这一举动不仅对IBM自身的全球布局产生了影响&#xff0c;也在一定程度上反映了跨国公司在中国市场策略的调整。本文将探讨这一事件背…

服务器重装Ubuntu20.04(desktop)

引言 实验室服务器因为删除了一些底层文件导致系统无法恢复&#xff08;还好没有数据有备份&#xff09;&#xff0c;所以在此告诫广大朋友&#xff0c;有一些底层文件不要说删就删。好的&#xff0c;接下来我们开始重装系统。 准备工作 准备好重装系统的材料如下&#xff1…

odoo14 | 报错:Database backup error: Access Denied

这两天抽空想为自己快速做一个简单的管理系统&#xff0c;来信息化管理一下自己家里的一些菜谱、电视剧下载清单等事情&#xff0c;我又不想大动干戈的用Java写管理系统&#xff0c;我就想用已经手生了两年半的odoo快速搭一个系统用用得了&#xff0c;结果还遇上了这么个事 根…

【数据结构与算法 | 灵神题单 | 插入链表篇】力扣2807, LCR 029, 147

1. 力扣2807&#xff1a;在链表中插入最大公约数 1.1 题目&#xff1a; 你一个链表的头 head &#xff0c;每个结点包含一个整数值。 在相邻结点之间&#xff0c;请你插入一个新的结点&#xff0c;结点值为这两个相邻结点值的 最大公约数 。 请你返回插入之后的链表。 两个…

大数据新视界 --大数据大厂之Flink强势崛起:大数据新视界的璀璨明珠

&#x1f496;&#x1f496;&#x1f496;亲爱的朋友们&#xff0c;热烈欢迎你们来到 青云交的博客&#xff01;能与你们在此邂逅&#xff0c;我满心欢喜&#xff0c;深感无比荣幸。在这个瞬息万变的时代&#xff0c;我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而 我的…

【网络安全】服务基础第二阶段——第四节:Linux系统管理基础----Linux网络与日志服务器

目录 一、Linux基础知识 1.1 Linux系统常用目录及命令 1.1.1 常用目录 1.1.2 常用命令 1.1.3 Linux系统文件和命令 1.1.3 文件操作 1.1.4 文件打包和压缩 1.1.5 Linux系统包管理 1.1.6 RPM命令 二、YUM 2.1 YUM 2.1.1 YUM工具 2.1.2 YUM配置 2.2 YUM源安装前置准…

机器人的静力分析与动力学

参考链接&#xff1a;4-13刚体的惯性张量_哔哩哔哩_bilibili4-13刚体的惯性张量, 视频播放量 6540、弹幕量 2、点赞数 79、投硬币枚数 38、收藏人数 145、转发人数 23, 视频作者 每一天都应不同, 作者简介 ROS1是DCS,ROS2是FCS&#xff0c;相关视频&#xff1a;机器人动力学拉格…

(八) 初入MySQL 【主从复制】

案例概况 在企业应用中&#xff0c;成熟的业务通常数据量都比较大 单台MySQL在安全性、 高可用性和高并发方面都无法满足实际的需求 &#xff0c;所以需要配置多台主从数据库服务器以实现读写分离来满足需求 一、主从复制原理 1.1、 MySQL的复制类型 基于语句的复制(STATEME…

从0开始的算法(数据结构和算法)基础(十一)

回溯算法 什么是回溯算法 回溯算法&#xff0c;根据字面意思来理解这个算法是将每一步的操作可以进行回溯&#xff0c;实际上是对这个每一步的操作进行记录&#xff0c;确保可以返回上一步的操作&#xff0c;可能是对回溯操作之前的做一个复现&#xff0c;也有可能是可操作的回…

神经网络中的那些浮点数

模型进行需要大量显存和算力进行支持&#xff0c;精度越高需要的内存和算力也越多&#xff0c;本文将介绍在模型中使用的不同类型的浮点数。 FP32 (Float32)&#xff1a; • 精度和稳定性&#xff1a;FP32 提供 23 位尾数和 8 位指数的高精度 • 性能&#xff1a;尽管 FP32 是通…

学习大数据DAY56 业务理解和第一次接入

作业1 1 了解行业名词 ERP CRM OA MES WMS RPA SAAS 了解每个系统的功能和应用 ERP 系统&#xff0c;&#xff08;Enterprise Resource Planning&#xff0c;企业资源计划系统&#xff09;&#xff1a;ERP 系统 是一种用于管理企业各类资源的软件系统&#xff0c;包括生产管理…

极狐GitLab CI/CD 作业一直处于等待状态,如何解决?

本分分享 GitLab CI/CD Job 不工作的的故障排查方法&#xff1a;当 GitLab Runner 不接受 Job&#xff0c;Job 一直处于等待状态&#xff0c;如何解决此问题。 极狐GitLab 为 GitLab 在中国的发行版&#xff0c;中文版本对中国用户更友好。极狐GitLab 支持一键私有化部署&…

【Hot100】LeetCode—72. 编辑距离

目录 1- 思路题目识别动规五部曲 2- 实现⭐72. 编辑距离——题解思路 3- ACM 实现 原题链接&#xff1a;72. 编辑距离 1- 思路 题目识别 识别1 &#xff1a;两个字符串之间相互转换&#xff0c;增、删、替换 最少的操作次数 动规五部曲 1- 定义 dp 数组 dp[i][j] 代表&…