欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 科技 > 能源 > 深度学习--随机变量

深度学习--随机变量

2025/5/5 3:12:06 来源:https://blog.csdn.net/fantasy_ARM9/article/details/146451238  浏览:    关键词:深度学习--随机变量

1 联合概率

第一个称为联合概率P(A=a,B=b) 给定任意ab联合概率可以回答A=aB=b 同时满足概率多少注意对于ab任意取值P(A=a,B=b)<=P(A=a)这点确定因为同时发生A=aB=bA=a必然发生B=b也必然发生因此A=aB=b同时发生可能性不大A=aB=b单独发生可能性

2 条件概率

联合概率不等式我们一个有趣比率0<=P(A=a,B=b)/P(A=a) <= 1我们称这个比率条件概率并用P(B=b,A=a)表示B=b概率前提是A=a已经发生

3 贝叶斯定理

使用条件概率定义我们可以得出统计最有方程之一贝叶斯定理根据惩罚法则可得到P(A,B) = P(B|A)P(A) 根据对称可得到P(A,B) = P(A|B)P(B)假设P(B) > 0求解其中一个条件变量我们得到P(A|B) = P(B|A)P(A)/P(B)

这里我们使用紧凑表示其中P(A,B) 一个联合分布P(A|B)是一个条件分布这种分布可以给定A=a,B=b进行

4 边际化

为了进行时间概率求和我们需要求和法则B概率相当于计算A所有可能选择并将所有选择联合概率聚合在一起

P(B) = SimgaP(A,B)

这也称为边际化边际化结果概率成分称为边际概率边际分布

5 独立性

依赖独立也是有用属性如果两个随机变量AB独立意味着事件A发生事件B发生无关在这种情况下统计学家通常这一点表示A|B根据贝叶斯定理马上就能同样得到P(A|B) = P(A)所有其它情况下我们AB依赖比如两次连续投掷一个骰子事件是相互独立相比之下开关位置房间亮度并不是相互独立

由于P(A|B) = P(A,B)/P(B) = P(A)等价于P(A,B)=P(A)P(B)因此两个随机变量是独立且仅两个随机变量联合分布各自分布乘积同样给定另一个随机变量C两个随机变量AB条件独立的当且仅当P(A,B|C) = P(A|C)P(B|C)这个情况表示A|B|C

6 应用

我们实战演练一下假设医生患者进行艾滋病病毒HIV测试这个测试相当准确如果患者健康测试显示患病概率只有1%如果患者真的感染HIV永远不会测试不出我们使用Di表示诊断结果(如果呈阳性,则为1,如果呈阴性,则为0)H表示感染HIV状态(如果呈阳性,则为1,如果呈阴性,则为0)H表示感染HIV状态(如果呈阳性,则为1,如果呈阳性,则为0)2-1列出这样条件概率

2-1 条件概率P(Di|H)

条件概率 H = 1 H = 0

P(Di = 1|H) 1 0.01

P(Di = 0|H) 0 0.99

加和都是1 但是不是因为条件概率需要1就像概率一样我们计算如果患者测试呈阳性感染HIV概率P(H=1|Di=1)显然这将取决于疾病有多常见因为影响错误警报数量假设人口总体相当健康例如 P(H=1)=0,0015为了应用贝叶斯定理我们需要运动边际乘法法则确定

P(Di = 1)

=P(Di=1,H=0) + P(Di=1,H=1)

=P(Di=1|H=0)P(H=0)+P(Di=1|H=1)P(H=1)

=0.011485

因此我们得到

P(H=1|Di=1)

=P(Di=1|H=1)P(H=1)/P(Di=1)

换句话说,尽管使用了非常准确的测试患者实际患有艾滋病概率只有13.06%正如我们所看到概率可能违反直觉

患者收到这样可怕消息应该怎么办患者很可能要求医生进行第二测试来确定病情第二次测试具有不同的特性不如第一次测试那么精确2-2所示

2-2 条件概率P(Di|H)

条件概率 H=1 H=0

P(Di=1|H) 0.98 0.03

P(Di=0|H) 0.02 0.97

遗憾的第二次测试呈阳性我们通过假设条件独立性计算应用贝叶斯定理必要概率

P(D1=1,D1=1|H=0)

=P(D1=1|H=0)P(D2=1|H=0)

=0.0003

P(D1=1,D2=1|H=1)

=P(D1=1|H=1)P(D2=1|H=1)

0.98

现在我们可以应用边际化乘法法则

P(D1=1,D2=1)

=P(D1=1,D2=1,H=0)+P(D1=1,D2=1,H=1)

=P(D1=1,D2=1|H=0)P(H=0)+P(D1=1,D2=1|H=0)P(H=1)

0.00176955

最后鉴于两次测试呈阳性患者患有艾滋病概率

P(H=1|D1=1,D2=1)

=P(D1=1,D2=1|H=1)P(H=1)/P(D1=1,D2=1)

=0.8307

也就是说第二次测试使我们能够患病情况获得信息尽管第二次测试第一次测试准确性得多仍然显著提高我们预测概率

2.6.3 期望方差

为了概括分布关键特征我们需要一些测量方法一个随机变量X期望平均值表示E[X] = sigmaxP(X=x)

函数f(x)输入分布P抽取随机变量f(x)期望

Ex-p[f(x)] = sigmaxf(x)P(x)

在许多情况下我们希望衡量随机变量X期望偏差可以通过方差量化

Var[x] = E(X - E[X]^2) = E[X^2] - E[X]^2

方差平方根称为标准差随机变量函数方差衡量随机变量分布抽取不同x函数偏离函数期望程度

Var[f(x)] = E[f(x) - Ef(x)^2]

小结

1 我们可以概率分布抽样

2 我们可以使用联合分布条件分布贝叶斯定理边际化独立性假设分析多个随机变量

3期望方差概括概率分布关键特征提供了实用度量形式

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com

热搜词