第 6 章. 离散概率分布
高级类别:【统计】【统计概述】(https://jb243.github.io/pages/1641)
1. 均匀分布
2. 伯努利分布
3. 二项分布
4. 多项分布
5. 超几何分布
6. 几何分布
7. 负二项分布
8. 负超几何分布
9. 泊松分布
1.均匀分布
⑴定义:所有随机变量具有恒定概率的概率分布
⑵ 概率质量函数: p(x) = (1 / n) I{x = x1,···, xn}
图 1. 均匀分布的概率质量函数
① Python编程: Bokeh用于网页可视化
受保护_0
⑶ 示例
① 【制服问题示例分布](https://blog.kakaocdn.net/dn/bW64At/btsLK2kduoI/UYGuCu9Qq3rJWkScbVfMxk/%E1%84%80%E1%85%B2%E1%86%AB%E1%8 4%8B%E1%85%B5%E1%86%AF%E1%84%87%E1%85%AE%E1%86%AB%E1%84%91%E1%85%A9%2016%E1%84%8C%E1%85%A6.pdf?attach=1&knm=tfile.pdf)
② 【联合制服问题示例分布](https://blog.kakaocdn.net/dn/bjacE2/btsLKb91CRK/T6xKqoHCrhydQK1kMtnURK/%E1%84%80%E1%85%A7%E1%86%AF%E1%84%92%E1%85%A1%E1%86%B8%E1%8 4%80%E1%85%B2%E1%86%AB%E1%84%8B%E1%85%B5%E1%86%AF%E1%84%87%E1%85%AE%E1%8 6%AB%E1%84%91%E1%85%A9%2010%E1%84%8C%E1%85%A6.pdf?attach=1&knm=tfile.pdf)
2.伯努利分布
⑴伯努利试验:执行,执行结果是成功(X = 1)或失败(X = 0)
⑵ 伯努利分布:伯努利执行一次时的概率分布
⑶ 概率质量函数: p(x) = θ I{x = 1}+ (1 - θ) I{x = 0}
图 2. θ = 0.6 时伯努利分布的概率质量函数
① Python编程: Bokeh用于网页可视化
受保护_1
⑷ 统计数据
①力矩生成函数
![]()
② 平均值: E(X) = θ
③ 方差: VAR(X) = E(X2) - E(X)2 = θ - θ2 = θ (1 - θ)
3。二项分布
⑴定义:伯努利试验重复n次时成功次数的概率分布
① 试验次数和实施概率是固定的
⑵ 概率质量函数
① p(x) = nCx θx (1 - θ)n-x
② p(x) : n 次中仅成功 x 次的概率
③ nCx :数字1、2、···、n之间的x数组合的个数
④ θx :当有上述x个数字组合时成功的概率
⑤ (1 - θ)n-x : 如果不是上述 x 数组合则失败的概率
图 3. n = 30、p = 0.6 时二项式分布的概率质量函数
⑥ Python编程: Bokeh用于网页可视化
受保护_2
⑶统计数据
①想法:由于第i次伯努利试验遵循伯努利分布,
![]()
②力矩生成函数
![]()
③ 平均值: E(X) = nθ
![]()
④ 方差: VAR(X) = nθ(1 - θ)
![]()
⑷ 【二项式的示例问题分布](https://blog.kakaocdn.net/dn/xoGDj/btsLJFqbXkR/3pTMI86mh3ZMusLfhVRnv1/%E1%84%8B%E1%85%B5%E1%84%92% E1%85%A1%E1%86%BC%E1%84%87%E1%85%AE%E1%86%AB%E1%84%91%E1%85%A9%2039%E1%84%8C%E1%85%A6.pdf?attach=1&knm=tfile.pdf)
4。多项分布
⑴多项试验:如果有结果,将伯努利试验延长三个或更多
⑵ 多项分布:重复多项试验n次时的概率分布。
⑶概率质量函数
![]()
①前提 : x1 + x2 + ··· + xk = n
② p(x1, x2, ··· , xk) = nCx1 × n-x1Cx2 ×···× xkCxk × θ1x1 θ2x2 … θkxk
5。超几何分布
⑴定义:若成功数为N中的M,则提取n个时成功数的概率分布不放回
⑵ 概率质量函数
![]()
![]()
图 4. [M, n, N] = [20, 7, 12] 处超几何分布的概率质量函数
① Python编程: Bokeh用于网页可视化
受保护_3
⑶统计数据
①平均值: E(X) = nM / N
○ 类似于二元分布 E(X) = nθ = nM / N
② 方差: VAR(X) = [(N-n) / (N-1)] × [nM / N] × [1 - M / N]
⑷ 与二项式分布的关系
①二项分布的条件分布:超几何分布 > ② 超几何分布的极限 (n → ∞) : 二项分布 (n → ∞)
③ 二进制分发基于with-replacement
6。几何分布
⑴定义:为提取成功概率θ,直到成功的试验次数的概率分布。
① 执行概率固定,执行次数变化
⑵ 概率质量函数: p(x) = θ (1 - θ)x-1 I{x = 1, 2, ···}
图 5. θ = 0.5 时的几何分布
① Python编程: Bokeh用于网页可视化
受保护_4
⑶统计数据
①力矩生成函数
![]()
② 平均值: E(X) = 1 / θ
○ 含义: 直观上来说,平均试验次数×成功概率=1成立
![]()
③ 方差: VAR(X) = (1 - θ) / θ2
![]()
7.负二项分布
⑴定义:如果成功概率为θ,则直到第r次成功为止的尝试次数的概率分布
①二项分布中,试验次数和执行概率是固定的,成功次数是变化的
② 负二项分布中,成功次数和执行概率固定,试验次数变化
⑵ 概率质量函数
① type 1. 用 r 修复成功次数
![]()
○ x: 试验次数
○ r: 成功次数
○ θ: 成功概率
○ x-1Cr-1 : 第 x-1 次成功,且之前的 x-1 次试验中只有 r-1 次试验成功的情况数。
② type 2. 用 r* 修复失败次数
![]()
○ k: 成功次数
○ r*: 失败次数
○ p: 成功概率
○ k+r-1</sub>Ck : 第 k+rth 次失败,且前一次 k+r-1 次试验中只有 r-1 次失败的情况数
③ 类型3. 固定r次成功次数并分析失败次数
○ x: 故障次数
○ r:成功次数、大小、1/过度离散
○ p:成功概率
④图表
图 6. r = 5、θ = 0.6 时负二项式分布的概率质量函数
⑤ Python编程: Bokeh用于网页可视化
受保护_5
⑶统计数据
① 类型1的统计
○ 想法: X = ΣXi
○ Xi : i-1 次成功后第 i 次成功的尝试次数。遵循几何分布
○ 力矩生成函数
![]()
○ 平均: E(X) = r / θ
○ 方差: VAR(X) = r(1-θ) / θ2
![]()
② 类型2的统计
○ 平均: E(X) = r*p / (1-p)
![]()
○ 方差: VAR(X) = r*p / (1-p)2
③ 类型3的统计
○ 平均值:E(X) = r(1 - p) / p
方差:VAR(X) = r(1 - p) / p2
○ r 和 p 可以用均值和方差来表示。
○ 均值与方差的关系:方差 = σ2 = 均值 + 过离散 ×mean2 = μ + μ2 / r
⑷ 示例
①情况:每局游戏会随机提供n种人物中的一种
② X : 收集完所有数字之前要观看的比赛数量
③问题: E(X)
④想法: X = X1 + ··· + Xn
⑤ Xi : 在收集到第 i 个新人物之前您必须观看的游戏数量。遵循几何分布
⑥ E(X)
![]()
⑸ 应用1. ZINB(零膨胀负二项分布)
① π:观察到0的概率
② NB(y; μ, θ):平均值为 μ、离散参数为 θ 的负二项分布的概率质量函数
⑹【负二项式的示例问题分布](https://blog.kakaocdn.net/dn/mQA1J/btsLLRPYSNk/uYqz9JmpdlstsjpAKkMVH0/%E1%84%8B%E1%85%B3%E1%86%B7%E1%84%8B%E1%85%B5%E1%8 4%92%E1%85%A1%E1%86%BC%E1%84%87%E1%85%AE%E1%86%AB%E1%84%91%E1%85%A9 %20%E1%84%8B%E1%85%A8%E1%84%8C%E1%85%A6.pdf?attach=1&knm=tfile.pdf)
8.负超几何分布
⑴ 定义
①情况:N次中,成功次数为k次> ②问题:在无放回抽样中,当抽取了r次成功时,到该点为止抽取的样本总数为n。
③ 与负二项分布的相似之处:将抽取的样本数视为随机变量。
④ 与超几何分布的相似之处:两者都假设无放回的采样过程。
⑵ 概率质量函数
⑶ 统计措施
① 有用的组合公式
② 平均值
③ 方差
9。泊松分布
⑴ 概述
①第一篇导论:《刑事和民事案件判决概率的研究》,1837年,法国。
②定义:对于单位时间内平均发生λ次的事件,泊松分布定义为单位时间内该事件发生次数的概率分布
③ λ :参数(ε ℝ)
④ 对于单位时间k倍的时间间隔,考虑λ* = kλ的泊松分布
⑤ 确实,积极使用。
⑵ 概率质量函数
①思想:二项式分布和极限
②若将单位时间除以n等份,则每等份中事件发生的概率为 λ/n
③单位时间内某个事件发生x次的概率。
![]()
④ 概率质量函数: 你只需要通过 n → ∞ 取 ③ 的极限
![]()
⑤图表
图 7. λ = 0.6 时泊松分布的概率质量函数
⑥ Python编程: Bokeh用于网页可视化
受保护_6
⑶统计数据
①力矩生成函数
![]()
② 平均值: E(X) = λ
![]()
③ 方差: VAR(X) = λ
![]()
⑷ 特点
①服从泊松分布的独立概率变量之和也服从泊松分布
![]()
⑸ 与二项式分布的关系
①泊松分布的条件分布:二项分布
② 二项式分布的极限 (n → ∞): 泊松分布
⑹ 示例
① 情况: 平均每小时接到 30 个电话
②问题:3分钟内接到2个电话的概率。
③ 当 λ = 30 时,λ* = 30 ÷ 20 = 1.5
④计算
![]()
⑺ 泊松问题示例分布
输入:2019.06.18 23:48