Korean, Edit

第 6 章. 离散概率分布

高级类别:【统计】【统计概述】(https://jb243.github.io/pages/1641)


1. 均匀分布 

2. 伯努利分布  

3. 二项分布  

4. 多项分布 

5. 超几何分布 

6. 几何分布

7. 负二项分布 

8. 负超几何分布 

9. 泊松分布



图片


1.均匀分布 

⑴定义所有随机变量具有恒定概率的概率分布

⑵ 概率质量函数 p(x) = (1 / n) I{x = x1,···, xn


스크린샷 2024-12-22 오후 11 49 26

图 1. 均匀分布的概率质量函数


① Python编程 Bokeh用于网页可视化


受保护_0


⑶ 示例

① 【制服问题示例分布](https://blog.kakaocdn.net/dn/bW64At/btsLK2kduoI/UYGuCu9Qq3rJWkScbVfMxk/%E1%84%80%E1%85%B2%E1%86%AB%E1%8 4%8B%E1%85%B5%E1%86%AF%E1%84%87%E1%85%AE%E1%86%AB%E1%84%91%E1%85%A9%2016%E1%84%8C%E1%85%A6.pdf?attach=1&knm=tfile.pdf)

② 【联合制服问题示例分布](https://blog.kakaocdn.net/dn/bjacE2/btsLKb91CRK/T6xKqoHCrhydQK1kMtnURK/%E1%84%80%E1%85%A7%E1%86%AF%E1%84%92%E1%85%A1%E1%86%B8%E1%8 4%80%E1%85%B2%E1%86%AB%E1%84%8B%E1%85%B5%E1%86%AF%E1%84%87%E1%85%AE%E1%8 6%AB%E1%84%91%E1%85%A9%2010%E1%84%8C%E1%85%A6.pdf?attach=1&knm=tfile.pdf)



2.伯努利分布 

⑴伯努利试验执行,执行结果是成功(X = 1)或失败(X = 0)

⑵ 伯努利分布伯努利执行一次时的概率分布

⑶ 概率质量函数 p(x) = θ I{x = 1}+ (1 - θ) I{x = 0}


스크린샷 2024-12-22 오후 11 49 43

图 2. θ = 0.6 时伯努利分布的概率质量函数


① Python编程 Bokeh用于网页可视化 


受保护_1


⑷ 统计数据

①力矩生成函数 


绘图


② 平均值 E(X) = θ

③ 方差 VAR(X) = E(X2) - E(X)2 = θ - θ2 = θ (1 - θ)



3。二项分布 

⑴定义伯努利试验重复n次时成功次数的概率分布

① 试验次数和实施概率是固定的

⑵ 概率质量函数

① p(x) = nCx θx (1 - θ)n-x

② p(x) : n 次中仅成功 x 次的概率

nCx 数字1、2、···、n之间的x数组合的个数

④ θx 当有上述x个数字组合时成功的概率

⑤ (1 - θ)n-x : 如果不是上述 x 数组合则失败的概率


스크린샷 2024-12-22 오후 11 50 34

图 3. n = 30、p = 0.6 时二项式分布的概率质量函数


⑥ Python编程 Bokeh用于网页可视化


受保护_2


⑶统计数据

①想法由于第i次伯努利试验遵循伯努利分布,


绘图


②力矩生成函数


绘图


③ 平均值 E(X) = nθ 


绘图


④ 方差 VAR(X) = nθ(1 - θ)


绘图


⑷ 【二项式的示例问题分布](https://blog.kakaocdn.net/dn/xoGDj/btsLJFqbXkR/3pTMI86mh3ZMusLfhVRnv1/%E1%84%8B%E1%85%B5%E1%84%92% E1%85%A1%E1%86%BC%E1%84%87%E1%85%AE%E1%86%AB%E1%84%91%E1%85%A9%2039%E1%84%8C%E1%85%A6.pdf?attach=1&knm=tfile.pdf)



4。多项分布 

⑴多项试验如果有结果,将伯努利试验延长三个或更多

⑵ 多项分布重复多项试验n次时的概率分布。

⑶概率质量函数


绘图


①前提 : x1 + x2 + ··· + xk = n

② p(x1, x2, ··· , xk) = nCx1 × n-x1Cx2 ×···× xkCxk × θ1x1 θ2x2 … θkxk



5。超几何分布 

⑴定义若成功数为N中的M,则提取n个时成功数的概率分布不放回 

⑵ 概率质量函数


绘图


或者如下图


绘图


스크린샷 2024-12-22 오후 11 51 17

图 4. [M, n, N] = [20, 7, 12] 处超几何分布的概率质量函数 


① Python编程 Bokeh用于网页可视化


受保护_3


⑶统计数据

①平均值 E(X) = nM / N 

○ 类似于二元分布 E(X) = nθ = nM / N

② 方差 VAR(X) = [(N-n) / (N-1)] × [nM / N] × [1 - M / N]

⑷ 与二项式分布的关系 

①二项分布的条件分布超几何分布 > ② 超几何分布的极限 (n → ∞) : 二项分布 (n → ∞)

③ 二进制分发基于with-replacement 



6。几何分布 

⑴定义为提取成功概率θ,直到成功的试验次数的概率分布。

① 执行概率固定,执行次数变化

⑵ 概率质量函数 p(x) = θ (1 - θ)x-1 I{x = 1, 2, ···}


스크린샷 2024-12-22 오후 11 51 47

图 5. θ = 0.5 时的几何分布


① Python编程 Bokeh用于网页可视化


受保护_4


⑶统计数据

①力矩生成函数 


绘图


② 平均值 E(X) = 1 / θ

○ 含义 直观上来说,平均试验次数×成功概率=1成立


绘图


③ 方差 VAR(X) = (1 - θ) / θ2


绘图



7.负二项分布  

⑴定义如果成功概率为θ,则直到第r次成功为止的尝试次数的概率分布

①二项分布中,试验次数和执行概率是固定的,成功次数是变化的

② 负二项分布中,成功次数和执行概率固定,试验次数变化

⑵ 概率质量函数

type 1. 用 r 修复成功次数


绘图


○ x: 试验次数

○ r: 成功次数

○ θ: 成功概率

x-1Cr-1 : 第 x-1 次成功,且之前的 x-1 次试验中只有 r-1 次试验成功的情况数。

type 2. 用 r* 修复失败次数


绘图


○ k: 成功次数

○ r*: 失败次数

○ p: 成功概率

k+r-1</sub>Ck : 第 k+rth 次失败,且前一次 k+r-1 次试验中只有 r-1 次失败的情况数

类型3. 固定r次成功次数并分析失败次数


스크린샷 2025-02-08 오후 12 23 54


○ x: 故障次数

○ r:成功次数、大小、1/过度离散

○ p:成功概率

④图表


스크린샷 2024-12-22 오후 11 52 16

图 6. r = 5、θ = 0.6 时负二项式分布的概率质量函数

⑤ Python编程 Bokeh用于网页可视化


受保护_5


⑶统计数据

类型1的统计

○ 想法 X = ΣXi

○ Xi i-1 次成功后第 i 次成功的尝试次数。遵循几何分布

○ 力矩生成函数


绘图


○ 平均 E(X) = r / θ


스크린샷 2025-02-08 오후 12 21 17


○ 方差: VAR(X) = r(1-θ) / θ2


绘图


类型2的统计 

○ 平均 E(X) = r*p / (1-p)


绘图


○ 方差: VAR(X) = r*p / (1-p)2


스크린샷 2025-02-08 오후 12 21 37


类型3的统计 

○ 平均值:E(X) = r(1 - p) / p


스크린샷 2025-02-08 12 25 23


方差:VAR(X) = r(1 - p) / p2


스크린샷 2025-02-08 12 25 39


○ r 和 p 可以用均值和方差来表示。


스크린샷 2025-02-08 12 25 50


○ 均值与方差的关系:方差 = σ2 = 均值 + 过离散 ×mean2 = μ + μ2 / r

⑷ 示例

①情况每局游戏会随机提供n种人物中的一种

② X : 收集完所有数字之前要观看的比赛数量

③问题 E(X)

④想法 X = X1 + ··· + Xn

⑤ Xi : 在收集到第 i 个新人物之前您必须观看的游戏数量。遵循几何分布 

⑥ E(X)


绘图


应用1. ZINB(零膨胀负二项分布)


스크린샷 2025-03-14 12 12 52


① π:观察到0的概率

② NB(y; μ, θ):平均值为 μ、离散参数为 θ 的负二项分布的概率质量函数

⑹【负二项式的示例问题分布](https://blog.kakaocdn.net/dn/mQA1J/btsLLRPYSNk/uYqz9JmpdlstsjpAKkMVH0/%E1%84%8B%E1%85%B3%E1%86%B7%E1%84%8B%E1%85%B5%E1%8 4%92%E1%85%A1%E1%86%BC%E1%84%87%E1%85%AE%E1%86%AB%E1%84%91%E1%85%A9 %20%E1%84%8B%E1%85%A8%E1%84%8C%E1%85%A6.pdf?attach=1&knm=tfile.pdf)



8.负超几何分布 

⑴ 定义

①情况:N次中,成功次数为k次> ②问题:在无放回抽样中,当抽取了r次成功时,到该点为止抽取的样本总数为n。

③ 与负二项分布的相似之处:将抽取的样本数视为随机变量。

④ 与超几何分布的相似之处:两者都假设无放回的采样过程。

⑵ 概率质量函数


스크린샷 2025-02-22 오후 7 22 52


⑶ 统计措施

① 有用的组合公式


스크린샷 2025-02-22 7 23 19


② 平均值


스크린샷 2025-02-22 오후 7 23 51


③ 方差


스크린샷 2025-02-22 오후 7 24 12



9。泊松分布

⑴ 概述

①第一篇导论:《刑事和民事案件判决概率的研究》,1837年,法国。

②定义:对于单位时间内平均发生λ次的事件,泊松分布定义为单位时间内该事件发生次数的概率分布

③ λ :参数(ε ℝ)

④ 对于单位时间k倍的时间间隔,考虑λ* = kλ的泊松分布 

⑤ 确实,积极使用。

⑵ 概率质量函数

①思想二项式分布和极限

②若将单位时间除以n等份,则每等份中事件发生的概率为 λ/n

③单位时间内某个事件发生x次的概率。


绘图


④ 概率质量函数 你只需要通过 n → ∞ 取 ③ 的极限


绘图


⑤图表 


스크린샷 2024-12-22 오후 11 52 54

图 7. λ = 0.6 时泊松分布的概率质量函数


⑥ Python编程 Bokeh用于网页可视化


受保护_6


⑶统计数据

①力矩生成函数


绘图


② 平均值 E(X) = λ


绘图


③ 方差 VAR(X) = λ


绘图


⑷ 特点

①服从泊松分布的独立概率变量之和也服从泊松分布


绘图


⑸ 与二项式分布的关系 

①泊松分布的条件分布二项分布

② 二项式分布的极限 (n → ∞): 泊松分布 

⑹ 示例

① 情况 平均每小时接到 30 个电话

②问题3分钟内接到2个电话的概率。

③ 当 λ = 30 时,λ* = 30 ÷ 20 = 1.5

④计算 


绘图


泊松问题示例分布



输入:2019.06.18 23:48

results matching ""

    No results matching ""