DirichletDistribution
DirichletDistribution[{α1,…,αk+1}]
表示形状参数为 αi 的 k 维狄利克雷分布.
更多信息
- DirichletDistribution 也称为多元贝塔分布.
- 在狄利克雷分布中,向量 的概率密度当 时与 成正比,且 .
- DirichletDistribution 允许 αi 为任意正实数.
- DirichletDistribution 允许 αi 为任意无量纲数量.
- DirichletDistribution 可与 Mean、CDF 和 RandomVariate 等函数联合使用.
背景
- DirichletDistribution[{α1,…,αk+1}] 表示一个连续的多变量统计分布,定义于正实数 k-元组 上,它们的和小于1,并有 . DirichletDistribution[{α1,…,αk+1}] 的边缘分布(MarginalDistribution)是 BetaDistribution 的不同参数化版本,由分量 αi 的各种线性组合形成. 因此,Dirichlet 分布的参数为 -元组 (α1,…,αk+1),分量 αi 全部为正实数,并决定了概率密度函数(PDF)的整体形状. Dirichlet 分布有时也被认为是多变量 beta 分布.
- Dirichlet 分布的 PDF 在其均值处有一个绝对最大值,即分量为单变量边缘概率密度函数的单变量均值的 k-向量. 对于较大的 值,由于边缘概率密度函数呈代数式减小,而不是指数式减小,每个与 Dirichlet 分布相关的边缘概率密度函数的尾显得较“厚”. (通过分析分布的 SurvivalFunction,这种行为可被定量确定.)
- Dirichlet 分布因德国数学家 Johann Dirichlet 而得名. 自从二十世纪七十年代由 Thomas Ferguson 正式推出以后,Dirichlet 分布一直被作为一种工具,用于对现实世界和理论现象建模. Dirichlet 分布是更广义的 Dirichlet 过程的有限版,Dirichlet 过程是一个有无穷多维数的随机过程,简单来说,根据特定的算法,它为每组概率分布分配一个概率分布. 同样,Dirichlet 分布常作为贝叶斯统计的先验概率,包括作为 MultinomialDistribution 的共轭先验. Dirichlet 分布的一项有趣应用是对制造的公平骰子精确度的随机性建模,要注意的是,因为制作工艺更精良,最近制作的骰子会更“公平”. Dirichlet 分布的其它应用包括数据挖掘、机器学习和计算机视觉. 最近,在对各种文本的词频进行建模时也用到了 Dirichlet 分布.
- RandomVariate 可用来给出一个或更多机器精度或任意精度(后者可通过设置 WorkingPrecision 选项获得)的 Dirichlet 分布中的伪随机变数. Distributed[{x1,…,xk},DirichletDistribution[{α1,…,αk+1}]],更简洁的式子为 {x1,…,xk}DirichletDistribution[{α1,…,αk+1}],可用来断定一个 k-元组 (x1,…,xk) 的随机变量服从 Dirichlet 分布. 它也可以被用在诸如 Probability、NProbability、Expectation 和 NExpectation 这样的函数中.
- 通过使用 PDF[DirichletDistribution[{α1,…,αk+1}],{x1,…,xk}] 和 CDF[DirichletDistribution[{α1,…,αk+1}],{x1,…,xk}],可以得到 Dirichlet 分布的概率密度和累积分布函数. 可以用 Mean、Median、Variance、Moment 和 CentralMoment 来分别计算均值、中位数、方差、原始矩和中心矩. 而且,Covariance 可用来计算对应于 DirichletDistribution 的协方差矩阵.
- 可以用 DistributionFitTest 来检测一个数据集是否符合 Dirichlet 分布,根据给定数据,用 EstimatedDistribution 来估计 Dirichlet 参数分布,而 FindDistributionParameters 则可用来将数据拟合成 Dirichlet 分布. 用 ProbabilityPlot 指令可以产生给定数据的 CDF 与符号式 Dirichlet 分布的 CDF 的比较图,QuantilePlot 则能绘制给定数据的分位数和符号式 Dirichlet 分布的分位数的比较图.
- 可以用 TransformedDistribution 来表示转换过的 Dirichlet 分布,用 CensoredDistribution 表示截尾后位于上限和下限值之间的数据的分布,而 TruncatedDistribution 则表示删失后位于上限和下限值之间的数据的分布. CopulaDistribution 可用来构建包含 Dirichlet 分布的高维分布, ProductDistribution 可以计算由独立分布为 Dirichlet 分布所得的联合分布.
- DirichletDistribution 与许多其它分布有密切的关系. 如前所述,DirichletDistribution 和 BetaDistribution 紧密相关,因为他的每个边缘分布就是一个 beta 分布. 而且,任意一个一维 Dirichlet 分布都是 beta 分布, 因为 DirichletDistribution[{α1,α2}] 的 PDF 实际上就是 BetaDistribution[α1,α2] 的PDF. DirichletDistribution 还和 GammaDistribution 相关,因为当 为一个服从伽玛分布的随机变量,并由 k 个独立分布的伽玛变量 Y1,…,Yk 的和定义时,随机变量 服从 DirichletDistribution. DirichletDistribution 是 MultinomialDistribution 的共轭先验,且与 BetaPrimeDistribution、CompoundPoissonDistribution 和 MultinormalDistribution 相关.
范例
打开所有单元关闭所有单元范围 (8)
狄利克雷分布的一元边缘分布服从 BetaDistribution:
多元边缘分布服从 DirichletDistribution:
应用 (5)
利用狄利克雷分布将一个多元 Pólya 分布定义为一个参数混合分布:
求 Dirichlet 分布在 Disk 上的概率:
通过重复加权估计,其中权重采样来自于带有单位参数的 DirichletDistribution,应用分数随机权重自举来估计置信区间:
把 BetaDistribution 拟合进自举参数:
属性和关系 (2)
Wolfram Research (2010),DirichletDistribution,Wolfram 语言函数,https://reference.wolfram.com/language/ref/DirichletDistribution.html (更新于 2016 年).
文本
Wolfram Research (2010),DirichletDistribution,Wolfram 语言函数,https://reference.wolfram.com/language/ref/DirichletDistribution.html (更新于 2016 年).
CMS
Wolfram 语言. 2010. "DirichletDistribution." Wolfram 语言与系统参考资料中心. Wolfram Research. 最新版本 2016. https://reference.wolfram.com/language/ref/DirichletDistribution.html.
APA
Wolfram 语言. (2010). DirichletDistribution. Wolfram 语言与系统参考资料中心. 追溯自 https://reference.wolfram.com/language/ref/DirichletDistribution.html 年