PearsonChiSquareTest

PearsonChiSquareTest[data]

使用皮尔森 (卡方)检验法判断 data 是否服从正态分布.

PearsonChiSquareTest[data,dist]

使用皮尔森 检验法判断 data 是否服从 dist 分布.

PearsonChiSquareTest[data,dist,"property"]

返回 "property" 的值.

更多信息和选项

  • PearsonChiSquareTest 执行具有零假设 的皮尔森 拟合优度检验,其中 data 来自于具有 dist 分布的总体,而备择假设 则不是.
  • 默认情况下,返回一个概率值或者 值.
  • 一个较小的 值表明 data 不可能服从 dist.
  • dist 可以是任意具有数值和符号参数或者数据集的符号分布.
  • data 可以是单变量 {x1,x2,} 或者多变量 {{x1,y1,},{x2,y2,},}.
  • 皮尔森 检验实际上将 data 的直方图与基于 dist 得到的理论直方图相比较. 选择的柱在 dist 中具有相同的概率. »
  • 对于单变量数据,检验统计量由 给出,其中 分别是第 个直方图柱的观测和期望数目.
  • 对于多变量检验,使用单变量边缘 值的总和,并假设遵循 下的 UniformSumDistribution.
  • PearsonChiSquareTest[data,dist,"HypothesisTestData"] 返回一个 HypothesisTestData 对象 htd,通过使用 htd["property"] 的形式,它可以用来提取额外的检验结果和属性.
  • PearsonChiSquareTest[data,dist,"property"] 可以用来直接给出 "property" 的值.
  • 与检验报告相关的属性包括:
  • "DegreesOfFreedom"检验中所使用的自由度
    "PValue"
    "PValueTable""PValue" 的格式化版本
    "ShortTestConclusion"一个检验结论的简短描述
    "TestConclusion"一个检验结论的描述
    "TestData"检验统计量和
    "TestDataTable""TestData" 的格式化版本
    "TestStatistic"检验统计量
    "TestStatisticTable"格式化的 "TestStatistic"
  • 下列属性与所执行的检验类型无关.
  • 与数据分布相关的属性包括:
  • "FittedDistribution"数据的拟合分布
    "FittedDistributionParameters"数据的分布参数
  • 可以给出下列选项:
  • Method Automatic计算 值所用的方法
    SignificanceLevel0.05诊断和报告的分界点
  • 对于一个拟合优度检验,选择一个临界值 ,以使得只有当 时,否定 . 用于 "TestConclusion""ShortTestConclusion" 属性的 值由 SignificanceLevel 选项控制. 默认情况下, 设为 0.05.
  • 在设置 Method->"MonteCarlo" 下,在 下使用拟合分布,生成 个与输入 具有相同长度的数据集. 来自 PearsonChiSquareTest[si,dist,"TestStatistic"]EmpiricalDistribution 用于估计 值.

范例

打开所有单元关闭所有单元

基本范例  (4)

执行皮尔森 检验对正态性进行校验:

检验一些数据对一个特定分布的拟合情况:

比较两个数据集的分布:

从皮尔森 检验提取检验统计量:

范围  (9)

检验  (6)

执行皮尔森 检验对正态性进行校验:

正态数据的 值相对于非正态数据的 值来说,显得比较大:

检验对一个特定分布的拟合优度:

比较两个数据集合的分布:

这两个数据集合不具有相同的分布:

检验多元正态性:

检验任意多变量分布的拟合优度:

创建一个 HypothesisTestData 对象以进行重复属性提取:

可用于提取的属性:

报告  (3)

将皮尔森 检验的结果制作成表格:

完全检验表:

一个 值表:

检验统计量:

从一个皮尔森 检验表中提取项目,用于生成定制的报告:

使用 "ShortTestConclusion""TestConclusion" 报告检验结论:

结论在不同的显著性水平上可能是不同的:

选项  (3)

Method  (3)

使用基于蒙特卡罗的方法或者一个可计算的公式:

对于基于蒙特卡罗的方法,设置样本数:

当样本数增加时,蒙特卡罗估计量收敛到真实的 -值:

设置在蒙特卡罗方法中所使用的随机种子:

种子对产生器的状态有影响,而且对所得的 值也有一定影响:

应用  (2)

皮尔森 检验的功率曲线:

将近似功率曲线可视化:

当基本分布为 UniformDistribution[{-4,4}],检验大小为0.05,样本数为12时,估计皮尔森 检验的功率:

记录一个城市30天的汽车意外数目. 市议会正计划在这个城市降低车速限制,并希望作一个以事故率为基准的模型,以便日后比较:

经常用 PoissonDistribution 模拟计数数据:

假设这个城市在减少速度限制后又收集了另外30天的数据,比较减速前后的分布:

分布是明显不一样:

属性和关系  (10)

默认情况下,单变量数据与一个 NormalDistribution 进行比较:

参数已经从数据中估计得到:

默认情况下,多变量数据与一个 MultinormalDistribution 进行比较:

若未指定,则检验分布的参数从数据中估计得到:

不估计已指定的参数:

对检验分布的未指明的参数,使用最大似然估计法:

PearsonChiSquareTest 有效的比较观察的和期望的直方图:

数据被分成近似 个柱,在 下是等概率的:

中,每个柱将包含等数量的点:

为真或假时的观察直方图:

自由度等于非空柱数减一:

对于从数据中估计的每个参数删除1个自由度:

如果参数未知,PearsonChiSquareTest 校正自由度:

当指定参数时,不应用校正:

拟合分布是相同,但是自由度和 值被校正:

下,皮尔森 统计量近似服从一个 ChiSquareDistribution

在多变量拟合优度的检验中,假设边缘密度是独立的:

假设具有独立性的情况下,检验统计量是相同的:

当输入为 TimeSeries 时,皮尔森 检验只能用于数值:

巧妙范例  (1)

当零假设 为真时,计算统计量:

给定特定的备择假设,检验统计量:

比较检验统计量的分布:

Wolfram Research (2010),PearsonChiSquareTest,Wolfram 语言函数,https://reference.wolfram.com/language/ref/PearsonChiSquareTest.html.

文本

Wolfram Research (2010),PearsonChiSquareTest,Wolfram 语言函数,https://reference.wolfram.com/language/ref/PearsonChiSquareTest.html.

CMS

Wolfram 语言. 2010. "PearsonChiSquareTest." Wolfram 语言与系统参考资料中心. Wolfram Research. https://reference.wolfram.com/language/ref/PearsonChiSquareTest.html.

APA

Wolfram 语言. (2010). PearsonChiSquareTest. Wolfram 语言与系统参考资料中心. 追溯自 https://reference.wolfram.com/language/ref/PearsonChiSquareTest.html 年

BibTeX

@misc{reference.wolfram_2024_pearsonchisquaretest, author="Wolfram Research", title="{PearsonChiSquareTest}", year="2010", howpublished="\url{https://reference.wolfram.com/language/ref/PearsonChiSquareTest.html}", note=[Accessed: 22-November-2024 ]}

BibLaTeX

@online{reference.wolfram_2024_pearsonchisquaretest, organization={Wolfram Research}, title={PearsonChiSquareTest}, year={2010}, url={https://reference.wolfram.com/language/ref/PearsonChiSquareTest.html}, note=[Accessed: 22-November-2024 ]}