MissingValueSynthesis
是诸如 Classify 之类函数的一个选项,用于指定应如何替换缺失值.
更多信息
- 缺失值合成 (Missing Value Synthesis),也称为缺失插补 (Missing Imputation),是通过调节已知值的分布来完成的,如 SynthesizeMissingValues.
- 缺失值通常表示由 Missing[…]表示.
- MissingValueSynthesis 可用于训练时间、推理时间或更新现有模型的合成器.
- Classify[data,…,MissingValueSynthesissynth] 可用于指定缺失的合成方法或模型以训练(对于其他训练函数也类似).
- ClassifierFunction[…][example,MissingValueSynthesissynth] 可用于在分类器推理期间临时覆盖合成方法(对于其他机器学习模型也类似).
- Classify[ClassifierFunction[…],MissingValueSynthesissynth] 可用于覆盖分类器内部缺失的合成器(对于其他机器学习模型也类似).
- MissingValueSynthesis 的可能设置包括:
-
Automatic 自动选择分布方式和合成策略 None 不要使用任何缺失的合成器 method 使用指定的方法 strategy 如何从分布中合成 assoc 指定分布方法和合成策略 - method 的可能设置包括:
-
Automatic 自动选择分布方式 "Multinormal" 使用多元正态(高斯)分布 "ContingencyTable" 离散数据并存储每个可能的概率 "KernelDensityEstimation" 使用内核混合分布 "DecisionTree" 使用决策树计算概率 "GaussianMixture" 使用混合高斯(正态)分布 LearnedDistribution[…] 使用指定的分布 - strategy 的可能设置包括:
-
Automatic 自动选择合成策略 "RandomSampling" 从条件分布中随机抽样 "ModeFinding" 尝试找到条件分布的众数 - 在 Methodassoc 的形式中,关联 assoc 的形式应该为 <"LearningMethod"method,"EvaluationStrategy"strategy >.
范例
基本范例 (2)
设置缺失值合成,在给定已知值的情况下用最可能的值替换缺失变量(这是默认行为):
对许多随机插补进行平均通常是最好的策略,并允许获得由插补引起的不确定性:
用 "KernelDensityEstimation" 分布对具有缺失值的样例进行预测:
在训练时提供已有的 LearnedDistribution 以在训练和后续运算期间插补缺失值时使用:
指定已有的 LearnedDistribution 针对单次计算合成缺失值:
Wolfram Research (2021),MissingValueSynthesis,Wolfram 语言函数,https://reference.wolfram.com/language/ref/MissingValueSynthesis.html.
文本
Wolfram Research (2021),MissingValueSynthesis,Wolfram 语言函数,https://reference.wolfram.com/language/ref/MissingValueSynthesis.html.
CMS
Wolfram 语言. 2021. "MissingValueSynthesis." Wolfram 语言与系统参考资料中心. Wolfram Research. https://reference.wolfram.com/language/ref/MissingValueSynthesis.html.
APA
Wolfram 语言. (2021). MissingValueSynthesis. Wolfram 语言与系统参考资料中心. 追溯自 https://reference.wolfram.com/language/ref/MissingValueSynthesis.html 年