AnomalyDetection

AnomalyDetection[{example₁,example₂,…}]

根据所给样例产生 AnomalyDetectorFunction[…].

AnomalyDetection[LearnedDistribution[…]]

基于给定分布生成异常检测器.

AnomalyDetection[True{example₁₁,example₁₂,…},False{example₂₁,…}]

可用于表明应将哪些样例视为异常样例.

更多信息和选项

AnomalyDetection 试图对非异常数据的分布进行建模，以检测异常（即“超出分布范围”的范例）.
当范例的 RarerProbability 值低于 AcceptanceThreshold 的指定值时，该示例被视为异常示例.

AnomalyDetection 可用于许多类型的数据，包括数值型、名称型 (nominal) 和图像型数据.
每个 example_i 可以是单个数据元素、数据元素列表或数据元素的关联. 也可用 Dataset 或 Tabular对象给出样例.
也可以使用以下语法指定异常数据：

	True{e₁₁,e₁₂,…},False{e₂₁,…}	异常 (True) 数据与非异常数据的关联
	{e₁,e₂,…}{True,False,…}	示例与异常规格之间的规则
	{e₁True,e₂False,…}	异常规格规则列表
	{e₁,e₂,…}{i,j,…}	位置 i, j, … 的异常点
	{e₁,e₂,…}None	无异常范例

AnomalyDetection[examples] 产生 AnomalyDetectorFunction[…]，它可以根据新样例检测异常点.
FindAnomalies[AnomalyDetectorFunction[…],data,…] 可用来根据所给的检测器找出 data 中的异常点.
当测试数据来自与训练数据相同的分布时，AcceptanceThreshold 对应于异常检测的伪正类率 (false-positive rate).
AnomalyDetection 可以在表明或不表明哪些样例是异常样例（哪些不是异常样例）的情况下使用. 指出哪些样例是异常样例有助于训练异常检测器，并使检测器可自动确定 AcceptanceThreshold 的值.
在 AnomalyDetection[True{example₁₁,example₁₂,…},False{example₂₁,…}] 中，True 表明相应的样例为异常样例，False 表明不是异常样例. 也可以用 AnomalyDetection[{example₁,example₂,…}{True,False,…}] 和 AnomalyDetection[{example₁True,example₂False,…}] 来指定这些标签.
AnomalyDetection[{example₁,example₂,…}{i,j,…}]可用来指定应将 example_i、example_j 等视为异常样例，其他的则视为非异常样例.
AnomalyDetection[{example₁,example₂,…}None] 指定没有样例为异常样例.
可以给出以下选项：

AcceptanceThreshold	0.001	将样例视为异常的 RarerProbability 阈值
FeatureExtractor	Identity	怎样从要学习的样例中提取特征
FeatureNames	Automatic	为输入数据分配的特征名称
FeatureTypes	Automatic	假定的输入数据的特征类型
Method	Automatic	使用哪种建模算法
PerformanceGoal	Automatic	优化的目标
RandomSeeding	1234	应该在内部怎样对伪随机数字生成器进行播种
TimeGoal	Automatic	花费多长时间来训练检测器
TrainingProgressReporting	Automatic	训练过程中怎样报告进度
ValidationSet	Automatic	训练过程中用来评估模型的数据集

PerformanceGoal 的可能设置包括：

	"Memory"	最小化检测器的存储要求
	"Quality"	最大化检测器的模型质量
	"Speed"	最大化检测出新异常点的速度
	"TrainingSpeed"	最小化生成检测器的时间
	Automatic	自动在速度、质量和内存之间权衡
	{goal₁,goal₂,…}	自动组合 goal₁、goal₂ 等

Method 可能的设置与 LearnDistribution[…] 中给出的一样.
可使用 TrainingProgressReporting 的以下设置：

	"Panel"	显示动态更新的图形面板
	"Print"	用 Print 周期性地报告信息
	"ProgressIndicator"	显示一个简单的 ProgressIndicator
	"SimplePanel"	动态更新的面板，不包括学习曲线
	None	不报告任何信息

RandomSeeding 可能的设置包括：
Automatic 每次调用方程时自动重新播种

Inherited 使用外部播种产生的随机数字

seed 明确给出整数或字符串作为种子
AnomalyDetection[…,FeatureExtractor"Minimal"] 表示内部的预处理应该越简单越好.

范例

打开所有单元关闭所有单元

基本范例 (2)

在数值型数据集上训练检测器函数：

用训练过的检测器找出异常样例：

在颜色列表上训练 AnomalyDetectorFunction：

用训练过的检测器找出颜色列表中的异常样例：

范围 (8)

通过用 True 标注异常样例，用 False 标注其他样例来训练 AnomalyDetectorFunction：

以明确列表的形式指定异常点：

用规则列表指定异常情况：

仅指定异常示例的位置：

通过指定没有样例为异常样例来训练 AnomalyDetectorFunction：

使用训练好的 AnomalyDetectorFunction 来查找异常样例：

在表格数据上训练 AnomalyDetectorFunction：

在新表格上应用检测器：

在伪随机实数组成的二维数组上训练 AnomalyDetectorFunction：

用训练过的 AnomalyDetectorFunction 和 FindAnomalies 在新样例中查找异常样例:

用训练过的 AnomalyDetectorFunction 查找异常样例及其位置：

训练 LearnedDistribution 有关颜色：

根据训练好的分布生成 AnomalyDetectorFunction：

使用检测器函数查找超出分布范围的颜色：

选项 (5)

AcceptanceThreshold (1)

用异常样例创建并可视化随机三维向量：

在训练集上训练异常样例检测函数：

用异常样例检测函数查找并可视化测试集中的异常样例：

通过指定 AcceptanceThreshold 改变异常样例检测伪正类率：

Method (1)

获取训练和测试用图像数据集：

在测试集中添加“分布之外”的样例：

用 "Multinormal" 方法训练异常检测器：

在测试集中查找异常样例：

用 "KernelDensityEstimation" 方法训练异常检测器，并尝试找出异常样例：

PerformanceGoal (1)

加载 Fisher 鸢尾花数据集及其数值属性：

通过指定 PerformanceGoal 训练异常检测函数：

比较不同性能目标情况下异常检测函数的训练时间：

TimeGoal (1)

获取图像数据集，并通过指定时间目标训练异常检测函数：

获取异常检测函数的训练时间：

TrainingProgressReporting (1)

获取图像数据集：

在没有图表的情况下交互式地显示训练进程：

在训练期间定期显示训练进程：

显示简单的进程指示：

应用 (3)

获取费雪鸢尾花卉数据集（Fisher's Iris dataset）：

训练异常检测器，假定没有超出分布范围的范例：

将检测器用于新的、无标记的局部测量：

获取训练和测试用图像数据集：

在测试集中添加异常样例：

在训练集上训练异常样例检测器：

在测试集中查找异常样例：

获取训练和测试图像数据集的随机样本：

添加异常样例以破坏数据集：

通过指定训练集中已知异常样例的位置训练一个 "supervised" 异常检测器：

在测试集上使用训练好的异常检测器：

顶部

更多学习资源

技术支持

Wolfram 解决方案

Wolfram 的教育解决方案

开始

提高你的技能

与我们合作

成人教育计划

青少年教育计划

欢迎阅读

AnomalyDetection

更多信息和选项

范例

基本范例 (2)

范围 (8)