FeatureExtractor

是一个用于诸如 Classify 等函数的选项，指定特征如何被提取.

更多信息

FeatureExtractor 的可能设置包括：

	FeatureExtractorFunction[…]	应用给定的提取程序函数
	extractor	应用指定的特征提取程序方法
	{extractor₁,extractor₂,…}	依次应用提取函数方法序列
	specext	将由 spec 指定的提取函数 ext 应用于数据部分
	{spec₁ext₁,spec₂ext₂,…}	将由 spec_i 指定的提取函数 ext_i 应用于数据部分

可能的特征提取程序方法包括：

	Automatic	自动提取
	Identity	给出无变化的数据
	"ConformedData"	一致化的图像、颜色、日期等
	"NumericVector"	来自任意数据的数值向量
	f	对各个样例应用函数 f
	{extractor₁,extractor₂,…}	依次使用一系列提取器

也可对每个数据类型应用其他特征提取方法.
数值数据：

	"DiscretizedVector"	离散化的数值数据
	"DimensionReducedVector"	降维的数值向量
	"MissingImputed"	缺失值被估算的数据
	"StandardizedVector"	用 Standardize 处理过的数值数据

标称数据：
"IndicatorVector" 用指示向量“独热编码”的名义数据

"IntegerVector" 用整数编码的名义数据
文本：

	"LowerCasedText"	每个字符均为小写的文本
	"SegmentedCharacters"	分割成字符的文本
	"SegmentedWords"	分割成单词的文本
	"TFIDF"	词频逆向文件频率向量
	"WordVectors"	文字的语义向量序列（仅限英文）

图像：
"FaceFeatures" 来自人脸图像的语义向量

"ImageFeatures" 图像的语义向量

"PixelVector" 图像像素值向量
音频对象：

	"AudioFeatures"	音频对象的语义向量序列
	"AudioFeatureVector"	音频对象的语义向量
	"LPC"	音频线性预测系数
	"MelSpectrogram"	用对数频次分组的音频频谱图
	"MFCC"	音频梅尔频率倒谱系数向量序列
	"SpeakerFeatures"	语义说话者向量序列
	"SpeakerFeatureVector"	说话人的语义向量
	"Spectrogram"	音频频谱图

视频对象：
"VideoFeatures" 来自视频对象的语义向量序列

"VideoFeatureVector" 来自视频对象的语义向量
图：
"GraphFeatures" 总结图的属性的数值向量
分子：

	"AtomPairs"	来自原子对的布尔向量以及它们之间的路径长度
	"MoleculeExtendedConnectivity"	来自枚举的分子子图的布尔向量
	"MoleculeFeatures"	概括分子属性的数值向量
	"MoleculeTopologicalFeatures"	来自圆形原子邻域的布尔向量

默认情况下，FeatureExtractor->Identity.
通常，FeatureExtractor 的值被解释为预处理步骤：它不会替换函数使用的其他特征提取程序.
当特征提取程序方法不是 FeatureExtractorFunction[…] 或自定义函数时，特征提取将根据数据进行学习.
当设置为 specext 或 {spec₁ext₁,…} 时，spec 和 spec_i 的可能形式包括：

	All	各样例的所有部分
	i	各样例的第 i 个部分
	{i₁,i₂,…}	各样例的部分 i₁, i₂, …
	"name"	在各样例中具有指定名称的部分
	{"name₁","name₂",…}	在各样例中名为 "name_i" 的部分

未在 spec 或 spec_i 提及的部分将出于提取特征的目的而被删除.
在诸如 Classify、Predict、DimensionReduction 或 ClusterClassify 这样的函数中， FeatureExtractor"Minimal" 表示内部预处理应尽可能简单.

范例

打开所有单元关闭所有单元

基本范例 (3)

在简单的数据集上训练 FeatureExtractorFunction：

在 Classify 中使用特征提取程序函数作为预处理步骤：

使用提取程序方法 "ImageFeatures" 作为预处理步骤，训练分类器：

对新的图像分类：

使用 FeatureExtractor 产生预测器函数，用自定义函数预处理数据：

添加 "StandardizedVector" 方法至预处理管道：

对新数据使用预测器：

范围 (1)

通过自定义函数和提取器方法对文本预处理训练分类器：

顶部

更多学习资源

技术支持

成人教育计划

青少年教育计划

活动

Wolfram 倡议

教育资源

爱好与项目

Wolfram 解决方案

Wolfram 的教育解决方案

开始

提高你的技能

与我们合作

欢迎阅读

成人教育计划

青少年教育计划

活动

FeatureExtractor

更多信息

范例

基本范例 (3)

范围 (1)

文本

CMS

APA

BibTeX

BibLaTeX

	"IndicatorVector"	用指示向量“独热编码”的名义数据
	"IntegerVector"	用整数编码的名义数据

	"FaceFeatures"	来自人脸图像的语义向量
	"ImageFeatures"	图像的语义向量
	"PixelVector"	图像像素值向量

	"VideoFeatures"	来自视频对象的语义向量序列
	"VideoFeatureVector"	来自视频对象的语义向量

FeatureExtractor

更多信息

范例

基本范例 (3)

范围 (1)

参见

相关指南

历史

文本

CMS

APA

BibTeX

BibLaTeX