FeatureExtract

FeatureExtract[{example1,example2,}]

すべての exampleiについて訓練された特徴抽出器を使って exampleiのそれぞれから特徴を抽出する.

FeatureExtract[examples,extractor]

指定された特徴抽出器法を使って特徴を抽出する.

FeatureExtract[examples,{extractor1,extractor2,}]

extractoriを順に適用して特徴を抽出する.

FeatureExtract[examples,specext]

ext で指定された抽出器法を,spec で指定された examples の部分に適用する.

FeatureExtract[examples,{spec1ext1,spec2ext2,}]

抽出器法 extispeciで指定された examples の部分に使う.

詳細とオプション

  • FeatureExtractは,数値,テキスト,サウンド,画像,グラフ,時系列,それらの組合せを含む,数多くのタイプのデータに使うことができる.
  • exampleiは,単一のデータ要素,データ要素のリスト,データ要素の連想,あるいはDatasetオブジェクトでよい.
  • 使用可能な特徴抽出器メソッドには以下がある.
  • Automatic自動抽出
    Identityデータを変更せずに与える
    "ConformedData"適合する画像,色,日付等
    "NumericVector"任意のデータからの数値ベクトル
    f関数 f を各例に適用する
    {extractor1,extractor2,}一連の抽出器を交互に使う
  • 各データ型について追加的な特徴抽出器法を使うことができる.
  • 数値データ
  • "DiscretizedVector"離散化された数値データ
    "DimensionReducedVector"次元を削減した数値ベクトル
    "MissingImputed"欠落値が補完されたデータ
    "StandardizedVector"Standardizeで処理された数値データ
  • 名義データ
  • "IndicatorVector"インジケータベクトルで「ワンホットエンコード」された名義データ
    "IntegerVector"整数で符号化された名義データ
  • テキスト:
  • "LowerCasedText"各文字が小文字のテキスト
    "SegmentedCharacters"文字に分割されたテキスト
    "SegmentedWords"単語に分割されたテキスト
    "TFIDF"単語の出現頻度と逆文書頻度のベクトル
    "WordVectors"英語テキストからの意味ベクトル列(英語のみ)
  • 画像
  • "FaceFeatures"ヒトの顔からの意味ベクトル
    "ImageFeatures"画像からの意味ベクトル
    "PixelVector"画像からの画素値のベクトル
  • 音声オブジェクト
  • "AudioFeatures"音声オブジェクトからの意味ベクトル列
    "AudioFeatureVector"音声オブジェクトからの意味ベクトル
    "LPC"音声線形予測係数
    "MelSpectrogram"対数周波数ビンの音声スペクトログラム
    "MFCC"音声メル周波数ケプストラム係数ベクトル列
    "SpeakerFeatures"意味話者ベクトルの列
    "SpeakerFeatureVector"話者の意味ベクトル
    "Spectrogram"音声スペクトログラム
  • 動画オブジェクト
  • "VideoFeatures"動画オブジェクトからの意味ベクトルの列
    "VideoFeatureVector"動画オブジェクトからの意味ベクトル
  • グラフ
  • "GraphFeatures"グラフ特性を要約する数値ベクトル
  • 分子
  • "AtomPairs"原子対と両者の間の経路長からのブールベクトル
    "MoleculeExtendedConnectivity"列挙された分子の部分グラフからのブールベクトル
    "MoleculeFeatures"分子特性を要約する数値ベクトル
    "MoleculeTopologicalFeatures"円形の原子近傍からのブールベクトル
  • 特徴抽出器法は互換タイプのデータ要素に適用される.その他のデータ要素は変更なしで返される.
  • FeatureExtract[examples]FeatureExtract[examples,"NumericVector"]と等価であることが多い.
  • FeatureExtract[examples,specext]あるいはFeatureExtract[examples,{spec1ext1,}]での specspeciの可能な形
  • All各例のすべての部分
    i各例の i 番目の部分
    {i1,i2,}各例の部分 i1, i2,
    "name"各例の指定された名前のある部分
    {"name1","name2",}各例の"namei"という名前の部分
  • spec あるいは speciで言及されていない部分は,特徴抽出の目的では削除される.
  • FeatureExtract[examples,{spec1ext1,}]では,extiはすべて別々に examples に適用される.
  • 使用可能なオプション
  • FeatureNames Automaticexampleiの要素に割り当てる名前
    FeatureTypes Automaticexampleiの要素に仮定する特徴タイプ
    RandomSeeding1234どのような擬似乱数生成器のシードを内部的に使うべきか
  • RandomSeedingの可能な設定
  • Automatic関数が呼び出されるたびに自動的にシードを変える
    Inherited外部シードの乱数を使う
    seed明示的な整数または文字列をシードとして使う
  • FeatureExtract[]FeatureExtraction[,"ExtractedFeatures"]に等しい.

例題

すべて開くすべて閉じる

  (4)

単純なデータ集合から特徴を抽出する:

画像から特徴を抽出する:

"StandardizedVector"抽出器法を使って数値を標準化する:

抽出器法の"SegmentedCharacters""TFIDF"を繋ぎ合せて特徴についてのTFIDFベクトルを抽出する:

スコープ  (10)

DateObjectのリストから特徴を抽出する:

特徴抽出器をGraphのリストで訓練する:

特徴抽出器をTimeSeriesのリストで訓練する:

テキストからTFIDFベクトルを計算する:

デフォルトで,テキストは単語に分割される.これでも同じ結果が与えられる:

"TFIDF"法を使い,続けて"DimensionReduced"法を使ってテキストから特徴を抽出する:

"IndicatorVector"法を名義変数に使って特徴を抽出する:

"IndicatorVector"法を第2名義変数のみに使って特徴を抽出する:

Identity抽出器法を使って第1変数も同様にコピーする:

変数は複数回コピーすることができる:

混合タイプのデータ集合からの特徴抽出:

"TFIDF"法を使ってテキストと画像から特徴を抽出する:

"TFIDF"は画像には適用されないので,特徴はテキスト部分のみから抽出された.

欠落値があるデータ集合から特徴を抽出する:

連想のリストとしてフォーマットされたデータ集合から特徴を抽出する:

オプション  (2)

FeatureNames  (1)

FeatureNamesを使って特徴に名前を付け,部分指定にその名前を使う:

FeatureTypes  (1)

"IndicatorVector"法で単純なデータ集合から特徴を抽出する:

最初の特徴は数値と解釈される."IndicatorVector"法は名義的特徴にしか作用しないので,最初の特徴はそのまま返される.

FeatureTypesを使って最初の特徴が名義的であると強制的に解釈させる:

アプリケーション  (1)

データ集合の可視化  (1)

犬の画像のデータ集合を作る:

このデータ集合から特徴を抽出する:

抽出されたベクトルの次元を2に減ずる:

画像をその特徴位置で可視化する:

FeatureSpacePlotを使っても,同じような可視化を直接得ることができる:

Wolfram Research (2016), FeatureExtract, Wolfram言語関数, https://reference.wolfram.com/language/ref/FeatureExtract.html (2021年に更新).

テキスト

Wolfram Research (2016), FeatureExtract, Wolfram言語関数, https://reference.wolfram.com/language/ref/FeatureExtract.html (2021年に更新).

CMS

Wolfram Language. 2016. "FeatureExtract." Wolfram Language & System Documentation Center. Wolfram Research. Last Modified 2021. https://reference.wolfram.com/language/ref/FeatureExtract.html.

APA

Wolfram Language. (2016). FeatureExtract. Wolfram Language & System Documentation Center. Retrieved from https://reference.wolfram.com/language/ref/FeatureExtract.html

BibTeX

@misc{reference.wolfram_2024_featureextract, author="Wolfram Research", title="{FeatureExtract}", year="2021", howpublished="\url{https://reference.wolfram.com/language/ref/FeatureExtract.html}", note=[Accessed: 22-November-2024 ]}

BibLaTeX

@online{reference.wolfram_2024_featureextract, organization={Wolfram Research}, title={FeatureExtract}, year={2021}, url={https://reference.wolfram.com/language/ref/FeatureExtract.html}, note=[Accessed: 22-November-2024 ]}