FeatureExtraction

FeatureExtraction[{example1,example2,}]

与えられた例で訓練されたFeatureExtractorFunction[]を生成する.

FeatureExtraction[examples,extractor]

指定の特徴抽出器法を使う.

FeatureExtraction[examples,{extractor1,extractor2,}]

extractoriを順に適用して特徴抽出器を生成する.

FeatureExtraction[examples,specext]

ext で指定された抽出器法を,spec で指定された examples の部分に適用する.

FeatureExtraction[examples,{spec1ext1,spec2ext2,}]

抽出器法 extiを,speciで指定された examples の部分に適用する.

FeatureExtraction[examples,extractor,props]

props で指定された特徴抽出器の特性を与える.

詳細とオプション

  • FeatureExtractionは,数値,テキスト,サウンド,画像,グラフ,時系列,それらの組合せを含む数多くのデータ型に使うことができる.
  • exampleiは,単一のデータ要素,データ要素のリスト,データ要素の連想,あるいはDatasetオブジェクトでよい.
  • FeatureExtraction[examples]は,特定のデータに適用可能なFeatureExtractorFunction[]を返す.
  • 使用可能な特徴抽出メソッドには以下がある.
  • Automatic自動抽出
    Identityデータを変更せずに与える
    "ConformedData"一致する画像,色,日付等
    "NumericVector"任意のデータからの数値ベクトル
    f関数 f を各例に適用する
    {extractor1,extractor2,}一連の抽出器を交互に使う
  • 各データ型について追加的な特徴抽出法を使うことができる.
  • 数値データ
  • "DiscretizedVector"離散化された数値データ
    "DimensionReducedVector"次元を削減した数値ベクトル
    "MissingImputed"欠落値が補完されたデータ
    "StandardizedVector"Standardizeで処理された数値データ
  • 名義データ
  • "IndicatorVector"インジケータベクトルで「ワンホットエンコード」された名義データ
    "IntegerVector"整数で符号化された名義データ
  • テキスト
  • "LowerCasedText"各文字が小文字のテキスト
    "SegmentedCharacters"文字に分割されたテキスト
    "SegmentedWords"単語に分割されたテキスト
    "TFIDF"単語の出現頻度と逆文書頻度のベクトル
    "WordVectors"英語テキストからの意味ベクトル列(英語のみ)
  • 画像
  • "FaceFeatures"ヒトの顔からの意味ベクトル
    "ImageFeatures"画像からの意味ベクトル
    "PixelVector"画像からの画素値のベクトル
  • 音声オブジェクト
  • "AudioFeatures"音声オブジェクトからの意味ベクトル列
    "AudioFeatureVector"音声オブジェクトからの意味ベクトル
    "LPC"音声線形予測係数
    "MelSpectrogram"対数周波数ビンの音声スペクトログラム
    "MFCC"音声メル周波数ケプストラム係数ベクトル列
    "SpeakerFeatures"意味話者ベクトルの列
    "SpeakerFeatureVector"話者の意味ベクトル
    "Spectrogram"音声スペクトログラム
  • 動画オブジェクト
  • "VideoFeatures"動画オブジェクトからの意味ベクトルの列
    "VideoFeatureVector"動画オブジェクトからの意味ベクトル
  • グラフ
  • "GraphFeatures"グラフ特性を要約する数値ベクトル
  • 分子
  • "AtomPairs"原子対と両者間の経路長からのブールベクトル
    "MoleculeExtendedConnectivity"列挙された分子の部分グラフからのブールベクトル
    "MoleculeFeatures"分子の特性を要約する数値ベクトル
    "MoleculeTopologicalFeatures"円形の原子近傍からのブールベクトル
  • 特徴抽出器法は互換タイプのデータ要素に適用される.その他のデータ要素は変更なしで返される.
  • FeatureExtraction[examples]FeatureExtraction[examples,Automatic]に等しい.これは,FeatureExtraction[examples,"NumericVector"]と等しいことが多い.
  • "NumericVector"法は,主に例を数値ベクトルに変換し,欠落データを補完し,DimensionReductionを使って次元を減少させる.
  • FeatureExtraction[examples,extractors,props]では,props は単一の特性あるいは特性のリストでよい.次は使用可能な特性である.
  • "ExtractorFunction"FeatureExtractorFunction[](デフォルト)
    "ExtractedFeatures"特徴抽出後の examples
    "ReconstructedData"抽出と逆抽出後の examples
    "FeatureDistance"抽出器から生成されたFeatureDistance[]
  • FeatureExtraction[examples,specext]あるいはFeatureExtraction[examples,{spec1ext1,}]では,specspeciの可能な形は以下の通りである.
  • All各例のすべての部分
    i各例の i 番目の部分
    {i1,i2,}各例の部分 i1, i2,
    "name"各例の指定された名前のある部分
    {"name1","name2",}各例の"namei"という名前の部分
  • spec あるいは speciで言及されていない部分は,特徴抽出の目的では削除される.
  • FeatureExtraction[examples,{spec1ext1,}]では,extiはすべて別々に examples に適用される.
  • 使用可能なオプション
  • FeatureNames Automaticexampleiの要素に割り当てる名前
    FeatureTypes Automaticexampleiの要素に仮定する特徴タイプ
    RandomSeeding1234どのような擬似乱数生成器のシードを内部的に使うべきか
  • RandomSeedingの可能な設定
  • Automatic関数が呼び出されるたびに自動的にシードを変える
    Inherited外部シードの乱数を使う
    seed明示的な整数または文字列をシードとして使う
  • FeatureExtraction[,"ExtractedFeatures"]FeatureExtract[]に等しい.
  • FeatureExtraction[,"FeatureDistance"]FeatureDistance[FeatureExtraction[]]に等しい.

例題

すべて開くすべて閉じる

  (3)

単純なデータ集合についてFeatureExtractorFunctionを訓練する:

新たな例から特徴を抽出する:

例のリストから特徴を抽出する:

画像のデータ集合について特徴抽出器を訓練する:

訓練集合に特徴抽出器を使う:

"StandardizedVector"抽出器法を使って数値データ集合から特徴抽出器を構築する:

特徴抽出器を訓練集合に使う:

特性"ExtractedFeatures"を使うと,この操作を1ステップで行うことができる:

複数の特性について尋ねることができる:

スコープ  (14)

テキストデータで特徴抽出器を訓練する:

特徴抽出器を新しい例に使う:

DateObjectのリストで特徴抽出器を訓練する:

新たなDateObjectから特徴を抽出する:

日付文字列も与えることができる:

特徴抽出器をGraphのリストで訓練する:

新たなグラフから特徴を抽出する:

特徴抽出器をTimeSeriesのリストで訓練する:

新たなTimeSeriesから特徴を抽出する:

特徴抽出器を訓練して,テキストから単語の出現頻度と逆文書頻度のベクトルを計算させる:

訓練集合の単語の出現頻度と逆文書頻度の行列は,SparseArrayで計算することができる:

行列を可視化する:

"TFIDF"法はトークン化されたデータに使うこともできる:

"TFIDF"法を使い次に"DimensionReduced"法を使って,特徴抽出器をテキストについて訓練する:

訓練集合について特徴を抽出する:

カスタム関数を使って訓練抽出器を生成する:

この抽出器を訓練集合に適用する:

"StandardizedVector"メソッドでカスタム抽出器を繋ぐ:

"IndicatorVector"法を使った名義変数についての特徴抽出器:

新たな例から特徴を抽出する:

第2名義変数のみについて,"IndicatorVector"法で特徴抽出器を訓練する:

第1名義変数は除去される:

Identity抽出器法を使って第1変数をコピーする:

第1変数がコピーされた:

変数は複数回コピーすることができる:

ミックスタイプのデータ集合について特徴抽出器を訓練する:

新たな例から特徴を抽出する:

"TFIDF"法を使ってテキストと画像について特徴抽出器を訓練する:

特徴はテキスト部分からしか抽出されない:

欠落値を含むデータ集合から特徴抽出器を訓練する:

この特徴抽出器は,値が欠けていても特徴を抽出することができる:

"StandardizedVector"法を使って特徴抽出器を訓練する:

新たな例から特徴を抽出する:

特徴抽出器は可逆なので,FeatureExtractorFunction特性"OriginalData"を使って逆抽出を行うことができる:

特徴抽出器の中には逆抽出の近似しかできない物もある:

FeatureExtraction特性"ReconstructedData"を使って,抽出と再構築の後でデータを取得することができる:

特徴抽出器の中には不可逆なものもある:

連想のリストから特徴抽出器を訓練する:

新たな例から特徴を抽出する:

オプション  (3)

FeatureNames  (2)

特徴抽出器を訓練し,各特徴の名前を与える:

連想形式を使って新たな例から特徴を抽出する:

リスト形式も使うことができる:

FeatureNamesを使って名前を設定し,FeatureExtraction[examples,{spec1ext1,}]でそれを参照する:

FeatureTypes  (1)

"IndicatorVector"法で簡単なデータ集合について特徴抽出器を訓練する:

最初の特徴は数値的であると解釈された."IndicatorVector"法は名義的特徴に対してしか動作しないので,最初の特徴は変更されない:

FeatureTypesを使って最初の特徴が名義的であるという解釈を強制する:

アプリケーション  (3)

画像検索  (1)

犬の画像のデータ集合を構築する:

このデータ集合から抽出器関数を訓練する:

このデータ集合の抽出された特徴についてNearestFunctionを生成する:

NearestFunctionを使ってデータ集合の最近画像を描画する関数を構築する:

この関数をデータ集合には含まれない画像に使う:

特徴抽出器関数は似すぎている画像ペアを削除することもできる:

テキスト検索  (1)

「Alice in Wonderland」(不思議の国のアリス)のテキストをロードする:

テキストを文に分割する:

特徴抽出器をこれらの文について訓練する:

文の特徴を使ってNearestFunctionを生成する:

NearestFunctionを使って「Alice in Wonderland」の最も近い文を表示する関数を構築する:

この関数をいくつかのクエリに使う:

インピュテーション(データ補完)  (1)

ExampleDataから"MNIST"データ集合をロードし,画像を保存する:

画像を数値データに変換し,データ集合を訓練集合とテスト集合に分ける:

データ集合の大きさは784である:

"MissingImputed"法を使って特徴抽出器を作成する:

テスト集合ベクトルのいくつかの値をMissing[]で置換し,可視化する:

FeatureExtractorFunction[]を使って欠落値を補完する:

もとの画像,欠落値を含む画像,補完した加増を可視化する:

Wolfram Research (2016), FeatureExtraction, Wolfram言語関数, https://reference.wolfram.com/language/ref/FeatureExtraction.html (2021年に更新).

テキスト

Wolfram Research (2016), FeatureExtraction, Wolfram言語関数, https://reference.wolfram.com/language/ref/FeatureExtraction.html (2021年に更新).

CMS

Wolfram Language. 2016. "FeatureExtraction." Wolfram Language & System Documentation Center. Wolfram Research. Last Modified 2021. https://reference.wolfram.com/language/ref/FeatureExtraction.html.

APA

Wolfram Language. (2016). FeatureExtraction. Wolfram Language & System Documentation Center. Retrieved from https://reference.wolfram.com/language/ref/FeatureExtraction.html

BibTeX

@misc{reference.wolfram_2024_featureextraction, author="Wolfram Research", title="{FeatureExtraction}", year="2021", howpublished="\url{https://reference.wolfram.com/language/ref/FeatureExtraction.html}", note=[Accessed: 22-November-2024 ]}

BibLaTeX

@online{reference.wolfram_2024_featureextraction, organization={Wolfram Research}, title={FeatureExtraction}, year={2021}, url={https://reference.wolfram.com/language/ref/FeatureExtraction.html}, note=[Accessed: 22-November-2024 ]}