AudioDistance

AudioDistance[audio1,audio2]

audio1audio2の間の距離測度を返す.

AudioDistance[video1,video2]

video1video2の音声トラック間の距離測度を返す.

詳細とオプション

  • AudioDistanceは,さまざまな距離関数を使って,波形その他の特徴を比較することができる音声オブジェクト間の非類似測度を計算する.
  • audio1audio2の持続時間が異なる場合は,デフォルトで,短い方に合わせて切り取られた信号を使って計算が行われる.
  • 次は指定可能なオブションである.
  • DistanceFunction Automatic使用する距離関数
    Masking Automatic比較に使用する音声区間
    PartitionGranularity Automatic音声分割指定
    SampleRate Automaticaudioiを合わせるサンプルレート
  • デフォルトで,DistanceFunction->Automaticを使うと,音声の波形のEuclideanDistanceが計算される.他の測度は他の距離関数や特徴を使って計算される.
  • audioiのフーリエ変換から次の距離関数が計算される.
  • "SpectralEuclidean"パワースペクトルに適用されるユークリッド関数(デフォルト)
    "SpectralItakuraSaito"LPC由来のスペクトル包絡線の最大尤度
    "SpectralMagnitudePhaseDistortion"マグニチュードと位相スペクトル距離の平均
    "SpectralRMSLog"パワースペクトルの対数に適用されるユークリッド関数
    "SpectralFirstOrderDifferential"パワースペクトルの一次導関数間の距離
    "SpectralSecondOrderDifferential"パワースペクトルの二次導関数間の距離
    "Cepstral"パワーケプストラムに適用されるユークリッド関数
  • DistanceFunctionのその他の設定も,さまざまな音声特性に使用することができる.
  • EuclideanDistanceユークリッド距離
    SquaredEuclideanDistance二乗ユークリッド距離
    NormalizedSquaredEuclideanDistance正規化された二乗ユークリッド距離
    RootMeanSquare二乗平均平方距離
    ManhattanDistanceマンハッタン(市街地)距離
    CosineDistance角余弦距離
    CorrelationDistance相関係数距離
    WarpingDistance動的タイムワーピング(DTW)距離
    f任意の関数 f
  • デフォルトで,WarpingDistance"MFCC"の特徴から計算され,その他のすべての距離は"AudioData"から計算される.
  • DistanceFunction->{method,FeatureExtractor->f}を使うと別の特徴抽出器が指定できる.
  • 次は,FeatureExtractorの可能な設定である.
  • "AudioData"音声データ
    "Formants"信号のフォルマント周波数
    "LPC"線形予測係数
    "MelSpectrogram"メル尺度音声スペクトログラム
    "MFCC"メル周波数ケプストラム係数ベクトル列
    "Novelty"著しい変化の推定測度
    "Spectrogram"スペクトログラム
  • デフォルトで,AudioDistanceは,短い方の持続時間に合わせて切り取られた信号について計算される.
  • Maskingオプションを使ってさまざまな区間の距離測度を計算する.次は,使用可能な設定である.
  • Automatic短い方の持続時間に合わせて切り取る(デフォルト)
    All長い方の持続時間に合わせて充填する
    {t1,t2}時点 t1から t2までの信号を比較する
    {{t11,t12},{t21,t22}}audio1t11から t12までを audio2t21から t22まで
  • Masking->{{t22,t12}},{t21,t22}}を使うと,2区間の持続時間が同じになる.
  • PartitionGranularityは,"MFCC"のように分割された音声に使える特徴のみと使うことができる.それ以外の場合には無視される.
  • デフォルトで,SampleRate->Automaticは,すべての audioiの中で最も高いサンプルレートを使う.

例題

すべて開くすべて閉じる

  (1)

2つの音声オブジェクト間の距離:

スコープ  (2)

長さが異なる2つの音声信号間の距離:

長い方の信号は短い方に合わせるように切り取られる:

2つの動画の音声トラック間の距離:

オプション  (13)

DistanceFunction  (6)

デフォルトで,"SpectralEuclidean"距離が使われる:

音声信号のサンプル値について,さまざまな距離を計算する:

スペクトルについて計算した距離は,サンプル値ではなく周波数成分を比較する:

信号の位相の相違は計算されたスペクトル距離には影響しない:

デフォルトで,距離測度は最も適した音声特徴を使用する:

ほとんどの距離が"AudioData"をデフォルトの特徴として使う:

WarpingDistanceでは,"MFCC"特徴がデフォルトで使われる:

別の特徴を指定する:

"AudioData"以外の特徴はどれも,信号の短時間フーリエ変換から計算される:

Masking  (4)

2つの信号の長さが異なる場合は,長い方が短い方に合わせて切り取られる:

信号の長さ全体を比較する場合にはMasking->Allを使う:

Maskingオプションを使って2つの音声オブジェクトの特定の区間を比較する:

区間の持続時間が同じ限り,それらを別の時間から選ぶことができる:

MaskingAllを使って信号全体を比較する:

PartitionGranularity  (2)

PartitionGranularityオプションを使って特徴の計算を制御する:

選択された特徴が"AudioData"なら,PartitionGranularityオプションは無視される:

SampleRate  (1)

デフォルトで,すべての音声信号がより高いサンプルレートに変換される:

特定のサンプルレートを使用する:

アプリケーション  (1)

異なる振動子間の距離:

波形を視覚的に比較する:

Wolfram Research (2018), AudioDistance, Wolfram言語関数, https://reference.wolfram.com/language/ref/AudioDistance.html (2024年に更新).

テキスト

Wolfram Research (2018), AudioDistance, Wolfram言語関数, https://reference.wolfram.com/language/ref/AudioDistance.html (2024年に更新).

CMS

Wolfram Language. 2018. "AudioDistance." Wolfram Language & System Documentation Center. Wolfram Research. Last Modified 2024. https://reference.wolfram.com/language/ref/AudioDistance.html.

APA

Wolfram Language. (2018). AudioDistance. Wolfram Language & System Documentation Center. Retrieved from https://reference.wolfram.com/language/ref/AudioDistance.html

BibTeX

@misc{reference.wolfram_2024_audiodistance, author="Wolfram Research", title="{AudioDistance}", year="2024", howpublished="\url{https://reference.wolfram.com/language/ref/AudioDistance.html}", note=[Accessed: 18-November-2024 ]}

BibLaTeX

@online{reference.wolfram_2024_audiodistance, organization={Wolfram Research}, title={AudioDistance}, year={2024}, url={https://reference.wolfram.com/language/ref/AudioDistance.html}, note=[Accessed: 18-November-2024 ]}