AudioDistance
AudioDistance[audio1,audio2]
audio1と audio2の間の距離測度を返す.
AudioDistance[video1,video2]
video1と video2の音声トラック間の距離測度を返す.
詳細とオプション
- AudioDistanceは,さまざまな距離関数を使って,波形その他の特徴を比較することができる音声オブジェクト間の非類似測度を計算する.
- audio1と audio2の持続時間が異なる場合は,デフォルトで,短い方に合わせて切り取られた信号を使って計算が行われる.
- 次は指定可能なオブションである.
-
DistanceFunction Automatic 使用する距離関数 Masking Automatic 比較に使用する音声区間 PartitionGranularity Automatic 音声分割指定 SampleRate Automatic audioiを合わせるサンプルレート - デフォルトで,DistanceFunction->Automaticを使うと,音声の波形のEuclideanDistanceが計算される.他の測度は他の距離関数や特徴を使って計算される.
- audioiのフーリエ変換から次の距離関数が計算される.
-
"SpectralEuclidean" パワースペクトルに適用されるユークリッド関数(デフォルト) "SpectralItakuraSaito" LPC由来のスペクトル包絡線の最大尤度 "SpectralMagnitudePhaseDistortion" マグニチュードと位相スペクトル距離の平均 "SpectralRMSLog" パワースペクトルの対数に適用されるユークリッド関数 "SpectralFirstOrderDifferential" パワースペクトルの一次導関数間の距離 "SpectralSecondOrderDifferential" パワースペクトルの二次導関数間の距離 "Cepstral" パワーケプストラムに適用されるユークリッド関数 - DistanceFunctionのその他の設定も,さまざまな音声特性に使用することができる.
-
EuclideanDistance ユークリッド距離 SquaredEuclideanDistance 二乗ユークリッド距離 NormalizedSquaredEuclideanDistance 正規化された二乗ユークリッド距離 RootMeanSquare 二乗平均平方距離 ManhattanDistance マンハッタン(市街地)距離 CosineDistance 角余弦距離 CorrelationDistance 相関係数距離 WarpingDistance 動的タイムワーピング(DTW)距離 f 任意の関数 f - デフォルトで,WarpingDistanceは"MFCC"の特徴から計算され,その他のすべての距離は"AudioData"から計算される.
- DistanceFunction->{method,FeatureExtractor->f}を使うと別の特徴抽出器が指定できる.
- 次は,FeatureExtractorの可能な設定である.
-
"AudioData" 音声データ "Formants" 信号のフォルマント周波数 "LPC" 線形予測係数 "MelSpectrogram" メル尺度音声スペクトログラム "MFCC" メル周波数ケプストラム係数ベクトル列 "Novelty" 著しい変化の推定測度 "Spectrogram" スペクトログラム - デフォルトで,AudioDistanceは,短い方の持続時間に合わせて切り取られた信号について計算される.
- Maskingオプションを使ってさまざまな区間の距離測度を計算する.次は,使用可能な設定である.
-
Automatic 短い方の持続時間に合わせて切り取る(デフォルト) All 長い方の持続時間に合わせて充填する {t1,t2} 時点 t1から t2までの信号を比較する {{t11,t12},{t21,t22}} audio1の t11から t12までを audio2の t21から t22まで - Masking->{{t22,t12}},{t21,t22}}を使うと,2区間の持続時間が同じになる.
- PartitionGranularityは,"MFCC"のように分割された音声に使える特徴のみと使うことができる.それ以外の場合には無視される.
- デフォルトで,SampleRate->Automaticは,すべての audioiの中で最も高いサンプルレートを使う.
例題
すべて開くすべて閉じるオプション (13)
DistanceFunction (6)
デフォルトで,"SpectralEuclidean"距離が使われる:
スペクトルについて計算した距離は,サンプル値ではなく周波数成分を比較する:
ほとんどの距離が"AudioData"をデフォルトの特徴として使う:
WarpingDistanceでは,"MFCC"特徴がデフォルトで使われる:
Masking (4)
PartitionGranularity (2)
テキスト
Wolfram Research (2018), AudioDistance, Wolfram言語関数, https://reference.wolfram.com/language/ref/AudioDistance.html (2024年に更新).
CMS
Wolfram Language. 2018. "AudioDistance." Wolfram Language & System Documentation Center. Wolfram Research. Last Modified 2024. https://reference.wolfram.com/language/ref/AudioDistance.html.
APA
Wolfram Language. (2018). AudioDistance. Wolfram Language & System Documentation Center. Retrieved from https://reference.wolfram.com/language/ref/AudioDistance.html