PitchRecognize

PitchRecognize[audio]

audio のメインピッチを認識し,TimeSeriesオブジェクトして返す.

PitchRecognize[audio,spec]

指定の spec に従って処理されたメインピッチを返す.

PitchRecognize[video,]

video の最初の音声トラックのメインピッチを認識する.

詳細とオプション

  • PitchRecognizeは,ピッチ検出あるいはピッチ追跡としても知られている.
  • PitchRecognizeは,信号が指定された任意の時間に単一ピッチを含んでいると仮定する.
  • 指定の時間にピッチが検出されなかった場合は,その時間についてMissing[]値が返される.
  • ピッチ指定 spec は以下のいずれの形式でもよい.
  • "Frequency"Hz単位の周波数(デフォルト)
    "FrequencyMagnitude"Hz単位の周波数の大きさ
    "QuantizedFrequency"Hz単位の量子化された周波数
    {"QuantizedFrequency",list}list の値に量子化された,Hz単位の周波数
    "MIDI",ただし freq はHz単位の周波数
    "QuantizedMIDI"丸めたMIDIの値
    "SoundNotePitch"0が(SoundNoteにおけるように)中央ハになるピッチ指定
    f認識された周波数に適用される任意の関数 f
  • 次は,使用可能なオプションである.
  • AcceptanceThreshold Automatic受容可能であるとみなす最小確率
    AlignmentCenterタイムスタンプとパーティションの揃え方
    AllowedFrequencyRange Automatic最大および最小の周波数
    MetaInformationNone追加的なメタ情報を含む
    Method Automatic使用するメソッド
    MissingDataMethodNone欠損値に使用するメソッド
    PartitionGranularityAutomatic音声分割指定
    PerformanceGoal "Speed"最適化を試みるパフォーマンスの局面
    ResamplingMethodAutomatic経路のリサンプリングに使用するメソッド
  • Methodの可能な設定には以下がある.
  • Automatic自動選択
    "CREPE"ピッチ推定用に訓練されたニューラルネットワーク
    "Speech"ボコーダに基づくスピーチ基本周波数推定
    "YIN"YINに基づくアルゴリズム
  • Method->{"CREPE",TargetDevice->dev}を使って,デバイス dev 上でニューラルネット評価を行う.
  • PitchRecognizeは機械学習を使う.含まれるメソッド,訓練集合,バイアスはWolfram言語のバージョンによって違う可能性があり,結果として異なる結果を与えることがある.
  • PitchRecognizeはリソースをダウンロードすることがある.ダウンロードされたリソースは,$LocalBaseのローカルなオブジェクトストアに保存され,LocalObjects[]でリストしたりResourceRemoveで削除したりできる.

例題

すべて開くすべて閉じる

  (1)

録音音声のピッチを認識する:

スコープ  (5)

ピッチを認識し,周波数をHzで返す:

結果をMIDI指定で表す:

量子化されたピッチを認識する:

標準的なMIDIのピッチに対応する,Hz単位で量子化された周波数:

量子化されたMIDI指定:

量子化されたSoundNote指定:

特定の値のリストを使って量子化された周波数:

任意の関数を使って修正されたピッチを認識する:

中央イが432Hzに設定されたMIDI指定を定義する:

ピッチを認識する:

動画のピッチを認識する:

オプション  (7)

AcceptanceThreshold  (1)

より高いAcceptanceThresholdを設定して最も確かな予測だけを保持するようにする:

AllowedFrequencyRange  (1)

特定の周波数範囲を使ってピッチ認識の結果を制限する:

Method  (4)

デフォルトメソッドは"YIN"アルゴリズムのバリエーションを使う:

ニューラルネットワークを使ってピッチを計算する"CREPE"メソッドを使う:

"CREPE"メソッドは"YIN"メソッドよりも計算的により高価である:

楽器に関しては,"CREPE"メソッドで訓練されたネットワークがより正確である:

スピーチ信号については,"Speech"メソッドの方がより正確である:

PerformanceGoal  (1)

PerformanceGoal"Speed"に設定して"CREPE"メソッドを使うことで,同じデータ集合について訓練されたより小さくより高速なネットワークを使う:

計算速度はかなり速く,計算も正確である:

アプリケーション  (4)

人間の声のピッチを認識する:

ピッチのTimeSeriesを計算する:

ピッチをプロットする:

ピッチの平均を計算する:

女声は男声よりもピッチが高いのが普通である:

音声録音で使われたチェロのチューニングをチェックする:

ピッチのTimeSeriesを計算する:

ピッチの平均を計算する:

チェロで演奏されるイの音の期待される周波数は110Hzである.このチェロはうまくチューニングされている.

単音楽器の音を転写する:

ピッチを計算し,それをSoundNote指定で表現する:

すべてのMissing[]値を除去する:

演奏された各音のピッチと境界を得る:

Soundオブジェクトを作る:

別の楽器を使ってサウンドを作る:

ピッチを認識して信号を再構築する.バッハのフーガの録音から始める:

"CREPE"メソッドを使って信号のピッチを追跡し,量子化した周波数を返す:

認識したピッチを使って音声信号を生成する:

特性と関係  (1)

"CREPE"メソッドはWolfram Neural Net RepositoryのCREPE ネットワークを使う:

考えられる問題  (1)

"YIN"メソッドが使われると,認識におけるオクターブエラーが起こるかもしれない:

AllowedFrequencyRangeオプションの値を調整してこの問題を軽減する:

おもしろい例題  (1)

認識されたピッチを色のリストとして可視化する:

別の例:

Wolfram Research (2019), PitchRecognize, Wolfram言語関数, https://reference.wolfram.com/language/ref/PitchRecognize.html (2024年に更新).

テキスト

Wolfram Research (2019), PitchRecognize, Wolfram言語関数, https://reference.wolfram.com/language/ref/PitchRecognize.html (2024年に更新).

CMS

Wolfram Language. 2019. "PitchRecognize." Wolfram Language & System Documentation Center. Wolfram Research. Last Modified 2024. https://reference.wolfram.com/language/ref/PitchRecognize.html.

APA

Wolfram Language. (2019). PitchRecognize. Wolfram Language & System Documentation Center. Retrieved from https://reference.wolfram.com/language/ref/PitchRecognize.html

BibTeX

@misc{reference.wolfram_2024_pitchrecognize, author="Wolfram Research", title="{PitchRecognize}", year="2024", howpublished="\url{https://reference.wolfram.com/language/ref/PitchRecognize.html}", note=[Accessed: 24-November-2024 ]}

BibLaTeX

@online{reference.wolfram_2024_pitchrecognize, organization={Wolfram Research}, title={PitchRecognize}, year={2024}, url={https://reference.wolfram.com/language/ref/PitchRecognize.html}, note=[Accessed: 24-November-2024 ]}