SpeechSynthesize

SpeechSynthesize[expr]

expr のコンテンツの音声をAudioオブジェクトとして合成する.

SpeechSynthesize[expr,voice]

指定された voice を使って音声信号を合成する.

詳細とオプション

  • 音声合成はテキストの読上げとしても知られており,式構造の文字通りの表現ではなく,自然な言葉で表現された音声言語を作成しようとする.
  • SpeechSynthesize["string"]"string"内のテキストを音声合成する.
  • SpeechSynthesize[expr]は,数式,グラフィックス,その他の構造に使うことができる.
  • SpokenString[expr]を使ってSpeechSynthesize[expr]によって生成された音声表現のテキストを得る.
  • SpeechSynthesize[expr]はデフォルトの声を使って音声合成を行う.VoiceStyleDataは使用可能なすべての声のリストを与える.
  • SpeechSynthesizeには,すべてのSpokenStringオプションに以下を加えたものを使うことができる. [全オプションのリスト]
  • GeneratedAssetFormatAutomatic結果の形式
    GeneratedAssetLocation $GeneratedAssetLocation生成されたデジタルアセットの場所
    Language "English"合成に使用する言語
    Method Automatic使用するメソッド
    OverwriteTarget False既存のファイルを上書きするかどうか
  • 次は,可能なメソッド設定である.
  • Automaticローカルシンセサイザー(デフォルト)
    TemplateBox[{"ElevenLabs", paclet:ref/service/ElevenLabs}, StringTypeLink, BaseStyle -> {2ColumnTableMod}]ElevenLabsシンセサイザー
    "GoogleSpeech"Googleシンセサイザー
  • デフォルトで,合成された音声は$WolframDocumentsDirectory"Audio"ディレクトリに置かれる.
  • Language->Automaticを使うと,"string"の言語はLanguageIdentifyを使って識別される.
  • SpeechSynthesizeは機械学習を使う.含まれるメソッド,訓練集合,バイアスは,Wolfram言語のバージョンによって異なることがあり,与えられる結果も異なる可能性がある.
  • 全オプションのリスト

    • "ArraySizeLimit"Infinity配列の要素あるいは関数の引数の最大数
      "DetailedGraphics"Falseグラフィックスプリミティブの説明を制御
      "ExpressionDepthLimit"Infinity出力に許容される式の最大深度
      GeneratedAssetFormatAutomatic結果の形式
      GeneratedAssetLocation$GeneratedAssetLocation生成されたデジタルアセットの場所
      "IncludeParentheses"False部分式の区切りを制御する
      "IntegerLimit"Infinity全桁を与えられる最大の整数
      Language"English"合成に使用する言語
      MethodAutomatic使用するメソッド
      OverwriteTargetFalse既存のファイルを上書きするかどうか
      "PostProcess"TrueSpeakに含まれる特殊な書式を出力から除くかどうか
      "RealPrecisionLimit"3近似数に有効桁を何桁含ませるか
      "StringLengthLimit"Infinity文字列と記号名の最大文字数

例題

すべて開くすべて閉じる

  (2)

短いテキストの音声合成:

音声合成された式の音声形式:

スコープ  (5)

特定の声を使った音声合成:

$VoiceStylesを使って使用可能な声のリストを得る:

女性の声を使って音声合成する:

イタリア人の声を使って音声合成する:

Associationで指定された声を使って音声合成する:

オプション  (5)

GeneratedAssetLocation  (1)

生成されたデジタルアセットのための場所を指定する:

GeneratedAssetLocationNoneを使ってインコアAudioオブジェクトを作る:

Language  (2)

イタリア語の文を合成する:

イタリア語のアクセントを使って英語の文を合成する:

合成する前に英語のテキストをイタリア語に翻訳する:

可能な場合は,LanguageAutomaticを使って自動的に言語を検出し,適切な声を使うことができる.

Method  (1)

デフォルトで,ローカルで使用可能なシンセサイザーが使用される:

GoogleSpeech APIを使用する:

ElevenLabsを使用する:

OverwriteTarget  (1)

デフォルトで,既存のファイルは上書きされない:

ターゲットファイルを上書きする:

特性と関係  (1)

Speakを使って直ちに式を音声表現し始める:

AudioPlayを使って合成音声を再生する:

Wolfram Research (2017), SpeechSynthesize, Wolfram言語関数, https://reference.wolfram.com/language/ref/SpeechSynthesize.html (2024年に更新).

テキスト

Wolfram Research (2017), SpeechSynthesize, Wolfram言語関数, https://reference.wolfram.com/language/ref/SpeechSynthesize.html (2024年に更新).

CMS

Wolfram Language. 2017. "SpeechSynthesize." Wolfram Language & System Documentation Center. Wolfram Research. Last Modified 2024. https://reference.wolfram.com/language/ref/SpeechSynthesize.html.

APA

Wolfram Language. (2017). SpeechSynthesize. Wolfram Language & System Documentation Center. Retrieved from https://reference.wolfram.com/language/ref/SpeechSynthesize.html

BibTeX

@misc{reference.wolfram_2024_speechsynthesize, author="Wolfram Research", title="{SpeechSynthesize}", year="2024", howpublished="\url{https://reference.wolfram.com/language/ref/SpeechSynthesize.html}", note=[Accessed: 24-November-2024 ]}

BibLaTeX

@online{reference.wolfram_2024_speechsynthesize, organization={Wolfram Research}, title={SpeechSynthesize}, year={2024}, url={https://reference.wolfram.com/language/ref/SpeechSynthesize.html}, note=[Accessed: 24-November-2024 ]}