WordFrequencyData

WordFrequencyData[word]

出版された典型的な英語のテキストにおける word の頻度を与える.

WordFrequencyData[{word1,word2,}]

wordiの頻度の連想を与える.

WordFrequencyData[word,"TimeSeries"]

出版された典型的な英語のテキストにおける word の頻度の時系列を与える.

WordFrequencyData[word,"TimeSeries",datespec]

datespec で指定された日付の時系列を与える.

WordFrequencyData[word,"prop"]

単語頻度についての特性 prop を与える.

詳細とオプション

  • WordFrequencyData[word1|word2|]はすべての wordiの総頻度を与える.
  • WordFrequencyData[word,"Total",datespec]は,datespec で指定された日付における word の総頻度を与える.
  • デフォルトで,WordFrequencyDataはGoogle Books Englishのnグラム出版データ集合を使用する.
  • 使用可能なオプション
  • IgnoreCase Falseword の大文字小文字の違いを無視するかどうか
    Language "English"言語資料として何語を使うか
  • WordFrequencyData[word,"prop"]で使用可能な特性
  • "Total"日付範囲における総頻度を与える
    "TimeSeries"頻度の時系列を与える
    "CaseVariants"大文字小文字の違いのすべての形についての結果を与える
    "PartsOfSpeechVariants"品詞のすべての形についての結果を与える
    {prop1,prop2,}特性の組合せについての結果を与える
  • 使用可能な日付指定
  • All指定された言語資料について使用可能なすべての日付を使う
    DateObject[]DateObjectを使う
    year特定の year を使う
    {yearmin,yearmax}yearminから yearmaxまでの年の範囲を使う
    {{d1,d2,}}明示的な日付{d1,d2,}を使う

例題

すべて開くすべて閉じる

  (4)

標準的な英語における単語"dog"の頻度を得る:

複数の単語の標準的な頻度を得る:

出版テキストにおける単語"war""peace"の比を計算する:

"economy"という言葉の頻度について歴史的な時系列をプロットする:

スコープ  (4)

"atlas"の全体的な頻度を得る:

複数の単語の頻度を一度に得る:

WordFrequencyDataには特定の"GrammaticalUnit"の入力TextElementを使うことができる:

単語"computer"の頻度について,1900年からの歴史的な時系列をプロットする:

一般化と拡張  (1)

Alternativesが入力として用いられた場合,結果は任意の代替形式についての総頻度になる:

Alternativesは,"TimeSeries"等の他の特性と組み合せて使うことができる:

オプション  (6)

IgnoreCase  (1)

大文字小文字の違いを無視して単語の頻度を返す.デフォルト値はFalseである:

この値は,普通はデフォルトよりも大きい:

Language  (5)

スペイン語中のよく使われるスペイン語の単語の頻度を求める:

スペイン語の単語には他の言語で使われるものもあるが,頻度ははるかに低い:

フランス語でよく使われる単語は高い頻度値を返す:

"peace"に相当するスペイン語の注目度:

"Sputnik"に相当するロシア語の単語:

ドイツ語の"Haus"という単語の1900年から現在までの時系列を得て結果をプロットする:

特性と関係  (14)

"CaseVariants"  (3)

単語は大文字と小文字をさまざまに使い分けられる可能性がある:

IgnoreCase->Trueで単語の頻度を得ることは,上記のリストのTotalを求めることに等しい:

"DOS"という語の最も頻繁に使われる大文字小文字の使い方を得る:

複数の単語について尋ねると,各単語についてのすべての変形を含む連想が返される:

"PartOfSpeechVariants"  (4)

特定の年について,ある単語の全品詞についての頻度を計算する:

1944年における"nuke"という語の用法を品詞分類する:

単語によってはさまざまな品詞が返されるものがある:

この引数を"CaseVariants"と組み合せる:

"CaseVariants""TimeSeries"を組み合せる:

"TimeSeries"  (2)

20世紀を通して単語"war"の頻度を得る:

これは,DateListPlotを使って直接プロットすることができる:

長期間における"peace""war"の用法を比較する:

次に,他の言語における用法と比較する:

両言語における"war""peace"の比をプロットする:

"Total"  (5)

"Total"はデフォルト特性である:

単純な日付範囲について:

日付指定でDateObjectオブジェクトを使用することができる:

"Total"は特定の年のリストについて計算することができる:

Infinityを使って無境界範囲を指定することができる:

考えられる問題  (1)

コーパスに含まれない単語はMissing["NotAvailable"]を返す:

おもしろい例題  (11)

単語"dog"と他言語におけるその翻訳の使われ方は異なる:

単語"gold"と単語"oil"の長期間における比較:

時とともに変化する電話とテレビという語の頻度:

同意語をまとめる:

よく見られる疾病:

曜日を使用頻度でソートする:

単語の中には昔の正書法を失ったものもある:

"democracy"という単語は20世紀になってから使用頻度が高くなった:

頭文字を大文字にした"Apple"は,1980年以降によく使われるようになった:

単語の中には時間の中で品詞の使用頻度が変わったものもある."Tackle"の動詞と名詞の用法はそのよい例である:

"burnt""burned"のような不規則動詞の規則化は,ある種の単語の品詞と正書法の変化を説明している:

スペイン語における"ustedes""vosotros"の進化:

Wolfram Research (2016), WordFrequencyData, Wolfram言語関数, https://reference.wolfram.com/language/ref/WordFrequencyData.html.

テキスト

Wolfram Research (2016), WordFrequencyData, Wolfram言語関数, https://reference.wolfram.com/language/ref/WordFrequencyData.html.

CMS

Wolfram Language. 2016. "WordFrequencyData." Wolfram Language & System Documentation Center. Wolfram Research. https://reference.wolfram.com/language/ref/WordFrequencyData.html.

APA

Wolfram Language. (2016). WordFrequencyData. Wolfram Language & System Documentation Center. Retrieved from https://reference.wolfram.com/language/ref/WordFrequencyData.html

BibTeX

@misc{reference.wolfram_2024_wordfrequencydata, author="Wolfram Research", title="{WordFrequencyData}", year="2016", howpublished="\url{https://reference.wolfram.com/language/ref/WordFrequencyData.html}", note=[Accessed: 22-November-2024 ]}

BibLaTeX

@online{reference.wolfram_2024_wordfrequencydata, organization={Wolfram Research}, title={WordFrequencyData}, year={2016}, url={https://reference.wolfram.com/language/ref/WordFrequencyData.html}, note=[Accessed: 22-November-2024 ]}