WordFrequencyData
WordFrequencyData[word]
出版された典型的な英語のテキストにおける word の頻度を与える.
WordFrequencyData[{word1,word2,…}]
wordiの頻度の連想を与える.
WordFrequencyData[word,"TimeSeries"]
出版された典型的な英語のテキストにおける word の頻度の時系列を与える.
WordFrequencyData[word,"TimeSeries",datespec]
datespec で指定された日付の時系列を与える.
WordFrequencyData[word,"prop"]
単語頻度についての特性 prop を与える.
詳細とオプション
- WordFrequencyData[word1word2…]はすべての wordiの総頻度を与える.
- WordFrequencyData[word,"Total",datespec]は,datespec で指定された日付における word の総頻度を与える.
- デフォルトで,WordFrequencyDataはGoogle Books Englishのnグラム出版データ集合を使用する.
- 使用可能なオプション
-
IgnoreCase False word の大文字小文字の違いを無視するかどうか Language "English" 言語資料として何語を使うか - WordFrequencyData[word,"prop"]で使用可能な特性
-
"Total" 日付範囲における総頻度を与える "TimeSeries" 頻度の時系列を与える "CaseVariants" 大文字小文字の違いのすべての形についての結果を与える "PartsOfSpeechVariants" 品詞のすべての形についての結果を与える {prop1,prop2,…} 特性の組合せについての結果を与える - 使用可能な日付指定
-
All 指定された言語資料について使用可能なすべての日付を使う DateObject[…] DateObjectを使う year 特定の year を使う {yearmin,yearmax} yearminから yearmaxまでの年の範囲を使う {{d1,d2,…}} 明示的な日付{d1,d2,…}を使う
例題
すべて開くすべて閉じる例 (4)
スコープ (4)
WordFrequencyDataには特定の"GrammaticalUnit"の入力TextElementを使うことができる:
一般化と拡張 (1)
Alternativesが入力として用いられた場合,結果は任意の代替形式についての総頻度になる:
Alternativesは,"TimeSeries"等の他の特性と組み合せて使うことができる:
オプション (6)
IgnoreCase (1)
大文字小文字の違いを無視して単語の頻度を返す.デフォルト値はFalseである:
特性と関係 (14)
"CaseVariants" (3)
単語は大文字と小文字をさまざまに使い分けられる可能性がある:
IgnoreCase->Trueで単語の頻度を得ることは,上記のリストのTotalを求めることに等しい:
"PartOfSpeechVariants" (4)
"TimeSeries" (2)
これは,DateListPlotを使って直接プロットすることができる:
"Total" (5)
考えられる問題 (1)
コーパスに含まれない単語はMissing["NotAvailable"]を返す:
テキスト
Wolfram Research (2016), WordFrequencyData, Wolfram言語関数, https://reference.wolfram.com/language/ref/WordFrequencyData.html.
CMS
Wolfram Language. 2016. "WordFrequencyData." Wolfram Language & System Documentation Center. Wolfram Research. https://reference.wolfram.com/language/ref/WordFrequencyData.html.
APA
Wolfram Language. (2016). WordFrequencyData. Wolfram Language & System Documentation Center. Retrieved from https://reference.wolfram.com/language/ref/WordFrequencyData.html