ZipfDistribution
母数 ρ のゼータ分布を表す.
ZipfDistribution[n,ρ]
範囲 n のZipf分布を表す.
詳細
- ZipfDistribution[ρ]は離散パレート分布としても知られている.
- ZipfDistribution[n,ρ]はEstoup分布としても知られている.
- 値 と有限な の確率は で与えられる.無限の については で与えられる.
- ZipfDistributionでは,ρ は任意の正の実数でよく,n は任意の正の整数でよい.
- ZipfDistributionは,Mean,CDF,RandomVariate等の関数で使うことができる. »
予備知識
- ZipfDistribution[n,ρ]は,整数値 について定義され,正の実数 ρ および正の整数 n (分布の範囲)によって決定される離散統計分布を表す.Zipf分布の確率密度関数(PDF)は離散的で単調減少であり,その全体的な形(広がり,領域,傾斜が急かどうか)は母数 ρ および n の値によって決まる.ここで定義しているZipf分布はEstoup分布と呼ばれることがある.母数が1つの形のZipfDistribution[ρ]は n→∞ ときのZipfDistribution[n,ρ]の極限に等しく,最も一般的なZipf分布であるが,ゼータ分布,Zipfian分布,離散パレート分布(連続ParetoDistributionと混同してはならない)等と呼ばれることもある.
- Zipf分布はアメリカ人の言語学者George Zipfに因んで名付けられた.Zipfは1930年代から1940年代にかけて行動と心理についての自身の研究にこの分布を盛んに応用した.この分布は,フランス人の速記者であるBaptiste Estoupによってすでに1912年から同様の文脈で応用されていたが,Zipfの研究によってZipf分布が基礎となっている現在Zipfの法則と呼ばれるものが誕生した.この法則は,自然言語における任意の単語の使用頻度は,度数分布と関連したその言語におけるその語の順位と反比例すると述べている.このため,現代におけるZipf分布の応用分野は言語学および意味論関連が多くなっている.しかし,この分布は数論,生物学,経済学においても使用されている.
- RandomVariateを使って,Zipf分布から,1つあるいは複数の機械精度あるいは任意精度(後者はWorkingPrecisionオプションを介す)の擬似乱数変量を得ることができる.Distributed[x,ZipfDistribution[n,ρ]](より簡略な表記では xZipfDistribution[n,ρ])を使って,確率変数 x がZipf分布に従って分布していると宣言することができる.このような宣言は,Probability,NProbability,Expectation,NExpectation等の関数で使うことができる.
- 確率密度関数および累積分布関数は,PDF[ZipfDistribution[n,ρ],x]およびCDF[ZipfDistribution[n,ρ],x]を使って得られる.平均,中央値,分散,原点の周りのモーメント,中心モーメントは,それぞれMean,Median,Variance,Moment,CentralMomentを使って計算することができる.これらの数量はDiscretePlotを使って可視化できる.
- DistributionFitTestを使って,与えられたデータ集合がZipf分布と一致するかどうかを検定することが,EstimatedDistributionを使って与えられたデータからパラメトリックZipf分布を推定することが,FindDistributionParametersを使ってデータをZipf分布にフィットすることができる.ProbabilityPlotを使って記号Zipf分布のCDFに対する与えられたデータのCDFのプロットを生成することが,QuantilePlotを使って記号Zipf分布の変位値に対する与えられたデータの変位値のプロットを生成することができる.
- TransformedDistributionを使って変換されたZipf分布を表すことが,CensoredDistributionを使って上限値と下限値の間で切り取られた値の分布を表すことが,TruncatedDistributionを使って上限値と下限値の間で切断された値の分布を表すことができる.CopulaDistributionを使ってZipf分布を含む高次元分布を構築することが,ProductDistributionを使ってZipf分布を含む独立成分分布の結合分布を計算することができる.
- ZipfDistributionは他の数多くの統計分布と関連がある.この分布は,しばしばParetoDistributionの離散バージョンであるとみなされ,したがって,PowerDistribution,StableDistribution,ExponentialDistribution,PearsonDistribution,BetaPrimeDistributionと関係がある.ZipfDistributionは,CauchyDistribution,LevyDistribution,PoissonDistribution,PoissonConsulDistribution,SkellamDistributionとも関連している.
例題
すべて開くすべて閉じるスコープ (7)
サンプルの密度ヒストグラムを推定分布の確率密度関数と比較する:
Momentは閉形式である:
アプリケーション (6)
ZipfDistributionのCDFは右連続関数の例である:
ZipfDistributionを単語頻度のデータにフィットする:
人気度によって15のWebページに順位を付ける.アクセス頻度は のZipf分布に従う.アクセス頻度の分布を求める:
あるオンラインの映画レンタルサイトには2000本の映画があり,人気の高いものはキャッシュを保存してより迅速に提供できるようになっている.リクエストした映画がキャッシュされている確率が0.99になるためにキャッシュする必要がある映画の最低数を求める:
ZipfDistributionを使って乱数間のGCDの分布をモデル化することができる:
テロリストの攻撃による死傷者数はZipfDistributionに従う:
特性と関係 (7)
Zipf分布における最初の値に対する 番目の値の相対頻度は のベキ乗である:
極限では,2番目の値が最初の値のの頻度,3番目の値は最初の値のの頻度という具合になる:
Khintchineの無限に分割可能なリーマン(Riemann)のゼータ分布は,ZipfDistributionに関連している:
考えられる問題 (2)
テキスト
Wolfram Research (2007), ZipfDistribution, Wolfram言語関数, https://reference.wolfram.com/language/ref/ZipfDistribution.html (2010年に更新).
CMS
Wolfram Language. 2007. "ZipfDistribution." Wolfram Language & System Documentation Center. Wolfram Research. Last Modified 2010. https://reference.wolfram.com/language/ref/ZipfDistribution.html.
APA
Wolfram Language. (2007). ZipfDistribution. Wolfram Language & System Documentation Center. Retrieved from https://reference.wolfram.com/language/ref/ZipfDistribution.html