非線形回帰パッケージ
組込み関数のFindFitを使うと,非線形最小二乗フィットを実行することができる.関数NonlinearRegressは数多くの回帰診断を与え,出力に何を含めるかを厳密に指定することができる.NonlinearRegressは線形最小二乗フィットの診断を与える線形回帰パッケージ関数のRegressに類似したものである.
NonlinearRegress[data,expr,pars,vars] | モデル expr が data への最適フィットを vars の関数として与えるようにするパラメータ pars の数値を見付け,フィットの診断を与える |
NonlinearRegress[data,{expr,cons},pars,vars] | 指定された制約条件の対象となるモデルにデータをフィットし,最適フィットを探し,制約条件 cons の対象となる診断を与える |
NonlinearRegressの引数 expr は,引数 vars のシンボルおよび引数 pars のシンボルによって完全に指定しなければならない.引数 vars は data で表される独立変数を指定する.引数 pars はフィットするパラメータを指定する.制約条件のあるモデルでは,引数 cons に方程式,不等式,方程式および不等式の論理結合のどれが含まれていてもよい.
引数 data はベクトルのリストでもよい.各ベクトルは独立変数 x1, x2, …の値に続き,関連する応答の観測値 y から成る.また,データ引数は単独のベクトルでもよい.この場合,ベクトルは応答変数の観測値を表し,i 番目の応答に対する独立変数が i に等しいものと仮定する.
{y1,y2,…} | 応答値のリストによって指定されたデータ点.ここで,i は i 番目の応答に関連した独立変数の値 yi である |
{{x11,x12,…,y1},{x21,x22,…,y2},…} | |
行列によって指定されたデータ点.ここで,xik は k 番目の独立変数の i 番目の値で,yi は i 番目の応答である |
NonlinearRegressのデータ指定
モデルのパラメータの推定値は,残差平方和 によって与えられる メリット関数を最小化するよう選ばれる.NonlinearRegressで使用される最適化方法は反復的なので,パラメータ推定値の検索には初期値が必要となる.NonlinearRegressで見付かるパラメータ推定値が メリット関数の極小値を表す可能性があるので,初期値を選ぶ際には注意が必要である.
パラメータはFindFitと同じシンタックスを使って指定する.パラメータは symbol,{symbol,start},{symbol,start0,start1},{symbol,start,min,max},{symbol,start0,start1,min,max}として指定することができる.ここで start,start0,start1,min,max はシンボルの初期値と最小/最大値を指定する実数である.メソッドがNMinimizeならば,NMinimizeは自動的に実現可能な初期値を見付ける.パラメータがシンボルとして指定されておりメソッドがNMinimizeでない場合は,すべてのパラメータの初期値は1とされる.
パラメータが{symbol,start0,start1}と指定された場合,パラメータ推定の検索では symbol の最初の2つの値として start0と start1が使われる.パラメータに関して の記号的導関数を見付けられ場合は,この形式を使わなければならない.
オプション名
|
デフォルト値
| |
AccuracyGoal | Automatic | 目標確度 |
Compiled | Automatic | モデルをコンパイルするかどうか |
Gradient | Automatic | 勾配関数のリスト |
MaxIterations | 100 | 使用する最大反復回数 |
Method | Automatic | 使用するメソッド |
PrecisionGoal | Automatic | 目標精度 |
RegressionReport | SummaryReport | 含まれるフィット診断 |
Tolerance | Automatic | 行列操作に対する数値許容誤差 |
Weights | Automatic | 各点あるいは純関数に対する重みのリスト |
WorkingPrecision | MachinePrecision | 内部計算で使われる精度 |
NonlinearRegressのオプション
NonlinearRegressはパラメータ推定値を求めるのにFindFitを使うので,FindFitのオプションであるAccuracyGoal,Compiled,Gradient,MaxIterations,Method,PrecisionGoal,WorkingPrecisionを使うことができる.Methodオプションは,メリット関数の最小化を実行するアルゴリズムの選択を可能にするものである.Methodで可能な設定には"LevenbergMarquardt","Gradient"(最急降下法),"Newton","QuasiNewton",NMinimize,Automaticがある.メソッドオプションはMethod->{method,options}と指定することで,メソッドに渡すことができる.
RegressionReportのデフォルト設定のSummaryReportでは,BestFitParameters,ParameterCITable,EstimatedVariance,ANOVATable,AsymptoticCorrelationMatrix,FitCurvatureTableの値を含むリストが与えられる.オプションRegressionReportで単独のオブジェクトあるいはオブジェクトのリストを指定すると,出力にデフォルトの結果以上(あるいは以下)が含まれるようになる.RegressionReportValues[NonlinearRegress]はNonlinearRegress関数のRegressionReportリストに含むことのできるオブジェクトを与える.
Weightsオプションを使うと,各データ点につき1つの重みのリストを指定することにより,重み付き最小二乗を実装することができる.デフォルトのWeights->Automaticは各データ点が単位重であることを示す.Weights->{w1,…,wn}のときは,パラメータ推定値は重み付き残差平方和 を最小化するよう選ばれる.
Weightsは応答の純関数を指定することもできる.例えば, を最小化するパラメータ推定値を選ぶためには,Weights->(Sqrt[#]&)と設定する.
NonlinearRegressはStudentTCIに指定できるオプションならどれでも取ることができる.特にConfidenceLevelは参照パラメータの信頼域(この相対的な曲率はFitCurvatureTableで与えられる)とParameterCITableで与えられる個々のパラメータ信頼区間を指定する.
BestFit | 最適フィット関数 |
BestFitParameters | 最適フィットのパラメータ推定値 |
ANOVATable | 分散分析の表 |
EstimatedVariance | 推定誤差分散 |
ParameterTable | 漸近標準誤差および検定統計量を含むパラメータ情報の表 |
ParameterCITable | パラメータの漸近信頼区間の表 |
ParameterConfidenceRegion | パラメータの楕円の漸近結合信頼領域 |
ParameterConfidenceRegion[{pari 1,pari 2,…}] | |
パラメータ{pari 1,pari 2,…}の楕円の漸近結合信頼領域 | |
FitResiduals | 観測応答と予測応答との差 |
PredictedResponse | 独立変数の観測値における最適フィット関数を評価することにより求められるフィットされた値 |
SinglePredictionCITable | 応答変数の1度の観測を予測するための漸近信頼区間の表 |
MeanPredictionCITable | 応答変数の期待値を予測するための漸近信頼区間の表 |
AsymptoticCovarianceMatrix | パラメータの漸近共分散行列 |
AsymptoticCorrelationMatrix | パラメータの漸近相関行列 |
NonlinearRegressに対する基本的なRegressionReportの値
ANOVATableは平方和の分割を行う.この平方和には,相関のない総平方和(切片項なし)も相関のある総平方和(切片項あり)も含まれる.相関のある総平方和は,非線形モデルの近似が線形モデルの近似と比較できるように,Regressによって生成されたR2の値に見あうR2の値を計算するのに便利である.例えば,非線形回帰のR2の定義として,相関のある総平方和に対する,相関のある総平方和と残差平方和との差の比というものが可能である.上記の表の他のオブジェクトは,線形回帰関数RegressのRegressionReportの値と同様の意味を持つ.
StartingParameters | パラメータの初期値 |
RegressionReportで要求されるオブジェクトのリストにStartingParametersを入れておくと,最小二乗フィットがうまくいかず新しい点で検索を再開しなければならないときに便利である.
HatDiagonal | ハット行列の対角行列X.(X.X)-1X.ここでXは最小二乗パラメータ推定値でのおおよその線形モデルに対する計画行列である |
StandardizedResiduals | 推定誤差分散を使って計算され,漸近標準誤差でスケールされた近似残差 |
非線形モデルが最小二乗フィットでほぼ線形であるならば,データの外れ値の検索にはHatDiagonalとStandardizedResidualsが役に立つ.HatDiagonalは予測変数の各観測が異常であるかどうかを測定し,各点の影響力を与える.影響力ゼロとは全く影響力がないことであり,影響力1とは,自由度がその点のフィットでは失われていることを示す.
FitCurvatureTable | 最大相対内部曲率,最大相対パラメータ効果曲率,最小二乗解の信頼領域の相対曲率(ここで信頼水準はConfidenceLevelによって与えられる) |
ParameterBias | 非線形モデルにおけるパラメータの最小二乗推定値のバイアス |
FitCurvatureTableは最小二乗推定における解の位置の相対的な曲率を,内部およびパラメータ効果の2つの要素で表現する.前述のデータとモデルの組合せでは,p=3,n=5となる.解の位置は{, , , , }, によって与えられるR5の3D部分空間である.
内部曲率とは,最小二乗推定における解の位置の曲率の通常要素を記述する.パラメータ効果の曲率とは,最小二乗推定での解の位置の曲率の接線要素を記述する.(n-p)次元の部分空間上の相対内部曲率を通常からその位置に最大化することにより,最大相対内部曲率が求められる.同様に,p 次元の部分空間上の相対パラメータ効果曲率を接線からその位置に最大化することにより,最大相対パラメータ効果曲率が求められる.
両方の最大曲率は,最小二乗パラメータ推定を中心とする信頼領域の相対曲率と比較できる.最大相対内部曲率が信頼領域の相対曲率と比較して小さければ,解の位置は信頼領域上のほぼ平面である.最大相対パラメータ効果曲率が信頼領域の相対曲率と比較して小さければ,接平面上に投影されるパラメータ座標はほぼ平行で,信頼領域上に一様な間隔で広がる.
ParameterBiasは最小二乗推定に対して接線方向の解の位置の平均曲率に基づく.
モデルを再パラメータ化しても内部曲率には影響がない.しかし,ここでの再パラメータ化はパラメータ効果曲率を臨界値の0.22843より小さくしている.このことは,パラメータ ,,の最小二乗推定はほとんど線形に近い動作を見せることを意味する.パラメータ間の漸近相関がすべてのペアについて高くなったことは,パラメータ数の少ないモデルを考えた方がよいことを示している.
最大相対曲率の診断は,非線形モデルへの線形近似に基づく推測を行いたい場合に便利である.例えば,ParameterCITableやParameterConfidenceRegionのようなパラメータの漸近標準誤差に基づく診断は,モデルへの線形近似が最小二乗パラメータ推定においてよくない場合に,その妥当性に疑問の余地がある.線形近似は,最大相対内部曲率でテストされる平面仮定,および最大相対パラメータ効果曲率でテストされる一様な座標仮定に基づいている.
制約条件付きのモデルでは,近似的な正規性の仮定に基づくRegressionReportの値は妥当でない場合がある.そのような値がRegressionReportオプションにリストされているときは,その値は警告メッセージを伴って表示される.