LongShortTermMemoryLayer

LongShortTermMemoryLayer[n]

ベクトル列を取って各サイズが n のベクトル列を生成する，訓練可能な回帰層を表す．

LongShortTermMemoryLayer[n,opts]

重みやその他のパラメータについてのオプションを含む．

詳細とオプション

LongShortTermMemoryLayer[n]は，ベクトル列を表す入力行列を取り，同じ長さの列を出力するネットを表す．
入力列の各要素はサイズ k のベクトルで，出力列の各要素はサイズ n のベクトルである．
入力ベクトルのサイズ k は，NetGraphやNetChain等の中では自動的に推測されることが多い．
次は，LongShortTermMemoryLayer[n]で表されるネットの入出力ポートである．
"Input" サイズ k のベクトル列

"Output" サイズ k のベクトル列
LSTMは，入力列{x₁,x₂,…,x_T}を与えられると，次の回帰関係を使って状態列{s₁,s₂,…,s_T}を出力する．

	入力ゲート	i_t=LogisticSigmoid[W_ix.x_t+W_is.s_t-1+b_i]
	出力ゲート	o_t=LogisticSigmoid[W_ox.x_t+W_os.s_t-1+b_o]
	忘却ゲート	f_t=LogisticSigmoid[W_fx.x_t+W_fs.s_t-1+b_f]
	メモリゲート	m_t=Tanh[W_mx.x_t+W_ms.s_t-1+b_m]
	セルの状態	c_t=f_tc_t-1+i_tm_t
	状態	s_t=o_t*Tanh[c_t]

LongShortTermMemoryLayer[n]は次の状態ポートを持つ．
"State" サイズ n のベクトル

"CellState" サイズ n のベクトル
NetGraph内では，src->NetPort[layer,"state"]の形の接続を使って，回帰関係における s₀および c₀に相当するLongShortTermMemoryLayerの"State"または"CellState"についての初期値を与えることができる．デフォルトの初期値は零ベクトルである．
NetGraph内では，NetPort[layer,"state"]->dst の形の接続を使って，回帰関係における s_Tおよび c_Tに相当するLongShortTermMemoryLayerについての"State"または"CellState"の最終的な値を得ることができる．
NetStateObjectを使って，ネットが入力に適用されたときに更新されるLongShortTermMemoryLayerの状態の値を記憶するネットを作ることができる．
サイズ k のベクトルに作用する初期化されたLongShortTermMemoryLayer[…]は，訓練可能な次の配列を含んでいる．

"InputGateInputWeights"	W_ix	サイズ n×k の行列
"InputGateStateWeights"	W_is	サイズ n×n の行列
"InputGateBiases"	b_i	サイズ n のベクトル
"OutputGateInputWeights"	W_ox	サイズ n×k の行列
"OutputGateStateWeights"	W_os	サイズ n×n の行列
"OutputGateBiases"	b_o	サイズ n のベクトル
"ForgetGateInputWeights"	W_fx	サイズ n×k の行列
"ForgetGateStateWeights"	W_fs	サイズ n×n の行列
"ForgetGateBiases"	b_f	サイズ n のベクトル
"MemoryGateInputWeights"	W_mx	サイズ n×k の行列
"MemoryGateStateWeights"	W_ms	サイズ n×n の行列
"MemoryGateBiases"	b_m	サイズ n のベクトル

LongShortTermMemoryLayer[n,opts]では，"array"->value の形の規則を使って訓練可能な配列に初期値を与えることができる．
次の訓練パラメータも含めることができる．

	"Dropout"	None	単位が確率的にゼロに設定されているドロップアウト正規化
	LearningRateMultipliers	Automatic	訓練可能な配列の学習率乗数

"Dropout"->Noneを指定して訓練中のドロップアウトを無効にする．
"Dropout"->p を指定して，ドロップアウト確率 p で自動的に選択されたドロップアウトメソッドを使用する．
"Dropout"->{"method₁"->p₁,"method₂"->p₂,…}の指定を使ってドロップアウトの特定のメソッドを対応するドロップアウト確率と結び付けることができる．

	"VariationalWeights"	重み行列間の反復接続に適用されたドロップアウト（デフォルト）
	"VariationalInput"	連続する各ステップで単位の同じパターンを使って，入力からのゲートの寄与に適用されたドロップアウト
	"VariationalState"	連続する各ステップで単位の同じパターンを使って，前の状態からのゲートの寄与に適用されたドロップアウト
	"StateUpdate"	連続する各ステップで単位の異なるパターンを使って，前の状態に加えられる前に状態更新ベクトルに適用されたドロップアウト

ドロップアウトメソッドの"VariationalInput"および"VariationalState"は「Gal et al. 2016 method」に基づいているのに対し，"StateUpdate"は「Semeniuta et al. 2016 method」に，"VariationalWeights"は「 Merity et al. 2017 method」に基づいている．
LongShortTermMemoryLayer[n,"Input"->shape]では，入力の形状を指定することができる．次は shape の可能な形である．

	NetEncoder[…]	ベクトル列を作成するエンコーダ
	{len,k}	長さ k の len ベクトル列
	{len,Automatic}	長さが推測される len ベクトルの列
	{"Varying",k}	さまざまな数の，それぞれが長さ k のベクトル
	{"Varying",Automatic}	さまざまな数の，それぞれの長さが推測されるベクトル

NumericArrayが入力として与えられると，出力はNumericArrayになる．
Options[LongShortTermMemoryLayer]は層を構築する際のデフォルトオプションのリストを与える．Options[LongShortTermMemoryLayer[…]]はデータについて層を評価する際のデフォルトオプションのリストを与える．
Information[LongShortTermMemoryLayer[…]]は層についてのレポートを与える．
Information[LongShortTermMemoryLayer[…],prop]はLongShortTermMemoryLayer[…]の特性 prop の値を与える．使用可能な特性はNetGraphと同じである．

例題

すべて開くすべて閉じる

例 (2)

長さ3のベクトル列を生成するLongShortTermMemoryLayerを作る：

長さ2のベクトル列を取って長さ3のベクトル列を生成する，ランダムに初期化されたLongShortTermMemoryLayerを作る：

この層を入力列に適用する：

スコープ (4)

文字列を取り長さ2のベクトル列を生成する，ランダムに初期化されたLongShortTermMemoryLayerを作る：

この層を入力文字列に適用する：

この層を入力バッチに縫い込む：

長さ2のベクトル列を取って長さ2の単一のベクトル列を生成する，ランダムに初期化されたネットを作る：

この層を入力に適用する：

この層を入力バッチに縫い込む：

LongShortTermMemoryLayerの初期状態とセルの状態を設定することができるNetGraphを作る：

このグラフをデータに適用する：

LongShortTermMemoryLayerの最終状態とセル状態が取得できるNetGraph を作る：

最終状態は出力列の最終要素である：

オプション (2)

"Dropout" (2)

ドロップアウトメソッドを指定してLongShortTermMemoryLayerを作る：

指定されたドロップアウト確率でランダムに初期化されたLongShortTermMemoryLayerを作る：

この層をベクトル列について評価する：

ドロップアウトは評価中は影響しない：

NetEvaluationModeを使ってドロップアウトの訓練動作を強制する：

同じ入力を複数回評価すると異なる結果が与えられることがある：

アプリケーション (2)

2桁の足し算と対応する数値結果を表す文字列からなる訓練データを作る：

文字列を読んで入力し数値結果を予測する，積み重ねられたLongShortTermMemoryLayerを使ってネットワークを作る：

ネットワークを訓練する：

訓練されたネットワークを入力のリストに適用する：

xとy，およびLess，Greater，Equalのいずれかを含む文字列に基づいて，xとyの数を比較することで訓練データを作る．訓練データは長さ8までの可能なすべての文からなる：

LongShortTermMemoryLayerを含むネットワークを作り，入力文字列を読んでLess，Greater，Equalのいずれかを予測する：

ネットワークを訓練する：

訓練されたネットワークを入力リストに適用する：

訓練集合全体の確度を測定する：

特性と関係 (1)

NetStateObjectを使って，LongShortTermMemoryLayerの状態を記憶するネットを作ることができる：

各評価によってNetStateObjectの中に保存された状態が変更される：

トップへ

その他のラーニングリソース

テクニカルサポート

大人用の教育プログラム

若者のための教育プログラム

イベント

Wolframイニシアチブ

教育リソース

趣味とプロジェクト

Wolframソリューション

教育のためのWolframソリューション

使い始める

Grow Your Skills

Wolframと繋がる

読む

大人用の教育プログラム

若者のための教育プログラム

イベント

LongShortTermMemoryLayer

詳細とオプション

例題

例 (2)

スコープ (4)

オプション (2)

"Dropout" (2)

アプリケーション (2)

特性と関係 (1)

テキスト

CMS

APA

BibTeX

BibLaTeX

	"Input"	サイズ k のベクトル列
	"Output"	サイズ k のベクトル列

	"State"	サイズ n のベクトル
	"CellState"	サイズ n のベクトル

LongShortTermMemoryLayer

詳細とオプション

例題

例 (2)

スコープ (4)

オプション (2)

"Dropout" (2)

アプリケーション (2)

特性と関係 (1)

関連項目

テクニカルノート

関連するガイド

履歴

テキスト

CMS

APA

BibTeX

BibLaTeX