注意
メモ書きです。
何も知らない人の解釈なので、間違ってるところとか指摘してもらえると嬉しいです。
学習って?
推論に使うための学習モデルを作るよ。
学習のフローのうち、Inputについては、実際のものと、正解の組み合わせで構成するよ。
多次元配列の値を使ったりするよ。詳しくはまた次回のメモで。
学習モデルって?
後に出る推論に使う特徴を算出する方法の集まりだよ。
ここで、特徴に対する重み付けの法則を構成して、その重みと特徴量から後の推論が行われるっぽい。
逆に、特徴となる数式を私達がわかっていれば、学習はする必要なくて、その式から推論をすればいい。
あくまで、その数式がわからないから、私達は学習というものをさせようとしてる。
推論って?
特徴を算出し、その重みから算出した値から、目的のものである確率を算出するよ。
特徴の算出とかは、jpegとかの式を思い浮かべるとイメージしやすいかも。
数式の集まりで、それらに対する意味とかは、機械は理解してないけど、その特徴に合致していることが多いと、
きっとこれはこうなんだろうって推測するよ。
強化学習が意味わからーんって話
で、これがわかって、ようやく強化学習が意味わからんってやっと思えた。
報酬ってモデルみたいなものやん。
推論の推論を人間の手でしてるやん。
頑張れてる人凄すぎでは。