機械学習・ディープラーニング・統計の数式を理解するコツ

ちょっと本格的な機械学習・ディープラーニングの本になると、理論の説明に数式が用いられることが多い。

この記事では、そのような数式を理解していくコツを紹介する。

変数の種類を把握する
演算の種類を把握する
変数の形状を把握する
確率・統計
その他 Tips

変数の種類を把握する

数式をなんとなく読んでいると、「微妙に分からない」がチリに積もって「全く分からない」になる。

これを防ぐには、まず数式に出てくる全ての変数の種類をしっかり把握すると良い。

変数がスカラーなのか、ベクトルなのか、行列なのか、はっきりさせよう。
最初のうちは変数の近くに赤ペンなどで○ス（丸の中にス）、○べ（丸の中にべ）、○行（丸の中に行）などを書いていくと良い。

親切な本なら、ベクトルは太字になっていることが多いので、そのへんもヒントにして読んでいく。
変数が太字か太字でないか、つまりベクトルかベクトルでないか気にして読んでいくと、ちょっと理解が深まる。

演算の種類を把握する

次に、演算の種類を把握して読んでいくと良い。

これは例えば、数式が「実数同士の積」なのか「ベクトルのスカラー倍」なのか「ベクトルとベクトルのドット積(内積)」なのか、はたまた「行列の積」もしくは「ベクトルを行列とみなした行列積」なのか。

この辺のことをはっきりと把握して数式を読むこともほぼ必須だと思う。

演算の種類を把握するためには、前段階として変数の種類を把握しないといけないので、どちらを優先するかと聞かれたら、変数の種類把握だ。
それに慣れてきたら、今度は演算の種類も把握していこう。

演算の種類を把握すると、その演算の結果も分かるようになる。
つまり、「実数同士の積」の結果は実数だし、「ベクトルのスカラー倍」の結果はベクトル、「ベクトルとベクトルの内積」の結果はスカラー、「行列の積」の結果は行列、「ベクトルを行列とみなした行列積」の結果は行列だ。

例を挙げる。ベクトルaとベクトルbがあって、$ \boldsymbol{a} \cdot \boldsymbol{b} $と書いてあったら、十中八九これはベクトルaとベクトルbの内積だ。
掛け算の記号×を省略して$ 2 \cdot 3 = 6 $と書くことがあるが、この２つのドット「$ \cdot $」の意味は異なる。前者がベクトル同士の内積、後者が実数同士の積だ。

また、同じ内積の例で、$ \boldsymbol{a}^T \boldsymbol{b} $と書いてある場合、このとき使われている演算は「ベクトルを行列とみなした行列積」だ。
行列の演算の定義を考えてみれば、内積と同じ数式を計算していることが分かるが、この場合結果は1×1の行列になるけれど、これをスカラーとみなす場合もある。