この記事は僕が無闇矢鱈と集めたディープラーニングに関する本を紹介していく記事です。
厳選したと言うより、いろいろな需要に答えるため網羅性を重視しています。
目次から自分の興味のある項目にジャンプすると読みやすいかもしれません。
※ 随時追加します
ディープラーニングだけでなく機械学習も解説した本
本質を捉えたデータ分析のための分析モデル入門
YouTubeで活躍しているVTuberのアイシアさんが書いた本です。(※チャンネル名はAIcia Solid Project)
本も素晴らしいのですが、YouTubeに投稿されているディープラーニング関連の動画のクオリティが非常に高く、かなりディープラーニングの理解に役立つので一度見てみると良いでしょう。
そして自分に合っているなーと思ったら、この書籍も動画の内容をさらに詳しくしたような内容なのでおすすめです。
一般の機械学習からディープラーニング、そして強化学習まで盛りだくさんの内容です。
ディープラーニングに必要な数学を解説した本
最短コースでわかる ディープラーニングの数学
ディープラーニングに必要な数学を高校1年レベルから解説した本。
高校1年レベルから解説してくれるので、数Ⅲを履修していなくてもディープラーニングに必要な部分は詳しく解説されています。
冒頭ページにある「本書の構成」を見ればおおよそどのような内容が解説されているか分かるので画像を載せておきます。
※ 画像が小さい場合は、画像右クリック→「新しいタブで画像を開く」→Ctrl + スクロールで拡大してください。
ディープラーニングの理論解説を重視した本
ゼロから作るDeep Learning
ちょっと古いですが、ディープラーニングの理論を基礎から学ぶのに最適な本です。
なぜ最適かと言うとPyTorchなどのディープラーニングフレームワークを使わずに、Numpyを使ってディープラーニングをフルスクラッチで実装していくからです。
PyTorchやTensorFlowなどのディープラーニングフレームワークの使い方は学ぶことができませんが、ディープラーニングの仕組みについてはかなり詳しく理解できるように書かれています。
後半では各種オプティマイザやBatch Normalizationなどについての解説もあり、発展的な内容も多くあります。
個人的に今でもたびたび読み返す本であり、一番おすすめの本です。
ディープラーニングを支える技術
こちらも理論解説を重視した本でPythonのコードなどは一切出てきません。
数多の論文を読んできた筆者のディープラーニングの解説は他の本と一線を画していて、入門書を超えたより理論的な深い内容が解説されています。ディープラーニングに関するもう一歩踏み込んだ解説を読みたい人に特におすすめです。
ただし、そういった踏み込んだ解説は数式とともに行われることも多いので、数式をしっかり読みこなす努力が必要です。
個人的な所感としては、ディープラーニングの入門書をいくつか読んだ後で、さらに深いことを知りたくなった時に読むと新たな発見がたくさんあります。
ディープラーニングを支える技術2
「ディープラーニングを支える技術」の第2巻です。
今のところ「ディープラーニングの最適化」「ディープラーニングの汎化」の章だけを読んだので、その部分について感想を述べますが、VAEやGANなどの「深層生成モデル」を解説した章、「深層強化学習」について解説した章もあります。
「ディープラーニングの最適化」の章では、各種オプティマイザの理論解説から、ハイパーパラメータを調節する際のコツまで書かれています。
例えば、モーメンタム法についてβはできるだけ1に近い値に設定し、学習率をまずはギリギリまで大きく設定すると良い、など、ここまで詳しく書かれている本はほとんど見たことがありません。
「ディープラーニングの汎化」の章は、ニューラルネットワークが表現力が高いのになぜ汎化するのかについて解説されています。
ディープラーニングについてより理解を深めるヒントがたくさんあります。
ディープラーニングの実践・実装を重視した本
詳解ディープラーニング 第2版
この本はディープラーニングを実装することにフォーカスを置いた本です。
ディープラーニングの理論解説もされていますが、この本の最大の見どころはほとんどの部分でTensorFlow/KerasとPyTorchの実装が両方とも載っているところです。
特に個人的に驚いたのはTransformerの両フレームワークの実装が完全な形で載っていることです。
他の本でTransformerの実装を完全な形で紹介している本は見たことがないので、その点非常に価値が高いです。
ただし一部数式に間違っている部分があるので、どうしても理解できない数式に出会った場合は間違いかも、と思っておくと良いです。
自然言語処理(NLP)に関するディープラーニングの本
自然言語処理界隈では既にRNN(GRUやLSTM含む)はTransformerに取って代わられた古い技術なのかもしれませんが、基礎として重要だと思いますし、最近の本でも取り上げられていて分からないとモヤッとするかもしれないので、RNNを主に解説した少し古めの本も取り上げます。
もちろん、Transformerや、それに改善を施したBERTなどをメインに扱った本も紹介します。
ゼロから作る Deep Learning 2 – 自然言語処理編
この本は「ゼロから作る」のタイトル通り「word2vec」から「RNN」「LSTM」そして最後は「Attention」まで、PyTorchやTensorFlowなどのディープラーニングフレームワークを使わずに主にnumpyで理解しながらフルスクラッチで実装するという本です。
自然言語処理の技術であるRNNやLSTM、そしてTransformerの中核技術であるAttentionの基礎を実装レベルで理解したいという方に最善です。
アマゾンでの評価も非常に高く(記事執筆時点で星4.5)かなりオススメできる本です。