【レビュー】Python機械学習プログラミング 達人データサイエンティストによる理論と実践

プログラミング

機械学習を学びたいけど、どのように学習すればいいだろう。書籍として「Python機械学習プログラミング 達人データサイエンティストによる理論と実践」がおすすめされていたけど、レビューを知りたい。

こんな悩みにお答えします。

「Python機械学習プログラミング 達人データサイエンティストによる理論と実践」を理解することで、機械学習プログラミングの基礎をまんべんなく学ぶことができます。

なぜなら、機械学習のステップ全体を網羅されており、実践的なコーディングと数式による理論のバランスが良いから。

今回は、「Python機械学習プログラミング 達人データサイエンティストによる理論と実践」のレビューとおすすめポイントをご紹介します。

この記事を読み終えると、本書の購入を検討できるようになります。

 

本記事の内容

・「Python機械学習プログラミング 達人データサイエンティストによる理論と実践」レビュー、おすすめポイント、おすすめの読み方
・機械学習のフロー

>>【Python】おすすめ書籍20選(入門~AI・機械学習)(現役データサイエンティストが厳選)
>>【初心者向け】Pythonの基礎を学べるおすすめ本5選
>>【Python】機械学習を学べるおすすめ本5選
>>【Python】ディープラーニングを学べるおすすめ本4選

>>Pythonでスクレイピングする方法を学べるおすすめ本5選

Pythonを学べるおすすめのプログラミングスクール
1. Aidemy
・・・AIエンジニアとしてのスキルを身に付けたい。その延長で就職、転職できたら嬉しい方におすすめ。
2.侍エンジニア塾
・・・基礎力と即戦力を身に付けられる、満足度No.1スクール
3.
TechAcademy
・・・副業に向けてスキルアップしたい。フリーランスなどを目指している方向け。
4
. AIジョブカレッジ
・・・コスパ良く、質の高い講座を受けたい方におすすめ。

本記事の信頼性

ひよこ
ひよこ

私は、大学時代にプログラミングを学び、PHPなどのWeb系言語からAIに用いられるPythonまで幅広く経験してきました。

現在はデータサイエンティストとして大企業で活動しています。

また今ではほぼ不労所得として月10万円以上の収益を継続的に達成しています。

 

1. 結論:機械学習の全体概要を理解することができる良書!

・機械学習の全体概要を理解することができる良書
・これから機械学習を始める方 や コーディングと理論どちらもできるようになりたい方におすすめ

 

2016年に第1版が発売された書籍。時代に合わせて改編され、2022年現在第3版まで発売されている人気の高い1冊です。

読者のレベル感によらず、どんな方にとっても有益になる情報が広く網羅されているため、機械学習の学習本としておすすめしやすい

 

 

本書のおすすめポイントは以下のとおり。

■本書のおすすめポイント
・「理論と実践」のタイトルだけあって、バランスがちょうどいい
・機械学習モデルの基礎をまんべんなく理解できる
・適用事例として、自然言語処理やWebアプリが挙げられており用途をイメージしやすい

1点目は、理論と実践のバランスがちょうどいいこと。機械学習モデルの理論を数式を用いて解説されている一方で、Pythonを使ったサンプルコードも記載されており具体的な実装方法まで学ぶことができます。とにかく機械学習を体験したい方は実装部分を真似すればいいし、モデルの理解を深めたい方は理論部分の読破を目指せばいい。読者の目的に応じて幅広い使い方ができるでしょう。

2点目は、機械学習モデルの基礎をまんべんなく学べること。教師あり学習の多様なモデルをはじめ、クラスタリングなどの教師なし学習、そして強化学習にまで触れられています。もちろん、一つ一つのボリュームが多いとは言えませんが、全体感を理解するには十分な内容が凝縮されています。本書を読み込んだ後で、足りない部分を補っていけば良いと思います。

3点目は、機械学習の適用事例まで記載されていること。機械学習を学びたい方は相当数いらっしゃいますが、機械学習の具体的な用途、適用先までイメージできている方は多くありません。本書では機械学習モデルを構築した後、実際の現場ではどのように利用されているのかを想像できる内容が用意されています。

 

ひよこ
ひよこ

私自身、学生時代に第1版を購入し、未だにデスクに置いています!そのくらい価値のある1冊だと思います。

 

2. 概要

対象
Pythonの基礎を理解している
データ分析/機械学習を行いたい
発行日2020/10/22
ページ数688ページ
特徴
・分類/回帰問題から深層学習/強化学習まで、機械学習コンセプト全般をカバー
理論的背景とPythonコーディングの実例を解説
章立て
第1章 「データから学習する能力」をコンピュータに与える
第2章 分類問題―単純な機械学習アルゴリズムの訓練
第3章 分類問題―機械学習ライブラリscikit-learnの活用
第4章 データ前処理―よりよいトレーニングセットの構築
第5章 次元削減でデータを圧縮する
第6章 モデルの評価とハイパーパラメータのチューニングのベストプラクティス
第7章 アンサンブル学習―異なるモデルの組み合わせ
第8章 機械学習の適用1―感情分析
第9章 機械学習の適用2―Webアプリケーション
第10章 回帰分析―連続値をとる目的変数の予測
第11章 クラスタ分析―ラベルなしデータの分析
第12章 多層人工ニューラルネットワークを一から実装
第13章 ニューラルネットワークの訓練をTensorFlowで並列化する
第14章 TensorFlowのメカニズム
第15章 画像の分類―ディープ畳み込みニューラルネットワーク
第16章 系列データのモデル化―リカレントニューラルネットワーク
第17章 新しいデータの合成―敵対的生成ネットワーク
第18章 複雑な環境での意思決定―強化学習

Pythonでデータ分析する方法を学べるおすすめ本5選でもご紹介させていただいた書籍。

第3版になり、敵対的生成ネットワークなど比較的新しい技術まで含まれているため最新論文を読む際にも役に立つでしょう。

機械学習について網羅的に解説されており、デスクに置いてあると安心できること間違いなしです。

Python 機械学習プログラミング  詳細はこちら>>

Pythonでデータ分析する方法を学べるおすすめ本5選
Pythonの基礎を学んで、次はデータ分析に取り組みたいけど、どうやって学習すればいいだろう。何かいい方法はないかな。 こんな悩みにお答えします。 データ分析は書籍で学ぶことができます。 な...

 

3. 機械学習とは

 

機械学習とは、データを分析する方法の1つで、データから、「機械」(コンピューター)が自動で「学習」し、データの背景にあるルールやパターンを発見する方法。近年では、学習した成果に基づいて「予測・判断」することが重視されるようになった。(引用:野村総合研究所

上記で注目すべきは、「データ」を基にしたアルゴリズムによって、「学習と予測を行う」ことです。

 

学習と予測のイメージは以下のとおり。

  • 学習:学習データ(入力と出力のペア)を用いて機械学習モデルを作成
  • 予測:入力に対して機械学習モデルが出力を予測

 

また、頻出する用語として、以下を理解しておきましょう。

説明変数と目的変数
・説明変数:機械学習モデルの入力。特徴量ともいう
・目的変数:機械学習モデルの出力
ひよこ
ひよこ

説明変数を入力して、目的変数を出力する機械学習モデルを作成するということですね!

 

4. 機械学習のフロー

ここでは、機械学習を行う流れと書籍中の対応する章をご説明します。

■機械学習のフロー
1. データ収集
2. 前処理
3. 学習
4. 予測・評価・パラメータチューニング

 

まずは、データを集める必要があります。近年ではデータセットが公開されていることも多くなっていますが、ビジネス利用の場合やユニークな学習を行いたい場合には自分でデータを収集しなくてはいけません。その場合、難易度は上がりますが、スクレイピングなどを行うと良いでしょう。本書ではデータ収集に関する内容は含まれていないため以下の記事をご参考ください。

 

次に、データの前処理を行います。ここでは、広い意味で前処理という言葉を利用しており、主に以下の作業を想定しています。

  • データ整形:生データから機械学習で利用できる形に整形する
  • 基礎集計:データ内容を事前に確認し後続作業に活かす
  • 特徴量選択:基礎集計の結果を基にどの特徴量を用いて学習するかを決める
  • データ分割:機械学習モデル構築にあたり、学習データとテストデータに分ける
  • モデル選択:基礎集計の結果を基に適切な機械学習モデルを選択する

学習フェーズに入る段階で機械学習は8割近く終わったと言っても良いでしょう。そのくらい前処理という作業は重要で大変ということです。この前処理は第4章、第5章が該当します。前処理は疎かにされがちなので、十分に注意しながら正確に理解していきましょう。

 

そしていよいよ機械学習モデルの学習です。機械学習は大きく3種類に分けられます。

  • 教師あり学習(第2章、第3章、第7章、第10章、第12~14章、第15章~17章)
  • 教師なし学習(第5章、第11章)
  • 強化学習(第18章)

本書のメインパート。教師あり学習を中心に基本的な機械学習モデの理論と実装の両軸で学習することができます。すべてのモデルを理解、実装できる必要はなく、必要に応じて学びを進めていけば良いと思います。

 

最後に、予測・評価・パラメータチューニングです。構築したモデルは実際に予測をし評価する必要があります。事前に評価しないとビジネスなどで利用できるか信用できないので。ただ評価方法やデータによって評価結果は大きく変わってしまうため慎重に行う必要がある作業になります。また、モデルによってはパラメータを含んでいる場合があります。このパラメータの変更によってもモデルは姿を変えます。したがって、パラメータを変えながらチューニングを行っていきます。これらについて言及されているのが本書の第6章です。

 

これで機械学習のフローは以上ですが、本書には機械学習の適用事例も記載されています。感情分析(自然言語処理)やWebアプリについて記載されているため、業務イメージが想像しやすくモチベーションアップにも繋がるでしょう(第8章、第9章)。

 

 

5. おすすめの読み方

本書はボリュームが多く内容も多岐に渡るため、おすすめの読み方をご紹介します。

■おすすめの読み方
前処理は重要(第4章、第5章)
matplotやJupyterlabは応用が利く
機械学習モデルは詳細に理解しなくてもいい
・適用事例を読みイメージを持つ(第8章、第9章)

 

前処理パートは機械学習を学ぶ上で必須です。データの扱い方はモデルに依存せず共通であるため理解しておく必要があるでしょう。

また、可視化に用いられるmatplotやインタラクティブな処理が可能なJupyterlabも扱えるようになっておく必要があります。前処理やモデルの評価時には頻繁に利用することになります。

逆に機械学習モデルについては、詳細に理解する必要はないと思います。必要に迫られたタイミングで1つ1つ学んでいけばよく、「概要が分かる」だけで十分でしょう。「実装できる」や「理論が分かる」は次のステップですので、すぐに触れなくても大丈夫です。

適用事例は読み物として重宝します。スキマ時間や気分転換を兼ねて読むことで機械学習の適用先のイメージを描くことができアイデア創出やモチベーションアップにも繋がります。

 

 

6. まとめ

今回は、「Python機械学習プログラミング 達人データサイエンティストによる理論と実践」のレビューとおすすめポイントをご紹介しました。

機械学習は幅広く奥が深いです。本書は、機械学習初心者の方向けに全体感を掴んでもらうために丁度良い1冊になっていると思います。

また、理論的な部分も含まれているため、研究として機械学習を利用している方にも嬉しいのではないでしょうか(基礎理論は確認する機会が多いと思います)。

本書を通じて、機械学習の学びを深めていただければ幸いです。

 

 

本ブログでは、株式やプログラミングに関する記事を投稿しています。

プログラミング(Python)を学びたい方におすすめの書籍やプログラミングスクール、おすすめの学習方法などをご紹介しておりますのでぜひご覧ください。

独学で挫折してしまう方は、プログラミングスクールという方法がおすすめです。

私の一押しは『TechAcademy』です。

質問することですぐに分からないところをクリアにできますし、進捗をサポートしてくれるため確実に成長することができます。

無料相談を実施しているため、まずは話を聞いてあなたのスタイルに合っているかどうか確認してみるのが良いと思います。

スキルアップを目指したい方におすすめのオンライン学習サービス

 

Profile
この記事を書いた人

現役データサイエンティスト
【投資×プログラミング】に関するブログを運営しています。

■発信内容
・・・プログラミング(Python)、銘柄分析、株価予測など
■投資対象
・・・インデックス投資、米国ETF、米国個別株

普段は1万人規模の大企業で世にコンテンツを生み出してます。

ひよこをフォローする
プログラミング学習
ひよこをフォローする
副業プログラミング応援団

コメント

タイトルとURLをコピーしました