こんな悩みにお答えします。
■Pythonでスクレイピングする方法を学べるおすすめ本5選
・PythonによるWebスクレイピング 第2版
・Python2年生 スクレイピングのしくみ 体験してわかる!会話でまなべる!
・
・増補改訂Pythonによるスクレイピング&機械学習 開発テクニック
・Pythonスクレイピングの基本と実践 データサイエンティストのためのWebデータ収集術
この記事の信頼性
現在はデータサイエンティストとして大企業で活動しています。
Pythonでスクレイピングする方法を学べる書籍5選
Pythonでスクレイピングする時におすすめの書籍です。
項番 | 表紙 | タイトル | 参考価格 |
1 | PythonによるWebスクレイピング 第2版 | 3,520円 | |
2 | Python2年生 スクレイピングのしくみ 体験してわかる!会話でまなべる! | 2,420円 | |
3 | 3,608円 | ||
4 | 増補改訂Pythonによるスクレイピング&機械学習 開発テクニック | 3,520円 | |
5 | Pythonスクレイピングの基本と実践 データサイエンティストのためのWebデータ収集術 | 3,630円 |
■関連記事:Python学習本
>>【Python】おすすめ書籍20選(入門~AI・機械学習)
>>【初心者向け】Pythonの基礎を学べるおすすめ本5選
>>【Python入門】書籍による学習でプログラミングは身に付くか
>>【初心者必見】プログラミング本の選び方(4つのポイント)と効率的な学習方法(3ステップ)
Pythonでスクレイピング
ここでは、Pythonで行うスクレイピングの概要についてです。
a. スクレイピングとは?
スクレイピングにより収集加工されたデータは、機械学習やマーケティングなど多様な領域で利用されます。
b. なぜPythonか?
それは、Pythonは汎用性が高いプログラミング言語だからです。
・・・スクレイピングにより収集したデータは後続処理としてPythonによって利用されることが多い。そのため最初からPythonでスクレイピングした方が後々の互換性が良い
>>初心者必見!Python入門まとめ(年収・将来性・はじめ方・学習方法)
>>【初心者向け】Pythonでできること(概要や始め方、学習方法までざっくり紹介)
c. スクレイピングの流れ
1. 収集データ選定
1.収集データ選定:Webサイトからどのデータをスクレイピングするか決定します。※証券サイトなど、スクレイピングを禁止しているWebサイトも多く存在するため実施する際には十分に注意して行いましょう
PythonではRequestsやBeautifulSoup、Seleniumなど多くのライブラリがあります。それぞれ処理速度や抽出対象に特徴があるため、目的に応じて使い分けましょう。
対象 | |
特徴 | |
章立て | 第Ⅰ部 スクレイパーを作る 1章 最初のWebスクレイパー 2章 高度なHTMLパース 3章 Webクローラを書く 4章 Webクローリングのモデル 5章 Scrapy 6章 データを格納する 第Ⅱ部 高度なスクレイピング 7章 文書を読む 8章 汚れたデータをクリーニング 9章 自然言語の読み書き 10章 フォームとログインでクローリング 11章 JavaScriptのスクレイピング 12章 APIでクローリング 13章 画像処理とテキスト認識 14章 スクレイピングの落とし穴を避ける 15章 Webサイトをスクレイパーでテストする 16章 並列にWebクローリング 17章 リモートでスクレイピング 18章 Webスクレイピングの適法性と倫理 |
O’REILLY人気書籍の改訂版。スクレイピングの基礎から実践的な内容まで網羅されている1冊。問題発生時の対象法まで記載されており、持っておくと安心でしょう。
スクレイピングの基礎だけでなく、自動化方法や法律面の解説など痒い所に手が届くコンテンツとなっています(故に初心者の方にはあまりおすすめしません)。
本書は元々英語で書かれているため多少気になる日本語もありますが、問題ない範囲と思います(気になる方は一度手に取ってみてください)。
対象 | |
特徴 | |
章立て |
Pythonを用いたスクレイピングについて解説している書籍の中でもっともやさしく書かれており、とにかくPythonでスクレイピングしてみたいという方におすすめの1冊。
データのダウンロード方法やHTMLの解析などスクレイピングに必要なスキルを身に付けながら、最終的にはAPIを用いたデータ収集方法まで学ぶことができます。
サンプルコードを見て実際に手を動かすことができるので、実践派の方におすすめ。
対象 | |
特徴 | |
章立て |
対象 | |
特徴 | |
章立て |
2016 年に発売された『Pythonによるスクレイピング&機械学習開発テクニック』を大幅改訂した1冊。
データを収集・整形し、機械学習を行うという一連の流れを体験できる書籍。サンプルコードに手を加えることで自分の思い通りの処理を最新の技術で実現できるでしょう。
網羅性が高い一方で、一つ一つの詳細説明が少し乏しいところが難点。
対象 | |
特徴 | |
章立て |
Python中級者向けの実践的な内容を含む良書。
第9章では、スクレイピング後のデータサイエンスを意識した15種類の実践サンプルが用意されており、あなたのスキルアップに繋がること間違いなしです。
また、多様なスクレイピングライブラリを利用していることから応用も効きやすいでしょう。
まとめ
スクレイピングを行いたい方は、ライブラリが豊富で今後の発展性も見込めるPythonがおすすめです。
書籍は数千円で購入することができ、スクレイピングでデータを収集・整形することができれば話題の機械学習やデータ分析を行うこともできるようになります。
スクレイピングからPythonプログラミングの道を拓いていきましょう。
\現役エンジニア厳選!Pythonでスクレイピングする方法を学べるおすすめの書籍5選/
項番 | 表紙 | タイトル | 参考価格 |
1 | PythonによるWebスクレイピング 第2版 | 3,520円 | |
2 | Python2年生 スクレイピングのしくみ 体験してわかる!会話でまなべる! | 2,420円 | |
3 | 3,608円 | ||
4 | 増補改訂Pythonによるスクレイピング&機械学習 開発テクニック | 3,520円 | |
5 | Pythonスクレイピングの基本と実践 データサイエンティストのためのWebデータ収集術 | 3,630円 |
\スキルアップを目指したい方におすすめのオンライン学習サービス/
コメント