Pythonのスクレイピングは、Web上の情報を効率的に収集する強力な手法です。
スクレイピングを使えば、価値あるデータや知見を得ることができます。
その手順を記載したいと思います。
開発環境
OS:Windows10 64bit Home
開発環境:
プログラム言語:Python
インストール
リンクからダウンロードしたEXEファイルを実行してPythonの実行環境をインストールします。
インストール後、pythonコマンドが使用できるか確認するには以下コマンドを入力します。
python version
仮想環境の作成
①関連ファイルが保存されるルートフォルダを作成する。
エクスプローラからプロジェクトフォルダを作成しました。
D:\python
② コマンドプロンプトを起動し、①で作成したフォルダに移動(cdコマンド)し、仮想環境作成コマンドを実行する。
D:\python>python -m venv scraping
フォルダが作成されています。
③仮想環境を有効にする
以下コマンドを実行します。
.\python\Scripts\activate
コマンドプロンプトの表示が変わります。
スクレイピング用フレームワークをインストールする
Pythonにはスクレイピング専用のフレームワークが用意されており、簡単に
pip install scrapy
実行したら大量の文字が・・・
インストールされているモジュール一覧をみるコマンド
pip freeze
Scrapyのバージョンを確認するコマンド
scrapy version
仮想環境を終了させる
(scraping) d:\python>deactivate
とりあえず実行環境の用意ができました。
参考書籍