ボス級社内SEのお役立ち技術情報

社内SEのシステム開発について。メインプログラム言語C#

【Python】スクレイピング① データを取得してみる

Pythonのスクレイピングは、Web上の情報を効率的に収集する強力な手法です。

スクレイピングを使えば、価値あるデータや知見を得ることができます。

その手順を記載したいと思います。

開発環境

OS:Windows10 64bit Home
開発環境:
プログラム言語:Python

インストール

リンクからダウンロードしたEXEファイルを実行してPythonの実行環境をインストールします。

Download Python | Python.org

 

インストール後、pythonコマンドが使用できるか確認するには以下コマンドを入力します。

python version

仮想環境の作成

①関連ファイルが保存されるルートフォルダを作成する。

エクスプローラからプロジェクトフォルダを作成しました。

 D:\python

② コマンドプロンプトを起動し、①で作成したフォルダに移動(cdコマンド)し、仮想環境作成コマンドを実行する。

D:\python>python -m venv scraping

フォルダが作成されています。

③仮想環境を有効にする

以下コマンドを実行します。

.\python\Scripts\activate

コマンドプロンプトの表示が変わります。

スクレイピング用フレームワークをインストールする

Pythonにはスクレイピング専用のフレームワークが用意されており、簡単に

pip install scrapy

実行したら大量の文字が・・・

 

インストールされているモジュール一覧をみるコマンド

pip freeze

Scrapyのバージョンを確認するコマンド

scrapy version

仮想環境を終了させる

(scraping) d:\python>deactivate

 

とりあえず実行環境の用意ができました。

 

参考書籍