[Python] RequestsでBasic認証をパスして情報を取得する

RequestsはPythonでhttpコンテンツを簡単に取得できるライブラリ。初心者がスクレイピングを勉強する時にも使いやすい。

Basic認証がかかっているウェブサイトの場合でも、認証情報を指定することで問題なくコンテンツを取得できる。

Python環境で、

import requests
requests.get('url', auth=('user_id','password'));

とすると、

<Response [200]>

と返ってくる(passwordを変えて試してみると、ちゃんと401が返ってくる)

通常と同じように、Response型でWEBサイトが取得できるので、HTTPヘッダーやテキストコンテンツも扱える。

r = requests.get('url', auth=('user_id','password'));
r.headers
r.text

簡単!

Written by Ryo Konishi