urllib.requestモジュールのurlopen関数ってローカルファイルもいけるんじゃね?

PythonによるWebスクレイピング学習初期に必ず一度は使うことになると思われるurllibライブラリ。そのrequestモジュールに含むurlopen関数。ネットの情報もしくは書籍に目を通しても、必ず何処かのウェブサイトからページ取得を試みている。

初心者が学習する内は、単発程度のリクエストなので、サーバ負荷なんて微々たるものだと思うけど、何度も繰り返すような処理は、いろいろと問題があると思われる。

じゃあ、自前でローカルサーバ立ち上げて試すという方法も思ったけど、ちょっと方向が違うように感じた。

理想は、ローカル環境のカレントディレクトリ内にhtmlファイルを置いて、Pythonコードから操作して取得するという方法。

Python Code

urlopen関数の引数部分をこのように絶対パスで記述することで試したいHTMLを取得できるようになります。なお、相対パスは試していない。なんとなく動かないような気がしたから。