Python 3.8がリリース

https://www.python.org

新機能も含めて、3.7系から何が変わったのか、これから情報を集める段階である。

3.5や3.6をチマチマと触ったけど、本腰入れて勉強したのは3.7でした。と言っても、今年に入り基本部分と興味を持ったモジュールの使い方程度ですが。本当は時間をかけてしっかり取り組みたいけど、おっさん社会人にはちと辛いです。

ここ3か月ぐらいほとんどPython触っていないので、時間をうまく活用するようなライフハックについて実践したいと思う今日この頃。

urllib.requestモジュールのurlopen関数ってローカルファイルもいけるんじゃね?

PythonによるWebスクレイピング学習初期に必ず一度は使うことになると思われるurllibライブラリ。そのrequestモジュールに含むurlopen関数。ネットの情報もしくは書籍に目を通しても、必ず何処かのウェブサイトからページ取得を試みている。

初心者が学習する内は、単発程度のリクエストなので、サーバ負荷なんて微々たるものだと思うけど、何度も繰り返すような処理は、いろいろと問題があると思われる。

じゃあ、自前でローカルサーバ立ち上げて試すという方法も思ったけど、ちょっと方向が違うように感じた。

理想は、ローカル環境のカレントディレクトリ内にhtmlファイルを置いて、Pythonコードから操作して取得するという方法。

Python Code

urlopen関数の引数部分をこのように絶対パスで記述することで試したいHTMLを取得できるようになります。なお、相対パスは試していない。なんとなく動かないような気がしたから。