URLを指定して内容を取得する

urllib.request.urlopen()はPython2.6以前のurllib2.urlopen()と同様の機能を提供します。組み込み関数のopen()と似たような扱い方ができます。
>>> import urllib.request
>>> f = urllib.request.urlopen("http://www40.atwiki.jp/geiinbashoku/")
>>> print(f.read(50))
b'<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Trans'

文字列ではなくバイト列を取得するので、状況にあったエンコーディング方式を指定してデコードする必要があります。
import urllib.request
f = urllib.request.urlopen('http://www40.atwiki.jp/geiinbashoku/')
for line in f:
  print(line.decode("utf_8"), end="") #UTF_8でデコード



タグ:

+ タグ編集
  • タグ:

このサイトはreCAPTCHAによって保護されており、Googleの プライバシーポリシー利用規約 が適用されます。

最終更新:2009年11月22日 18:48