「逆引きPython/インターネットアクセス」の編集履歴(バックアップ)一覧に戻る

逆引きPython/インターネットアクセス - (2009/11/22 (日) 18:48:02) のソース

#contents(fromhere=true)

**URLを指定して内容を取得する
urllib.request.urlopen()はPython2.6以前のurllib2.urlopen()と同様の機能を提供します。組み込み関数のopen()と似たような扱い方ができます。
 >>> import urllib.request
 >>> f = urllib.request.urlopen("http://www40.atwiki.jp/geiinbashoku/")
 >>> print(f.read(50))
 b'<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Trans'

文字列ではなくバイト列を取得するので、状況にあったエンコーディング方式を指定してデコードする必要があります。
 import urllib.request
 f = urllib.request.urlopen('http://www40.atwiki.jp/geiinbashoku/')
 for line in f:
   print(line.decode("utf_8"), end="") #UTF_8でデコード


----