pythonのモジュールurllibを使ってWikipediaの記事をダウンロードしてみました。
環境
Wikipediaの記事をダウンロードする
ライブラリのインポート
必要なライブラリをインポートします。
urlopenを使う
urlopenを使ってHTTPリクエストを送り、レスポンスを受け取ります。
今回はWikipediaの織田信長の記事をダウンロードしています。
urlopenに開きたいURLを渡します。urllib.parseのquote_plusを使うことにより日本語などの非ascii文字を適切にエンコードできます。
htmlには織田信長のページのhtmlファイルの内容が入っています。