pythonとExcelでWebスクレイピング Part1

はじめに

pythonでWEBスクレイピングを行ってみる。

スクレイピングとは、WEBページにある情報を取ってくること。

スクレイピング対象

当ブログの「最近書いた記事」のタイトルをスクレイピングしてみたい。

フォルダ構成

my_sampleフォルダの配下にエクセルとpythonファイルがある。

必要なライブラリ

PythonからHTTP通信を行うのに必要な「Requests」、取得したHTMLから必要なテキストなどを抽出するのに必要な「BeautifulSoup」。

この二つをインストールする。

ターミナルで以下のように打ち込んで欲しい。

Python requests ライブラリについてわかりやすく解説!Web のデータを自由自在に扱おう! | キカガクブログ
10分で理解する Beautiful Soup #Python – Qiita

VScodeなどのエディタでファイルの先頭に以下のように記述して、この二つのライブラリをインポートする。

参考書

以下を参考にしている。

次回(Part2)

Excelファイルの下準備から始める。

下準備といってもシンプルな表を作るだけだ。

取得した最近書いた記事のタイトルをリストアップできればいい。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

投稿ID : 21900