2024.05.16(更新日: 2024.05.16)
pythonとExcelでWebスクレイピング Part1

はじめに
pythonでWEBスクレイピングを行ってみる。
スクレイピングとは、WEBページにある情報を取ってくること。
スクレイピング対象
当ブログの「最近書いた記事」のタイトルをスクレイピングしてみたい。

フォルダ構成
my_sampleフォルダの配下にエクセルとpythonファイルがある。

必要なライブラリ
PythonからHTTP通信を行うのに必要な「Requests」、取得したHTMLから必要なテキストなどを抽出するのに必要な「BeautifulSoup」。
この二つをインストールする。
ターミナルで以下のように打ち込んで欲しい。


VScodeなどのエディタでファイルの先頭に以下のように記述して、この二つのライブラリをインポートする。

参考書
以下を参考にしている。
次回(Part2)
Excelファイルの下準備から始める。
下準備といってもシンプルな表を作るだけだ。
取得した最近書いた記事のタイトルをリストアップできればいい。
投稿ID : 21900
コメントを残す