2024.07.29(月) / 08:19

googleスプレッドシートに口座残高をスクレイピングしたい(今回は出来なかった)

ID
23288
Published
2024-07-29 08:19
Modified
2026-06-06 02:45
Author
khiro
Categories
デフォルト, 技術ブログ

先ほどツイートしたように、googleスプレッドシートに口座残高の情報を出力していく。

懸念点

ログインをどうするのか?

まずはやってみる

SMBCにログインして、そのURLをコピーする。

IMPORTXML関数の第一引数に指定。

要素の検証を開き、取得したい口座残高の数値が書かれている要素を選択。

右クリックして、Copy XPathを選択。

IMPORTXMLの第二引数に指定。

数式の解析エラーになった。

Copy full XPathのほうを指定したら、以下の表示になった。

警告の右に以下の表示があった。

数式を入れたセルにも「アクセスを許可」があった。

クリックすると、「インポートしたコンテンツは空です。」とのこと。

SMBCさんが、スクレイピング対策をされているのかもしれない。

名前の部分は取得できるかどうか試してみたところ、「接続が切断されています」とのこと。

SMBCでリロードをかけてみると、セッションタイムアウトになっていた。

もう一度ログインしてみたが、結果は同じだった。

自分のサイトで試してみる

前回と同じ内容になってしまうが、自分のサイトで試してみるとうまく行った。

第二引数には、ライダムに表示される記事の記事タイトルのXPathを指定した。

この方法で上手くいくかも

SBI証券口座の資産残高を自動で取得する(python & selenium)〜selenium基礎編〜 – 最下層エンジニアの(´・ω・`)な落書き

Pythonのseleniumを使えば、ブラウザの操作を自動化できたりするらしい。

次回以降に試していきたい。