googleスプレッドシートに口座残高をスクレイピングしたい(今回は出来なかった)

はじめに

先ほどツイートしたように、googleスプレッドシートに口座残高の情報を出力していく。

懸念点

ログインをどうするのか?

まずはやってみる

SMBCにログインして、そのURLをコピーする。

IMPORTXML関数の第一引数に指定。

要素の検証を開き、取得したい口座残高の数値が書かれている要素を選択。

右クリックして、Copy XPathを選択。

IMPORTXMLの第二引数に指定。

数式の解析エラーになった。

Copy full XPathのほうを指定したら、以下の表示になった。

警告の右に以下の表示があった。

数式を入れたセルにも「アクセスを許可」があった。

クリックすると、「インポートしたコンテンツは空です。」とのこと。

SMBCさんが、スクレイピング対策をされているのかもしれない。

名前の部分は取得できるかどうか試してみたところ、「接続が切断されています」とのこと。

SMBCでリロードをかけてみると、セッションタイムアウトになっていた。

もう一度ログインしてみたが、結果は同じだった。

自分のサイトで試してみる

前回と同じ内容になってしまうが、自分のサイトで試してみるとうまく行った。

第二引数には、ライダムに表示される記事の記事タイトルのXPathを指定した。

この方法で上手くいくかも

SBI証券口座の資産残高を自動で取得する(python & selenium)〜selenium基礎編〜 – 最下層エンジニアの(´・ω・`)な落書き

Pythonのseleniumを使えば、ブラウザの操作を自動化できたりするらしい。

次回以降に試していきたい。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

投稿ID : 23288