前回lolipopのSSHをTeraTermで使うためにpipのインストールまでしたので、pipを使ってbeautifulsoup4モジュールをインストールいてみようと思う。
以下ロリポップのPythonのバージョンで3を使用したいため、python3で進めていく。
以下参考:WebスクレイピングのためにBeautiful Soupをインストールする
モジュールをインストール
pipを使ってモジュールをインストールするときは、
$ python3 -m pip install ※モジュール名
となるので、beautifulsoup4ならこうになるはず。
$ python3 -m pip install beautifulsoup4
Successfully installed beautifulsoup4-4.11.1 ~
みたいなテキストになったのですんなり成功したかも。
前回苦労したのでうれしい。
また、省略しましたが、beautifulsoup4をインストールしたら、soupsieveというパッケージも同時にインストールされました。
無事にインストールできたか確認
pip list
Package Version
---------------------- -----------
beautifulsoup4 4.11.1
mysql-connector-python 8.0.29
mysqlclient 2.1.0
pip 22.2
protobuf 4.21.1
PyMySQL 1.0.2
setuptools 47.1.0
soupsieve 2.3.2.post1
wheel 0.37.1
入ってますね!
Beautiful Soup4の動作確認
参考サイトさんのコードをお借りしました。
from bs4 import BeautifulSoup html = '<html><title>TITLE</title><body><div id="main">BODY</div></body></html>' soup = BeautifulSoup(html, 'html.parser') print(soup.title.text) print(soup.find(id="main").text)
うまくいきました。