エンジニアとして必ず使うツール_windows版

psql実行時にパスワードを省略する方法

PostgreSQLデータ型の概要

RDS(Oracle)環境でデータのエクスポートとインポートおよびファイルの削除

仕事中によく使うLinuxコマンド①

oracleからpostgresqlへ移行するデータ型の互換性

ShellでSSHコマンドを利用する注意点

仕事中によく使うLinuxコマンド②

PHPでPostgreSQLに接続する

memcached基本知識

WindowsでMysqlをインストールする

Windowsをモバイルホットスポットとして使う

Linuxで分かると便利なコマンド操作

PHPで文字列を配列に変換する方法

RDSでOracleの監査証跡機能を使う方法＆注意点

Pythonでyoutube動画をアップロードする

SQLPLUSでよく使う設定

APIテストpostmanとnewman

Pythonでhtml情報取得-xpath

Python

2021.08.01

今回はpythonでウエブサイトから情報取得する方法を紹介します。

目次

lxmlインストール
python参考コード

lxmlインストール

sudo pip3 install lxml
または
sudo pip install lxml

python参考コード

from lxml import etree
import requests

# ヘッダー設定
headers={“user-agent”: “Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.107 Safari/537.36”}
# html情報取得
response = requests.get(‘url’,headers=headers)
html = etree.HTML(response.content)
# xpathを利用する
ret_list = html.xpath(“xpath”)
# 情報取得
for data in ret_list:
print(data)

タイトルとURLをコピーしました