RDS(Oracle)環境でデータのエクスポートとインポートおよびファイルの削除

psql実行時にパスワードを省略する方法

RDSでOracleの監査証跡機能を使う方法＆注意点

EC2(RedHat)にnginxをインストールする

memcached基本知識

ShellでSSHコマンドを利用する注意点

Shellでsqlplusを使ってSQLを実行する方法

Git特定のフォルダまたはファイルをcloneする

WindowsでMysqlをインストールする

PHPでPostgreSQLに接続する

ShellでSQLを実行する方法(PostgresQL)

EC2でMySQLをインストールする方法

Linux文字コードの確認と変換の方法

zipファイルでPostgreSQL12をインストールする

EC2(RedHat)にPHP7をインストールする

OracleからPostgreSQLへ移行でシノニムの対応方法

APIテストpostmanとnewman

EC2からSQLPLUSでRDSを接続する設定

Pythonでhtml情報取得-xpath

Python

2021.08.01

今回はpythonでウエブサイトから情報取得する方法を紹介します。

目次

lxmlインストール
python参考コード

lxmlインストール

sudo pip3 install lxml
または
sudo pip install lxml

python参考コード

from lxml import etree
import requests

# ヘッダー設定
headers={“user-agent”: “Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.107 Safari/537.36”}
# html情報取得
response = requests.get(‘url’,headers=headers)
html = etree.HTML(response.content)
# xpathを利用する
ret_list = html.xpath(“xpath”)
# 情報取得
for data in ret_list:
print(data)

タイトルとURLをコピーしました