python模拟网站登陆获取相关信息


By.XPATH 方法

1,打开需要登陆的网站页面 在需要的输入框 或 按钮入 右健 “检查

2,在跳出对应代码框处,右健选择 Copy XPath

10181.png

3,完整代码如下:

# 引入selenium库中的 webdriver 模块
from selenium import webdriver
# 引入time库
import time

# 打开谷歌浏览器
from selenium.webdriver.common.by import By

# 如果是其它浏览器如edge webdriver.Edge()
driver = webdriver.Chrome()
# 打开网站
driver.get('https://blog.qhweixin.com/')
'''
考虑到网页打开的速度取决于每个人的电脑和网速,
使用time库sleep()方法,让程序睡眠5秒
'''
time.sleep(5)
# 在主页面点击登录按钮,进入登录页面
# '//*[@id="id_username"]' 就是第二步中复制到的内容
driver.find_element(By.XPATH, '//*[@id="meta-3"]/ul/li[1]/a').click()
# 输入账号和密码
driver.find_element(By.XPATH, '//*[@id="id_username"]').send_keys('用户名')
driver.find_element(By.XPATH, '//*[@id="id_password"]').send_keys('密码')
# 点击登录按钮
driver.find_element(By.XPATH, '/html/body/div/div/form/button').click()

# 以下是以个人博客为例打印出效果展示
# 登陆成功后进入 以下 文章归档 页面 打印所有文章列表
driver.get('https://blog.qhweixin.com/archives.html')
content = driver.find_element(By.CLASS_NAME, 'entry-content')
print(content.text)

我的本地项目运行结果如下:

10182.png

以下是本网站归档页

https://blog.qhweixin.com/archives.html

10183.png