请求
1 requests
HTML/XML的解析器
1 pyquery
pyquery 得名于 jQuery(知名的前端 js 库),可以用类似 jQuery 的语法解析网页。
2 lxml
lxml 有很高的解析效率,支持 xPath 语法(一种可以在 HTML 中查找信息的规则语法)
3 BeautifulSoup4
BeautifulSoup(下文简称 bs)翻译成中文就是“美丽的汤”,这个奇特的名字来源于《爱丽丝梦游仙境》(这也是为何在其官网会配上奇怪的插图,以及用《爱丽丝》的片段作为测试文本)。
4-1.html
官方中文文档 https://beautifulsoup.readthedocs.io/zh_CN/v4.4.0/
pip install beautifulsoup4
要注意,包名是beautifulsoup4,如果不加上 4,会是老版本也就是 bs3,它是为了兼容性而存在,目前已不推荐。我们这里说 bs,都是指 bs4。
神龙|纯净稳定代理IP免费测试>>>>>>>>天启|企业级代理IP免费测试>>>>>>>>IPIPGO|全球住宅代理IP免费测试