聚焦爬虫:爬取页面中指定的页面内容
– 编码流程:
– 指定url
– 发起请求
– 获取响应数据
– 数据解析
– 持久化存储
数据解析分类
数据解析原理概述
– 正则
– bs4
– xpath(重点内容,通用性比较强)
第一个可能在两个
- 之前存在着url
第二个有可能在图片之中存在着相应的url
数据解析原理概述:
– 解析的局部的文本内容都会在标签之间或者在标签对应的属性中进行存储
– 1.进行指定标签的定位
– 2.标签或者标签对应的属性中存储的数据值进行提取(解析)
神龙|纯净稳定代理IP免费测试>>>>>>>>天启|企业级代理IP免费测试>>>>>>>>IPIPGO|全球住宅代理IP免费测试