Python——网络爬虫,一个简单的通用代码框架

   日期:2024-12-28    作者:fj0lv 移动:http://oml01z.riyuangf.com/mobile/quote/76949.html
一、代码
"""
通用代码框架:可使网页爬取变得更稳定更有效

下面是一个爬取百度网页的例子,
正常情况下是返回
"""
import requests


def get_HTML_Text():
try:
r = requests.get(url, timeout=30)
r.raise_for_status()
# 若状态不是200,引发HTTPError异常
r.encoding = r.apparent_encoding
return r.text
except:
return '产生异常!'


if __name__ == '__main__':
url = "http://www.baidu.com"
print(get_HTML_Text()

 异常情况1:

 

 

 

异常情况2:

 

 异常情况3:

 

三、总结
异常情况的原因多样,通用代码框架并不能包含全部异常,代码写正确才是王道
 
 

特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。


举报收藏 0评论 0
0相关评论
相关最新动态
推荐最新动态
点击排行
{
网站首页  |  关于我们  |  联系方式  |  使用协议  |  隐私政策  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2020018471号