Python爬取网页requests乱码

当前位置：首页 > 论坛 > 详情

Python爬取网页requests乱码
聚码交流
0 0

yhuxAvNbtxUM
0000-00-00 00:00:00
回帖

**之前有在裁判文书上爬取数据，这段时间重新运行爬虫后发现无法获取网页数据，找了一下发现requests网页源码返回的是乱码**（如下截取一部分返回的数据：<metahttp-equiv="Content-Type"content="text/html;charset=utf-8"><metaid="JLyKZlWgYjpTkAsEt9LnA"）不知道是不是网站对网页内容进行了加密，请问如何解决这个问题？谢谢！截取部分程序源码：headers={'User-Agent':'Mozilla/5.0(WindowsNT10.0;Win64;x64)AppleWebKit/537.36(KHTML,likeGecko)Chrome/59.0.3071.104Safari/537.36','Accept':'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8','Accept-Language':'zh-TW,zh;q=0.8,en-US;q=0.6,en;q=0.4','Accept-Encoding':'gzip,deflate','Connection':'keep-alive','Content-Type':'text/html;charset=utf-8'}html=requests.post('http://wenshu.court.gov.cn/List/ListContent',data=data,headers=headers)print(html.text)但是在审查元素里返回应该返回的数据，请问这哪里出现了问题？之前程序正常运行时返回的数据是这样的：

我要回帖

Hi,您好！
发布主题我的主题我的回帖

聚码交流

举报曝光

建议反馈