av一区二区在线观看_亚洲男人的天堂网站_日韩亚洲视频_在线成人免费_欧美日韩精品免费观看视频_久草视

您的位置:首頁技術文章
文章詳情頁

python - 爬蟲獲取網站數據,出現亂碼怎么解決。

瀏覽:114日期:2022-08-04 09:36:09

問題描述

#!/usr/bin/python# -*- coding: utf-8 -*-import urllib2import reimport HTMLParserclass WALLSTREET: def __init__(self, baseUrl):self.url = baseUrl def get_html_content(self):url = self.urlresponse = urllib2.urlopen(url)str = response.read()print strbaseUrl='https://wallstreetcn.com/live/global' #華爾街見文urlws = WALLSTREET(baseUrl)ws.get_html_content()

以上是代碼,寫的很簡單,但是print出來的是亂碼嘗試了 print str.decode(“utf-8“”)但是報錯UnicodeDecodeError: ’utf8’ codec can’t decode byte 0x8b in position 1: invalid start byte

問題解答

回答1:

str = response.read()這句有兩個問題:1、str是內置關鍵字必須更改為其他變量名2、查看網頁源代碼的編碼方式,如果為utf-8在read()后加.decode(’utf-8’),若為其他可以相應解碼

小建議這種小程序寫個函數會比用類來更加方便,無論是使用還是實現

回答2:

推測用的是sublime text?參考這個

回答3:

這兒應該是encode不是decode,而且你的變量名居然是跟內置關鍵字名字一樣

回答4:

應該是encode吧

標簽: Python 編程
主站蜘蛛池模板: 久久99精品久久久久久琪琪 | av少妇| 国产激情一区二区三区 | 黄色免费在线看 | 欧美成人三级在线观看 | 亚洲福利视频一区 | 欧美精品亚洲精品 | 成人一区二区三区 | 亚洲欧美视频一区 | 日本欧美久久久久免费播放网 | 久久欧美| 欧美日韩国产中文字幕 | 99久久久国产精品 | 亚洲欧洲综合 | 天天做天天爽 | 精品国产视频 | 日本在线视频一区 | 婷色 | 成人午夜精品 | 日韩av在线免费看 | 91日韩在线 | 日韩精品久久久久久 | 伊人国产女 | 久久性生活视频 | 五月婷婷丁香综合 | 四虎成人av | 天天爽 | 日韩欧美中文字幕在线观看 | 激情五月综合色婷婷一区二区 | 97久久超碰 | 天天干天天曰 | 亚洲午夜一区 | av免费观看网站 | 蜜臀av性久久久久av蜜臀妖精 | 亚洲另类色图 | 一区二区高清 | 国产三级在线观看 | 欧美午夜精品久久久久免费视 | 中文字幕在线免费看 | 天天操天天拍 | 久操精品|