python - Notepad2與PyCharm區別
問題描述
同樣的代碼在 Notepad 環境(測試過記事本)過不了,在 Pycharm 可以過( Python3.5 )代碼:
import urllibimport urllib.requesturl = 'http://www.baidu.com'data = urllib.request.urlopen(url).read()data = data.decode(’UTF-8’)
這條語句,兩個環境都可以過
data.decode(’gbk’, ’ignore’).encode(’UTF-8’)print(data)
在 Pycharm 顯示爬出的網頁,在 cmd 窗口顯示
UnicodeEncodeError: ’gbk’ codec can’t encode character ’xbb’ in position 26830:illegal multibyte sequence
必須去除無效字符。
import urllibimport urllib.requesturl = 'http://www.baidu.com'data = urllib.request.urlopen(url).read()data.decode(’gbk’, ’ignore’).encode(’UTF-8’)print(data)
這樣可以過,求解釋
問題解答
回答1:你遇到的可能和我一樣是python編碼問題,或者使用的terminal的編碼支持問題。看看下面的問題。
【python編碼問題?】分享自@SegmentFault,傳送門:/q/10...
相關文章:
1. JavaScript將.apply()與'new'運算符配合使用這可能嗎?2. angular.js - webpack build后的angularjs路由跳轉問題3. java - web項目中,用戶登陸信息存儲在session中好 還是cookie中好,取決于什么?4. java - Activity中的成員變量被賦值之后,Activity被回收的時候內存才會被釋放嗎5. 請求一個數據返回內容為空或者錯誤如何再次請求幾次6. 數組按鍵值封裝!7. 老師,flex-shrink: 1; 按視頻操作,不會自動縮放8. 為什么bindClass訪問不了的?9. Discuz! Q 有人用過嗎?10. php由5.3升級到5.6后,登錄網站,返回的是php代碼,不是登錄界面,各位大神有知道的嗎?
