文章詳情頁

python - Scrapy中xpath用到中文報(bào)錯(cuò)

瀏覽：145日期：2022-06-27 08:01:12

問題描述

問題描述

links = sel.xpath(’//i[contains(@title,'置頂')]/following-sibling::a/@href’).extract()

報(bào)錯(cuò)：ValueError: All strings must be XML compatible: Unicode or ASCII, no NULL bytes or control characters

問題解答

回答1：

參見文章：解決Scrapy中xpath用到中文報(bào)錯(cuò)問題

解決方法

方法一：將整個(gè)xpath語句轉(zhuǎn)成Unicode

links = sel.xpath(u’//i[contains(@title,'置頂')]/following-sibling::a/@href’).extract()

方法二：xpath語句用已轉(zhuǎn)成Unicode的title變量

title = u'置頂'links = sel.xpath(’//i[contains(@title,'%s')]/following-sibling::a/@href’ %(title)).extract()

方法三：直接用xpath中變量語法($符號(hào)加變量名)$title, 傳參title即可

links = sel.xpath(’//i[contains(@title,$title)]/following-sibling::a/@href’,).extract()回答2：

整個(gè)字符串前加個(gè)u試試

Python 編程

上一條：求大神解讀一段神級(jí)的Python代碼，謝謝！！下一條：python for循環(huán)中的函數(shù)只能運(yùn)行一次？

相關(guān)文章：

1. python文檔怎么查看？2. python - pycharm 自動(dòng)刪除行尾空格3. 安全性測(cè)試 - nodejs中如何防m(xù)ySQL注入4. python - pandas按照列A和列B分組，將列C求平均數(shù)，怎樣才能生成一個(gè)列A,B,C的dataframe5. python - Pycharm的Debug用不了6. html - eclipse 標(biāo)簽錯(cuò)誤7. python 利用subprocess庫調(diào)用mplayer時(shí)發(fā)生錯(cuò)誤8. 請(qǐng)問PHPstudy中的數(shù)據(jù)庫如何創(chuàng)建索引9. datetime - Python如何獲取當(dāng)前時(shí)間10. javascript - 有適合開發(fā)手機(jī)端Html5網(wǎng)頁小游戲的前端框架嗎？

排行榜

					
					python - pycharm 自動(dòng)刪除行尾空格
python 利用subprocess庫調(diào)用mplayer時(shí)發(fā)生錯(cuò)誤
java - spring boot 如何打包成asp.net core 那種獨(dú)立應(yīng)用?
docker - 各位電腦上有多少個(gè)容器啊？容器一多，自己都搞混了，咋辦呢？
docker start -a dockername 老是卡住，什么情況？
docker網(wǎng)絡(luò)端口映射，沒有方便點(diǎn)的操作方法么？
docker綁定了nginx端口 外部訪問不到
angular.js - angular.ui：dropdown的下拉菜單關(guān)閉的偶爾失常問題
javascript - nginx反向代理靜態(tài)資源403錯(cuò)誤?
html - eclipse 標(biāo)簽錯(cuò)誤
python - pandas按照列A和列B分組，將列C求平均數(shù)，怎樣才能生成一個(gè)列A,B,C的dataframe
				

熱門標(biāo)簽

av一区二区在线观看_亚洲男人的天堂网站_日韩亚洲视频_在线成人免费_欧美日韩精品免费观看视频_久草视

python - Scrapy中xpath用到中文報(bào)錯(cuò)