av一区二区在线观看_亚洲男人的天堂网站_日韩亚洲视频_在线成人免费_欧美日韩精品免费观看视频_久草视

您的位置:首頁技術文章
文章詳情頁

python - 網頁title中包含換行,如何用正則表達式提取出來?

瀏覽:140日期:2022-06-28 10:07:00

問題描述

在用python做CSDN的網頁爬蟲,在爬取網頁title時,我一直用的正則表達式(?<=<title>).+?(?=<)在CSDN中用不了了,去CSDN源碼一看,title換行顯示了python - 網頁title中包含換行,如何用正則表達式提取出來?

所以導致原來的正則表達式無法使用,那么,問題來了,像這樣網頁title中包含換行,如何用正則表達式提取出來呢?

PS:

不想用xpath或beautifulsoup的方法,只需要正則哦

CSDN本身有反爬蟲機制,我并不是因為這個反爬蟲而爬不到title的哦

謝謝大家

參照@caimaoy 的方法,我將正則表達式改為 (?<=<title>)(?:.|n)+?(?=<)后,title完美提取。再次感謝大家。

問題解答

回答1:

re.M 多行模式

自己寫多行匹配 http://python3-cookbook.readt...

回答2:

表達式那邊加個flag吧

tite = ’......’print(re.findall(’(?<=<title>).+?(?=<)’, title, re.S))

標簽: Python 編程
主站蜘蛛池模板: 亚洲视频精品 | 青青草网址| 精品国产一区二区三区久久久蜜月 | 欧美国产在线观看 | 黄色成人在线视频 | 国产黄a三级三级三级看三级男男 | 久久综合伊人 | 精品日韩一区二区三区 | 成人免费视频一区二区 | 国产亚洲欧美日韩高清 | 日韩午夜在线 | 亚洲欧美成人 | 国产精品不卡视频 | 91精品一区 | 99久久久国产精品 | 福利视频一区二区 | 日日夜夜综合网 | 神马香蕉久久 | 欧美三级欧美一级 | 欧美专区在线观看 | 国产高清一区 | 欧美一级在线观看 | 在线观看的av网站 | 色77777| 精品国产欧美一区二区三区成人 | 日韩成人精品一区二区 | 精品国产精品三级精品av网址 | 成 人 黄 色 片 在线播放 | 黄色特级毛片 | 日韩三级在线播放 | 日韩精品福利 | 婷婷丁香激情 | 精品国产91乱码一区二区三区 | 国产日韩欧美一区 | 欧美视频在线观看免费 | 欧美精品色 | av不卡一区 | 国产成人精品亚洲男人的天堂 | 免费福利片 | 日本欧美久久久久免费播放网 | 国产精品一品二区三区的使用体验 |