av一区二区在线观看_亚洲男人的天堂网站_日韩亚洲视频_在线成人免费_欧美日韩精品免费观看视频_久草视

您的位置:首頁技術文章
文章詳情頁

python - 正則表達式匹配html的問題。

瀏覽:88日期:2022-09-05 14:29:29

問題描述

<dd class='gray6'> <span class='gray6'> 中文 <span class='padl27'></span> 中文 </span> 中文內容 #需要抓取的內容</dd>用BeautifulSoup html.parser解析的網頁,現在用re模塊想抓取**第7行**的中文內容,放在一個組里面(.*?)。正則老是匹配不上,用換行符也匹配不上,不知道怎么寫了。。。

問題解答

回答1:

既然你都用bs4解析了,為什么不用它提取哪?bs4內有一個stripped_string的函數正好滿足你的需要。

回答2:

import repattern = re.compile(r’</span>.*?</span>(.*?)</dd>’, re.S)str = ’’’<dd class='gray6'> <span class='gray6'> 中文 <span class='padl27'></span> 中文 </span> 中文內容 #需要抓取的內容</dd>’’’print(pattern.search(str).group(1))===> 中文內容 #需要抓取的內容回答3:

const re = /^</span>(.*)</dd>$/

這樣可以不?

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 日日夜夜精品 | 国产精自产拍久久久久久蜜 | h片免费| 日本少妇中文字幕 | av在线免费观看网站 | 三级理论片 | 久久在线播放 | 国产精品一区二区在线播放 | 成人午夜毛片 | 亚洲一区二区 | 午夜久久久久久 | 亚洲成人精品在线观看 | 日韩高清精品免费观看 | 亚洲精品美女 | 亚洲视频在线观看免费 | 欧美顶级黄色大片免费 | 亚洲欧洲视频 | 成人免费看片在线观看 | 日韩专区中文字幕 | 一级黄色录像片 | 亚洲成人日韩 | 欧美黄色片 | 超碰在线中文字幕 | 夜夜躁狠狠躁日日躁av | 中文字幕一级片 | 不卡的av在线 | 国产日韩在线播放 | 免费视频一区 | 成人h片在线观看 | 天天综合精品 | 亚色视频 | 国产欧美一区二区精品性色超碰 | 国产精品毛片一区二区在线看 | 成人av一区 | 黄色av免费在线观看 | 欧美亚洲三级 | av噜噜噜| 9999精品视频 | 亚洲欧美视频在线观看 | 国产精品国产三级国产aⅴ浪潮 | 亚洲精品成人网 |