av一区二区在线观看_亚洲男人的天堂网站_日韩亚洲视频_在线成人免费_欧美日韩精品免费观看视频_久草视

您的位置:首頁技術文章
文章詳情頁

python - lxml.etree為什么會自動加上加上</i>?

瀏覽:159日期:2022-06-27 17:32:13

問題描述

正在學習lxml,代碼如下:

from lxml import etreetext = ’’’<i class='cell maincell'> <p class='title'><a target='_blank' > <span>洋鼴鼠</span></a> </p> <p><span class='tags t-small c-gray-aset'> <a >電子商務</a></span><span class='loca c-gray-aset t-small'> <a >天津</a></span> </p></i>’’’html = etree.HTML(text)print(etree.tostring(html,encoding=’utf-8’).decode(’utf-8’))

輸出如下:

<html><body><i class='cell maincell'> </i><p class='title'><a target='_blank' > <span>洋鼴鼠</span></a> </p> <p><span class='tags t-small c-gray-aset'> <a >電子商務</a></span><span class='loca c-gray-aset t-small'> <a >天津</a></span> </p></body></html>

主要不理解為什么<i>標簽那里會出錯呢?請問怎么解決這個問題?謝謝~

問題解答

回答1:

主要是因為

p元素內容分類 Flow content, palpable content.允許的內容 Phrasing content.允許的父元素任何接受flow content的元素

i元素Content catergories Flow content, phrasing content, palpable content.允許量 phrasing content.

很顯然P元素的父元素應該是flow content類型的,然而i并不滿足條件,也就是說這是不符合規范的。解決辦法就是i直接換為p。

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 国产黄a一级| 日韩福利 | 婷婷不卡 | 国产精品久久久久久久久图文区 | 亚洲成人久久久 | 91精品国产一区 | 国产精品亚洲成在人线 | 午夜网址 | 免费观看一区二区三区毛片 | 一区二区三区免费 | 91亚洲精品久久久电影 | 日日夜夜天天干 | 视频一区二区三区中文字幕 | 男女精品久久 | 久久九| 天天拍天天射 | 中文字幕不卡 | 韩日一区| 亚洲国产免费 | 99re视频精品 | 国产91丝袜在线播放 | 自拍 亚洲 欧美 老师 丝袜 | 亚洲国产精品视频一区 | 久久精品久久综合 | 国产精品久久久久久久一区探花 | av片网| 国产资源在线视频 | 中文字幕高清 | 久久久国产一区二区三区四区小说 | 中文字幕在线欧美 | 欧美色人 | 男人天堂手机在线视频 | 久久精品欧美一区二区三区不卡 | 亚洲免费在线观看视频 | 一区二区三区中文字幕 | 欧美激情久久久 | 成人免费淫片aa视频免费 | 欧美日韩精品一区二区三区蜜桃 | 日韩中文字幕一区二区三区 | 久久国产日韩 | 天天综合操 |