av一区二区在线观看_亚洲男人的天堂网站_日韩亚洲视频_在线成人免费_欧美日韩精品免费观看视频_久草视

您的位置:首頁技術(shù)文章
文章詳情頁

selenium - 請教一下 Python 爬蟲工具

瀏覽:142日期:2022-06-27 16:46:59

問題描述

1)我要抓的是 Instagram 某明星的粉絲2)Instagram pc 站使用了大量的 js 渲染3)沒寫過爬蟲,老板明天就要數(shù)據(jù)

我目前使用的是BeautifulSoup, selenium 和phantomjs

代碼 demo 大概是

driver = webdriver.PhantomJS(self.browser)driver.get(self.url)driver.implicitly_wait(3)element = driver.find_element_by_class_name('_s53mj')element.click()html = driver.page_sourcesoup = BeautifulSoup(html)

問題是:1) 我不知道click 有沒有執(zhí)行成功, click 的元素對不對, driver 好像沒有返回值給我參考2) 即使 click 成功了, 但是他是不是只調(diào)了 js里的 click() 方法,并沒有觸發(fā) target 怎么辦3)我不知道是先渲染page_source, 還是 應該先 click, 假設執(zhí)行成功了 click, 是不是也不會再 source 里返回了

啊, 謝各位爬蟲大佬了

問題解答

回答1:

說的是什么意思?百思不得其解啊。。。

selenium自動化,click能模仿用戶點擊,就跟你自己在頁面上點擊一樣,一切都在虛擬瀏覽器驅(qū)動中進行。

看你的業(yè)務邏輯啊。。。比如有些數(shù)據(jù)要點擊后才有,那就先click再獲取源代碼。

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 另类ts人妖一区二区三区 | 国产精品女同 | 久久精品国产一区二区 | 国产视频一区在线 | 91色网站 | 丁香婷婷六月天 | 国产欧美一区二区 | 全部免费毛片在线播放高潮 | 亚洲精品成a人在线观看 | 茄子视频色| 婷婷激情综合网 | 色网站在线| 成人免费在线视频观看 | 亚洲国产第一页 | www.色日本 | 免费播放av | 黄色一节片 | 91精品国产日韩91久久久久久 | 国产欧美日韩综合 | 精品欧美日韩 | www.粉色视频在线观看 | 你懂的在线网站 | 日韩欧美色图 | 欧美精品亚洲 | 国产亚洲欧美在线 | www一级片| 国产裸体永久免费视频网站 | 国内精品一区二区 | 日本三级大片 | 青青草视频网站 | 91av在线免费观看 | 欧洲精品一区二区 | 久久久精品| 亚洲二区在线 | 天天插天天狠天天透 | 久久精品国产亚洲 | 日本在线免费视频 | 日韩免费一区二区 | 免费看黄色小视频 | 激情影院在线观看 | 手机在线免费av |