文章詳情頁

python把第x列數據寫入第x個文件

瀏覽：198日期：2022-06-29 14:01:17

問題描述

Python爬蟲一共需要爬取65頁數據，每頁數據的列數不確定。現在我能把每一列的數據抓下來，但是因為列數不確定，寫入的文件名就不能確定。問題在于怎么才能把第x列數據寫入第x個文件。也就是如何才能動態選擇file=的文件名。代碼如下：

f_1 = open(’fitment/1.txt’, ’a’)f_2 = open(’fitment/2.txt’, ’a’)f_3 = open(’fitment/3.txt’, ’a’)for i in range(66): pr = random.choice(proxy) url = ’https://*****’ + str(i) + ’****’ page_url = requests.get(url, headers=head, proxies=pr) page_get = page_url.text page_text = BeautifulSoup(page_get, ’lxml’) fitment_1 = page_text.find_all(’tr’, {’class’: ’fitment listRowEven’}) for each_tag_1 in fitment_1:td_text_1 = each_tag_1.find_all(’td’)for x in range(len(td_text_1)+1): print(td_text_1[x].string, file=)

網頁的結構類如下，每個tr標簽即為一列，具體要抓取的數據位于每個td標簽內

問題解答

回答1：

先不要定義好open文件對象，可以根據列數打開相應的文件操作

with open(’列數.txt’, ’a’) as f: f.write(’內容’)

Python 編程

上一條：多進程 - 3D打印軟件Printrun為何使用了Python最不擅長的多線程方式？下一條：python - 深入理解Flask 第三章代碼運行報錯，代碼完全正常，為什么報SQL語法錯誤？

相關文章：

1. python 利用subprocess庫調用mplayer時發生錯誤2. javascript - 有適合開發手機端Html5網頁小游戲的前端框架嗎？3. python - pycharm 自動刪除行尾空格4. datetime - Python如何獲取當前時間5. python - Pycharm的Debug用不了6. python - pandas按照列A和列B分組，將列C求平均數，怎樣才能生成一個列A,B,C的dataframe7. python文檔怎么查看？8. javascript - 關于apply（）與call（）的問題9. html - eclipse 標簽錯誤10. 安全性測試 - nodejs中如何防mySQL注入

排行榜

					
					python - pycharm 自動刪除行尾空格
python 利用subprocess庫調用mplayer時發生錯誤
java - spring boot 如何打包成asp.net core 那種獨立應用?
docker - 各位電腦上有多少個容器啊？容器一多，自己都搞混了，咋辦呢？
docker start -a dockername 老是卡住，什么情況？
docker網絡端口映射，沒有方便點的操作方法么？
docker綁定了nginx端口 外部訪問不到
angular.js - angular.ui：dropdown的下拉菜單關閉的偶爾失常問題
javascript - nginx反向代理靜態資源403錯誤?
html - eclipse 標簽錯誤
python - pandas按照列A和列B分組，將列C求平均數，怎樣才能生成一個列A,B,C的dataframe
				

熱門標簽

av一区二区在线观看_亚洲男人的天堂网站_日韩亚洲视频_在线成人免费_欧美日韩精品免费观看视频_久草视

python把第x列數據寫入第x個文件