python把第x列數據寫入第x個文件
問題描述
Python爬蟲一共需要爬取65頁數據,每頁數據的列數不確定。現在我能把每一列的數據抓下來,但是因為列數不確定,寫入的文件名就不能確定。問題在于怎么才能把第x列數據寫入第x個文件。也就是如何才能動態選擇file=的文件名。代碼如下:
f_1 = open(’fitment/1.txt’, ’a’)f_2 = open(’fitment/2.txt’, ’a’)f_3 = open(’fitment/3.txt’, ’a’)for i in range(66): pr = random.choice(proxy) url = ’https://*****’ + str(i) + ’****’ page_url = requests.get(url, headers=head, proxies=pr) page_get = page_url.text page_text = BeautifulSoup(page_get, ’lxml’) fitment_1 = page_text.find_all(’tr’, {’class’: ’fitment listRowEven’}) for each_tag_1 in fitment_1:td_text_1 = each_tag_1.find_all(’td’)for x in range(len(td_text_1)+1): print(td_text_1[x].string, file=)
網頁的結構類如下,每個tr標簽即為一列,具體要抓取的數據位于每個td標簽內
<tr> <td>...</td> <td>...</td> <td>...</td> <td>...</td></tr><tr> <td>...</td> <td>...</td> <td>...</td> <td>...</td></tr>
問題解答
回答1:先不要定義好open文件對象,可以根據列數打開相應的文件操作
with open(’列數.txt’, ’a’) as f: f.write(’內容’)
相關文章:
1. python 利用subprocess庫調用mplayer時發生錯誤2. javascript - 有適合開發手機端Html5網頁小游戲的前端框架嗎?3. python - pycharm 自動刪除行尾空格4. datetime - Python如何獲取當前時間5. python - Pycharm的Debug用不了6. python - pandas按照列A和列B分組,將列C求平均數,怎樣才能生成一個列A,B,C的dataframe7. python文檔怎么查看?8. javascript - 關于apply()與call()的問題9. html - eclipse 標簽錯誤10. 安全性測試 - nodejs中如何防mySQL注入
