文章詳情頁
想寫一個python分析統計apache 日志文件的腳本
瀏覽:168日期:2022-07-27 15:36:57
問題描述
想寫一個python分析統計apache 網站日志文件并將統計后的數據存入mysql中的的腳本,有沒有參考的,沒有思路主要是統計 哪些url被爬取了 及 被爬取次數,以及IP這兩個
問題解答
回答1:先把原始數據 規整化,然后 key 值自己定,然后用 collections 的 Counter 統計,然后再遍歷寫入 db, 大概代碼如下:
data = [’/a 1.2.1.2’, ’/b 2.2.2.2’, ’/c 1.1.1.1’, ’/d 2.2.2.2’, ’/d 2.2.2.2’]from collections import Counterc = Counter(data)print c
Counter({’/d 2.2.2.2’: 2, ’/b 2.2.2.2’: 1, ’/a 1.2.1.2’: 1, ’/c 1.1.1.1’: 1})
你也可以自己維護字典,鍵為:/PATH:IP 或者什么,自己定,然后一邊遍歷,一邊添加就好了
相關文章:
1. javascript - 怎么獲取一個頁面中的所數據,然后弄成一個json格式的字符串傳給后臺2. python - 如何用pandas處理分鐘數據變成小時線?3. 文本處理 - 求教使用python庫提取pdf的方法?4. 雙擊安裝程序,安裝不了5. 谷歌訪問助手安裝不了6. javascript - JS中如何實現 DIV內部和鼠標的距離7. Python中使用超長的List導致內存占用過大8. pdo - mysql 簡單注入疑問9. html5 - 百度echart官網下載的地圖json數據亂碼10. javascript - dropload+tab頁面,圖文頁滾動有兩個滾動區域怎么破?
排行榜
