av一区二区在线观看_亚洲男人的天堂网站_日韩亚洲视频_在线成人免费_欧美日韩精品免费观看视频_久草视

您的位置:首頁技術文章
文章詳情頁

解決python存數(shù)據(jù)庫速度太慢的問題

瀏覽:11日期:2022-06-23 10:40:39
問題

在項目中遇到一個問題,需要從文本中讀取三萬條數(shù)據(jù)寫入mysql數(shù)據(jù)庫,文件中為用@分割的sql語句,但是在讀取的過程中發(fā)現(xiàn)速度過慢,三萬八千條數(shù)據(jù)需要220秒,問題代碼片段如下:

def read_to_mysql(filecata, targetDir): ’’’ 用來寫入數(shù)據(jù)庫,寫入后會剪貼掉文件 filecata 為保存有文件地址的list,已去掉尾部的空格 :param filecata: 文件目錄 :param targetDir: 要復制的目標目錄 :return: ’’’ root_dir = os.path.abspath(os.path.join(os.getcwd(), './')) config = configparser.ConfigParser() config.read(root_dir + '/config.ini') __host = config.get('DatabaseOfWRT', 'host') __database_name = config.get('DatabaseOfWRT', 'database') __user_name = config.get('DatabaseOfWRT', 'username') __user_passwaord = config.get('DatabaseOfWRT', 'password') __charset = config.get('DatabaseOfWRT', 'charset') conn = pymysql.connect( host=__host, user=__user_name, password=__user_passwaord, database=__database_name, charset=__charset ) cursor = conn.cursor() with open(filecata, 'r', encoding=’utf-8’) as f: data = f.read() # 讀取文件 data_list = data.split(’@’) del data_list[-1] starttime = int(time.time()) for data_str in data_list: data_str = str(data_str) sql = data_str + ’;’ cursor.execute(sql) conn.commit() print(flag) copy_del_file(filecata, targetDir) # 用來剪切的函數(shù),此處不影響,因而省略 cursor.close() conn.close()解決方案

經(jīng)測試發(fā)現(xiàn),影響速度的主要原因是commit(),因為沒過幾秒提交一次即可,但是因為提交的字符長度有限制,所以要設置一個合理的時間讀取,代碼修改如下:

def read_to_mysql(filecata, targetDir): ’’’ 用來寫入數(shù)據(jù)庫,寫入后會剪貼掉文件 filecata 為保存有文件地址的list,已去掉尾部的空格 :param filecata: :param targetDir: 要復制的目標目錄 :return: ’’’ root_dir = os.path.abspath(os.path.join(os.getcwd(), './')) config = configparser.ConfigParser() config.read(root_dir + '/config.ini') __host = config.get('DatabaseOfWRT', 'host') __database_name = config.get('DatabaseOfWRT', 'database') __user_name = config.get('DatabaseOfWRT', 'username') __user_passwaord = config.get('DatabaseOfWRT', 'password') __charset = config.get('DatabaseOfWRT', 'charset') conn = pymysql.connect( host=__host, user=__user_name, password=__user_passwaord, database=__database_name, charset=__charset ) cursor = conn.cursor() with open(filecata, 'r', encoding=’utf-8’) as f: data = f.read() # 讀取文件 data_list = data.split(’@’) del data_list[-1] starttime = int(time.time()) for data_str in data_list: endtime = int(time.time()) data_str = str(data_str) sql = data_str + ’;’ cursor.execute(sql) if endtime - starttime ==10: # 每過十秒提交一次 starttime = int(time.time()) conn.commit() conn.commit() copy_del_file(filecata, targetDir) cursor.close() conn.close() return flag

此時寫入三萬八千條數(shù)據(jù)需要9秒

補充:python 連數(shù)據(jù)庫cursur.fetchall ()速度慢的解決方案

解決游標遍歷慢的方法:

一行一行去遍歷,而不是一下全部讀取出來

將cursur.fetchall()更改為for i in cursur:

補充:python 讀取文件時速度的問題

'''舉例 讀取文件'''# 第一種方式with open(’test.txt’, ’r’, encoding=’utf-8’) as f: info = f.readlines() for line in info: pass# 第二種方式with open(’test.txt’, ’r’, encoding=’utf-8’) as f: for line in f: pass

對于以上兩種方式讀取文件,各自有各自的用途,當用兩種方式都可以時,第二種方式的效率是第一種的幾個量級, readlines()將文件內(nèi)容讀取到內(nèi)存的list中,操作雖然方便,但是消耗內(nèi)存,運行效率慢。

原生的f是將文件內(nèi)容讀到生成器中, 當需要操作時,從生成器中循環(huán)出來,速度很快,操作大文件時建議用第二種方式!

以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持好吧啦網(wǎng)。如有錯誤或未考慮完全的地方,望不吝賜教。

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 日韩综合在线播放 | 一级做a爰片性色毛片16美国 | 欧美精品福利视频 | 亚洲国产成人精品久久久国产成人一区 | 久久婷婷香蕉热狠狠综合 | 日韩电影免费在线观看中文字幕 | 亚洲国产精品一区二区第一页 | 免费网站国产 | 一区二区三区免费 | 天天操夜夜操 | 日韩免费中文字幕 | 精品亚洲一区二区三区四区五区 | 午夜ww| 一区二区精品在线 | 久久中文字幕一区 | 国产精品视频久久久 | 久久久久国产 | 精品久久久久久久久久久下田 | 日韩国产欧美一区 | 国产福利视频导航 | 日韩高清中文字幕 | 成人亚洲片 | 欧美一区二区三区在线看 | 三级在线免费 | 久久精品视频一区二区 | 国产欧美日韩一区 | 91精品久久久久久久久中文字幕 | xxxxx免费视频 | yiren22 亚洲综合 | 亚洲性视频网站 | 亚洲精品自在在线观看 | 精品国产精品三级精品av网址 | 农村妇女毛片精品久久久 | 国产精品一区在线 | 做a的各种视频 | 精品视频在线免费观看 | 艹逼网 | 精产嫩模国品一二三区 | 久久亚洲一区二区三区四区 | 日韩中文字幕在线观看 | 特级黄一级播放 |