文章詳情頁

java 定時同步數(shù)據(jù)的任務優(yōu)化

瀏覽：34日期：2022-08-19 11:47:29

前言

定時任務在系統(tǒng)中并不少見，主要目的是用于需要定時處理數(shù)據(jù)或者執(zhí)行某個操作的情況下，如定時關閉訂單，或者定時備份。而常見的定時任務分為2種，第一種：固定時間執(zhí)行，如：每分鐘執(zhí)行一次，每天執(zhí)行一次。第二種：延時多久執(zhí)行，就是當發(fā)生一件事情后，根據(jù)這件時間發(fā)生的時間定時多久后執(zhí)行任務，如：15分鐘后關閉訂單付款狀態(tài)，24小時候后關閉訂單并且釋放庫存，而由于第二種一般都是單一數(shù)據(jù)的處理（主要是指數(shù)據(jù)量不大，一般情況下只有一個主體處理對象，如：一個訂單以及訂單中的N個商品），所以一般情況下第二種出現(xiàn)性能問題的幾率不大（不代表沒有），所以本文主要是針對第一種定時任務來進行優(yōu)化，而且主要是針對數(shù)據(jù)同步或者傳遞數(shù)據(jù)來進行優(yōu)化，而優(yōu)化的方式也是根據(jù)實際項目中的情況在不同階段進行優(yōu)化的

第一階段

第一階段屬于原始階段，邏輯也最為簡單，由于同步分為數(shù)據(jù)同步和傳遞數(shù)據(jù)，而且2種的需求各不一致（主要是在于是否允許丟失），所以分開分析

第一種類型：傳遞數(shù)據(jù)

由于傳遞數(shù)據(jù)可以允許丟失，常見的場景如調(diào)用憑證推送（常見于接口需要暴露給第三方，為了安全性，可以定時推送調(diào)用憑證來保證接口安全性），消息推送（訂單消費成功后推送消息，由于可能推送失敗，所以需要進入定時任務進行重試，但是因為消息實時性，所以重試到一定次數(shù)后放棄重試）

傳遞數(shù)據(jù)在第一階段設計非常簡單，定時推送，有限的錯誤次數(shù)，同步成功后修改狀態(tài)，同步失敗后對失敗次數(shù)+1，一旦超過錯誤次數(shù)，就不在繼續(xù)嘗試

第二種類型：同步數(shù)據(jù)

同步數(shù)據(jù)跟傳遞數(shù)據(jù)不同點在于同步數(shù)據(jù)一定需要保證數(shù)據(jù)能投遞成功，否則就要一直進行重試，比如2個系統(tǒng)間的訂單同步，會員信息同步等

同步數(shù)據(jù)再第一階段也非常簡單，定時同步數(shù)據(jù)，失敗就設置同步狀態(tài)為同步失敗，每次同步就只查詢狀態(tài)為未同步和同步失敗記錄

第二階段

一開始需要傳遞或者同步的系統(tǒng)很少，數(shù)據(jù)也少，所以沒有什么問題，但是第二階段不一樣了，數(shù)據(jù)量稍微有所新增，但是增量不大，主要是需要同步的系統(tǒng)多了，打個比方，連鎖商店，總部需要把數(shù)據(jù)下傳到所有門店去，這樣門店就不用每次去總部獲取數(shù)據(jù)，這樣太耗費時間了，當然門店每次從總部獲取到數(shù)據(jù)可以緩存到本地，不過跟本文內(nèi)容關系不大，所以這里不再討論。由于需要同步的系統(tǒng)太多，所以延伸出另外一個問題，一旦一個系統(tǒng)的網(wǎng)絡環(huán)境不好，會影響其他系統(tǒng)數(shù)據(jù)同步，所以在第二階段，引入了黑名單機制，由于黑名單機制對于傳遞數(shù)據(jù)和同步數(shù)據(jù)大致相同，所以這里就不分開描述，有差異性的地方也會指出

黑名單具體處理機制

黑名單分二級：

第一級用于控制本次定時任務，當本次運行定時任務時，不同的接受數(shù)據(jù)服務器可能有0-N條數(shù)據(jù)需要同步，所以一旦進入第一級黑名單后，本次后面都不會向接受數(shù)據(jù)服務器發(fā)起請求，而是直接失敗；

第二級用于控制多長時間內(nèi)不進入重試，是控制整個的，從查詢需要同步的數(shù)據(jù)時候就直接過濾并且設置為同步失敗狀態(tài)（傳遞消息需要對失敗次數(shù)加1）

首先第一級，當請求不到接受數(shù)據(jù)的服務器的時候（鏈接失敗，或者鏈接超時），會再重試2次（傳遞數(shù)據(jù)由于及時性要求，所以不會重試，并且超時時間也會合理的減少），如果2次都同步失敗，這判斷本條數(shù)據(jù)同步失敗，并且進入第一級黑名單，并且判斷一定時間內(nèi)進入了幾次第一級黑名單，具體使用redis控制，首先是否進入第一級黑名單直接程序中存儲就好，一定時間段內(nèi)進入了幾次黑名單，就使用有序集合保存，排序的分值就存儲當前時間戳

進入第一級黑名單后，使用一定時間內(nèi)進入幾次的限制條件，來判斷是否進入第二級黑名單，比如5分鐘進入3次第一級黑名單，就進入第二級黑名單，那么就查詢分值大于5分鐘前時間戳的數(shù)據(jù)集合，如果集合結果有3條或以上數(shù)據(jù)了，那么就進入第二級黑名單，同時清理掉redis中關于第一級黑名單存儲的數(shù)據(jù)，如果沒有3條數(shù)據(jù)，那么就刪除分值小于5分鐘前的時間戳的數(shù)據(jù)，避免垃圾數(shù)據(jù)過多

使用黑名單機制，可以有效避免一些因為服務本來不可訪問導致一直還重試的問題，并且由于有二級黑名單，所以也一定程度上避免了因為暫時網(wǎng)絡波動，導致數(shù)據(jù)長久無法同步的問題

第三階段

由于需要傳遞的數(shù)據(jù)和需要同步數(shù)據(jù)的服務越來越多，并且由于各種問題導致很多數(shù)據(jù)不能一次性同步成功，所以每次定時任務都需要同步大量數(shù)據(jù)，這樣就導致及時性很差了，比如幾千條數(shù)據(jù)同步下來，就算一條只需要幾十毫秒，從開始到最后一條數(shù)據(jù)同步成功也是幾十秒之后了，所以需要再次對定時任務進行優(yōu)化，數(shù)據(jù)量大而導致同步慢原因很簡單，是由于單個線程串行同步的，也就是說必須要上一條數(shù)據(jù)處理了才能處理下一條數(shù)據(jù)，所以可以使用多線程來優(yōu)化，提高硬件使用率

多線程的定時任務

當然肯定不可能給每條數(shù)據(jù)創(chuàng)建一個線程，先不說得創(chuàng)建多少條線程，僅僅是創(chuàng)建線程的消耗就已經(jīng)很大了，而且線程數(shù)量太多，頻繁切換線程上下文也會導致性能損耗，所以最合適的就是將數(shù)據(jù)分配到機器CPU核心數(shù)量的線程，或者核心數(shù)量*2的線程上去處理更合適，當然具體情況具體分析，最好還是具體測試得出合適的線程數(shù)量，同時由于肯定是會存在多個定時任務，所以可以多個定時任務使用同一個線程池，但是每個任務只使用合適線程數(shù)量來處理

線程數(shù)據(jù)分配原則

同一個被接受調(diào)用的數(shù)據(jù)的服務器的數(shù)據(jù)肯定是分配到一個線程中去處理，比如要分配8個線程來處理，那么可以創(chuàng)建8個集合，先保存查詢出來需要被同步的數(shù)據(jù)，同時查詢出來的數(shù)據(jù)根據(jù)被接受數(shù)據(jù)的服務器標識排序，用接受數(shù)據(jù)的服務器標識的hash值來%8來確定放入哪個集合，或者使用輪詢的方式放入指定集合，分配好之后則創(chuàng)建8個runable放入線程池中去執(zhí)行

防止定時任務疊加

開啟多線程處理后，由于主線程在把任務放入線程池中運行的時候就會返回了，所以一定需要防止定時任務疊加，比如任務是10秒執(zhí)行一次的，每次定時任務本身的線程只執(zhí)行了1秒，下次定時任務的時候會發(fā)現(xiàn)定時任務已經(jīng)處理完成，但是實際上真正同步數(shù)據(jù)的8個線程都沒有執(zhí)行完成，就會出現(xiàn)一條數(shù)據(jù)重復同步，或者把數(shù)據(jù)累加到上次任務的集合中去（看具體的處理方式導致不同的結果），最后就跟滾雪球一樣，整個服務就算不崩潰，也會出現(xiàn)各種問題，或者就是浪費大量資源去做重復同步，所以為了防止任務疊加，需要使用閉鎖來防止定時任務本身返回的情況，同時使用閉鎖也要注意處理異常的情況，防止發(fā)生異常后，閉鎖沒有執(zhí)行操作，導致定時任務一直不能返回

閉鎖

使用閉鎖防止定時任務返回，8個線程的情況下創(chuàng)建閉鎖

CountDownLatch latch = new CountDownLatch(8);

每個線程執(zhí)行完數(shù)據(jù)后需要countDown方法來通知，或者叫關閉一個柵欄吧，創(chuàng)建閉鎖的傳入的8我們可以看成創(chuàng)建了8個柵欄

latch.countDown();

同時在定時任務的線程中，需要等待所有柵欄關閉才能繼續(xù)執(zhí)行，所以需要調(diào)用方法

latch.await();

這樣只有所有線程執(zhí)行完成后，定時任務的線程才會繼續(xù)執(zhí)行，防止任務疊加

使用多線程了，一定要注意多線程的一些線程安全以及其他的一些問題，如果對閉鎖和多線程本身不夠了解的話，可以自行去查閱一些相關資料

第四階段

數(shù)據(jù)量非常大，接受數(shù)據(jù)的服務也非常多

一臺服務器的硬件資源始終有限，尤其是網(wǎng)絡資源，由于接受數(shù)據(jù)的服務不一定是內(nèi)網(wǎng)服務，加上各種問題導致鏈接失敗，所以數(shù)據(jù)量大的情況下，就算使用了多線程，還是會造成數(shù)據(jù)延遲很久才同步成功（主要延遲原因是網(wǎng)絡問題），這時候就需要使用多臺服務器了，而使用多臺服務器定時執(zhí)行就存在一個問題，數(shù)據(jù)分片，簡單來說怎么保證一條數(shù)據(jù)只能被一臺服務器處理，數(shù)據(jù)分片有2種方式，第一種：不同服務器處理不同的表的數(shù)據(jù)。第二種：數(shù)據(jù)本身主鍵或者某種標志分配處理

2種處理方式有各自的優(yōu)缺點

第一種：

優(yōu)點：簡單，只需要簡單拆分或者配置即可

缺點：無法擴展更多，最多只能可能擴展到數(shù)據(jù)表數(shù)量臺服務器，并且對于熱點數(shù)據(jù)無法更優(yōu)處理，比如訂單這些熱點數(shù)據(jù)，始終都在一臺服務器

第二種：

優(yōu)點：理論上可無限擴展，可以針對熱點數(shù)據(jù)專門擴展

缺點：配置麻煩，每次新增服務器需要重新配置

實現(xiàn)分片定時任務

由于第一種配置簡單，而且擴展性不強，所以本文主要講述第二種方式的實現(xiàn)；

如果所有數(shù)據(jù)有生成都有自增型主鍵id，那么最簡單也最公平的就是給每臺服務器配置一個從0開始連續(xù)的服務器id，每臺服務器查詢數(shù)據(jù)的時候加一個條件id%服務器臺數(shù)=當前服務器id，注意這樣會導致id列的索引可能無法命中（根據(jù)數(shù)據(jù)庫不同，是否命中情況不一致），這樣配置的好處就是絕對公平，每臺服務器分配到的數(shù)據(jù)量是平等的，壞處就是一臺服務器可能會給所有接受數(shù)據(jù)服務發(fā)起請求，無法更好的利用鏈接復用，另外也無法針對服務器配置來增加或者降低權重（當然可以一個服務器配置2個id的方式來實現(xiàn)，但是這樣也不友好）

如果為了更好的利用鏈接復用，可以使用先計算出接受數(shù)據(jù)服務標志的hashcode值，然后跟進hashcode值%服務器臺數(shù)=當前服務器id的形式，這樣就可以將接受數(shù)據(jù)服務分組式的配置到某個服務器上去處理，當然如果接受數(shù)據(jù)服務本身存在很大的數(shù)據(jù)量差異，就不推薦這種方式了，畢竟這樣容易把大量數(shù)據(jù)堆積到某臺服務器上去處理

當然還有其他多種分片的配置方式，比如采用表配置的方式來配置哪臺服務器處理哪些數(shù)據(jù)，也可以使用上面種方式的結合體，可以根據(jù)具體情況分析到底怎么樣才能更適合的進行數(shù)據(jù)分片處理，當然常規(guī)情況下，采用id%服務器的臺數(shù)是能滿足大部分需求的

其他優(yōu)化

當系統(tǒng)針對性能優(yōu)化到一定程度的時候，就可以考慮從業(yè)務或者其他方面進行優(yōu)化了，比如一旦有系統(tǒng)進入二級黑名單了，就發(fā)出警告通知，或者沒有進入二級黑名單，但是卻經(jīng)常進入一級黑名單，也提出一個報警，這樣可以讓人去排查原因，確認是程序問題還是網(wǎng)絡本身的問題。另外也可以設置一個閾值，某個接受數(shù)據(jù)的服務一直響應很慢，或者經(jīng)常響應時間超過某個閾值的時候，可以考慮進行降權處理，或者排查程序已經(jīng)網(wǎng)絡相關的原因

以上就是java 定時同步數(shù)據(jù)的任務優(yōu)化的詳細內(nèi)容，更多關于Java 定時任務的資料請關注好吧啦網(wǎng)其它相關文章！

Java

上一條：一文秒懂Java enum常見的用法講解下一條：java中用String.Join美化代碼的實例講解

相關文章：

1. moment轉化時間戳出現(xiàn)Invalid Date的問題及解決2. python爬蟲實戰(zhàn)之制作屬于自己的一個IP代理模塊3. 如何在jsp界面中插入圖片4. HTML 絕對路徑與相對路徑概念詳細5. WML的簡單例子及編輯、測試方法第1/2頁6. 詳解盒子端CSS動畫性能提升7. 解決ajax請求后臺,有時收不到返回值的問題8. asp批量添加修改刪除操作示例代碼9. .NET6打包部署到Windows Service的全過程10. ajax請求后臺得到json數(shù)據(jù)后動態(tài)生成樹形下拉框的方法

排行榜

					
					moment轉化時間戳出現(xiàn)Invalid Date的問題及解決
python爬蟲實戰(zhàn)之制作屬于自己的一個IP代理模塊
Python lxml庫的簡單介紹及基本使用講解
Java剖析工具YourKit 發(fā)布5.0版本
python3 通過 pybind11 使用Eigen加速代碼的步驟詳解
詳解Android系統(tǒng)啟動過程
關于Python Socket編程的要點詳解
動態(tài)設置django的model field的默認值操作步驟
Android的線程和線程池
IntelliJ IDEA安裝插件的方法步驟
匯總Android Manifest 權限描述大全