當前位置：首頁 > 科技 > 軟件

實現一個刷數任務，需要思考哪些維度？

來源：責編：時間：2024-03-18 09:42:27 204觀看

導讀前言大家好，我是田螺。相信很多后端開發的伙伴們，都做過刷數任務了吧。今天跟大家聊聊，做好一個刷數任務，需要具備哪些后端思維。1. 數據的備份和還原我們做刷數任務的時候，首先要考慮的是，這些被刷的數據是否還要還原的。

前言

大家好，我是田螺。

相信很多后端開發的伙伴們，都做過刷數任務了吧。今天跟大家聊聊，做好一個刷數任務，需要具備哪些后端思維。

1. 數據的備份和還原

我們做刷數任務的時候，首先要考慮的是，這些被刷的數據是否還要還原的。或者刷出問題時，需要回滾的。如果是的話，我們就要做好備份。

如果你是把數據遷移到新的表，則有可能不需要備份，這個具體問題具體分析的哈。

通常，我們在一個事務內，先備份數據，再操作刷數邏輯。

圖片

當然，備份數據的方式有多種方式，可以數據庫備份，比如搞一個備份表。或者文件系統快照等，在需要的時候，就還原數據。

2.刷數維度是什么？是否支持灰度?

我們刷數的時候，先確認下具體的業務需求和數據模型。然后需要確定刷數的維度是什么。

圖片

客戶維度：比如刷數的維度可以是一個客戶。刷數的時候，把這個客戶的所有數據撈取出來，在一個事務內，把客戶的所有數據，按照業務的規則，刷到一個表。
賬號維度：刷數的維度是賬號，在執行刷數的時候，就是把這個賬號的所有數據撈取出來，在一個事務內，把賬號的所有數據，刷到另外一個表。

當然，還有其他維度，比如產品維度等等都可以，就看業務需求和你們的數據模型。

確認了刷數維度后，需要思考你的刷數是否支持灰度。比如確認客戶維度刷數后，你實現的代碼，是否支持灰度刷數，也就是說，是否支持先刷一部分客戶，確認沒問題后，再根據配置刷全量客戶。

3. 并發考慮，刷數過程是否需要加鎖。

比如，你要給一個客戶相關的業務表刷數，需要考慮并發場景，簡單點說，就是你在刷數的過程中，客戶是否可能在做交易請求，這時候，是否可能產生臟數據。

一般情況下，可以考慮給客戶維度加分布式鎖，比如加鎖的key是customerId。但是我們加鎖的時候，肯定是不希望影響客戶太久的，因為加鎖后，整個刷數的過程中，系統是處理不了這個用戶的交易請求的，也就是說影響交易了。

圖片

所以也一般刷數任務，我們會選擇在夜深人靜的時候執行，這時候用戶發生交易的概率很低，影響相對較小。

4. 刷數失敗怎么辦？是否支持重試？

我們在刷數的時候，有可能會刷失敗。比如因為網絡問題、或者目標表結構等等。失敗后，我們有哪些措施保證呢：

圖片

如果刷數失敗的話，我們要確保數據的完整性和一致性，一般一個刷數維度，需要加事務，確保失敗可以回滾，保證數據一致性。刷失敗之后，首先確認分布式鎖要被移除（如果有加鎖的話），因為要確認即使失敗后，交易也是能正常進行的。

還要考慮失敗支持重試。可以自動重試或者手動重試，比如通過xxl-job定時任務撈取，繼續重試。有時候，可以設置重試次數和重試間隔，確保任務在一段時間內嘗試恢復。

5. 恰到好處的事務處理

我們第4小節提到，如果失敗了，需要保證數據的完整性和一致性。其實，一般我們刷數，就是通過加事務處理去保證的。

事務需要加到恰到好處，比如我們不能所有的刷數業務都放到一個事務內。如果我們是按照客戶維度來刷數的，我們就一個事務把一個客戶所有的數據刷的邏輯放到一塊，當然，有些查詢是可以放到事務外處理的，一些更新或者修改、刪除操作則放到事務內。

圖片

如果你的數據是分庫處理的，則有可能刷數的時候要考慮分布式事務了。

6. 性能優化，考慮多線并行執行。

如果我們的刷數任務數據量很大，執行耗時比較久的話。就建議可以多線程并行執行。

比如你是分庫分表的，是有30個表，你可以A線程執行1-10的表，B線程執行11-20的表，C線程執行21-30的表。

圖片

7. 日志記錄

我們執行一個刷數任務，一定要做好日志記錄。

我記得我們技術領導說過一句話，很有道理：評價你的日志是否打印得是否夠好。就是你根據控制臺打印出的日志，能知道你的復雜業務執行到什么流程。如果異常中斷，你能根據日志快速知道什么異常，哪個業務數據有問題，那就夠了。

刷數日志打印，一般包括：

記錄詳細的刷數任務日志
包括執行的步驟
刷數成功與否
刷數耗時等信息

8.監控告警

我們開發刷數邏輯的時候，如果某種返回不符合預期的時候，就需要告警上報監控(比如插入數據庫返回跟預期插入條數不一致)。

又或者是你刷數失敗，需要包這個異常日志打印出來，并且上報監控（比如普羅米修斯，和企業微信通知）。比如這塊代碼:

try{    flushService.flushDataCustomerLevel(customerNo);}catch(Exception e){  Logger.error("flush customer data fail: {}", customerNo, e);  prometheusMonitor.report("刷數失敗",customerNo);  notify();  weChatWorkSend();}

9. 數據量大的時候，最好壓測

如果你刷的數據量很大的時候，最好做壓測。壓測通常包括模擬多種負載情況，以確保系統在不同條件下都能正常運行。

做刷數任務壓測，主要考慮這幾方面：

數據量：使用大量數據進行測試，以確保系統在處理大規模數據時的性能。這可以包括數據量的增長、查詢和寫入的吞吐量等。
網絡延遲和吞吐量：在模擬網絡延遲和限制吞吐量的情況下進行測試，以了解系統在這些條件下的表現。
錯誤處理：引入模擬的錯誤場景，例如數據庫連接中斷、請求超時等，以驗證系統對錯誤的處理能力。

刷數壓測的好處：

圖片

性能評估：壓測可以幫助評估系統在處理大量數據時的性能。通過模擬真實負載，可以更好地了解系統的響應時間、吞吐量和資源利用情況。
容量規劃：通過壓測，可以更好地了解系統在不同負載條件下的容量需求。這有助于進行容量規劃，確保系統能夠應對未來的增長。
發現潛在問題：壓測可以幫助發現系統中可能存在的潛在問題，如內存泄漏、并發問題、資源瓶頸等。通過在模擬環境中發現并解決這些問題，可以避免它們在生產環境中引起嚴重后果。
驗證容錯能力：壓測可以測試系統在出現錯誤、超時、網絡故障等異常條件下的容錯能力。這有助于確保系統能夠適應不可預測的情況。
性能優化：壓測結果提供了性能瓶頸的線索，幫助團隊進行性能優化。通過分析性能數據，可以識別需要改進的部分并優化系統。
規遇風險：通過壓測，可以更早地發現潛在的性能問題和瓶頸，有助于規遇系統上線后可能面臨的風險。

10. 實戰壓軸匯總：做一個刷數任務，如何更好保護你的系統

10.1 設置個配置時間，可以控制任務跑多長時間后終止。

有些時候，我們如果擔心刷數任務跑太久，可能會影響交易，這時候我們可以搞個配置變量，比如apollo配置變量，控制刷數多長時間后，可以停止。

10.2 循環分頁查詢，設置最大次數告警監控

我們做刷數任務的時候，經常是分頁循環掃描某個客戶/用戶表，然后一批一批出來執行刷數邏輯。比如偽代碼像這樣:

long minId while(true){   List<CustomerDo> customerList =  customer.pageQueryAscID(pageSize,minId);   flushCustomerData(customerList);   if(customerList.size()< pageSize){     break;   }   minId = customerList.get(customerList.size()-1).getId(); }

這塊代碼，其實沒啥問題。有些時候，我們可能手抖寫錯了，可能導致死循環。

其實為了保護我們的系統，我們可以先確認下客戶有多少，然后設置個循環次數，當超過最大循環次數之后，就告警排查確認。

long minId; Integer maxCycleNum =1000; Integer cycleNum = 0; while(true ){   List<CustomerDo> customerList =  customer.pageQueryAscID(pageSize,minId);   flushCustomerData(customerList);   if(customerList.size()< pageSize){     break;   }   minId = customerList.get(customerList.size()-1).getId();   if(cycleNum>= maxCycleNum){    //告警   }   cycleNum ++; }

當然這只是個一種后端思路哈。

10.3 如果定時任務是xxl-job ，路由規則是什么，并發問題考慮

大家如果使用過xxl-job作為定時任務，應該抖配置過它的路由規則吧。比如是分片的，還是第一個/最后一個等等。

如果是分片的，就是多個pod都可能執行到你的業務邏輯。這時候你要考慮并發執行，你的業務是否收影響。

10.4 SQL是否命中索引，是否存在慢SQL

我們做刷數任務的時候，很多時候，都要跟SQL打交道。

我們要確保查詢、更新、或者刪除的數據量大的表，都要有索引了。要確保沒有慢SQL。

常規的我們可以用explain分析SQL，我們還可以通過壓測分析出來。

10.5 如果加了分布式鎖，鎖時間考慮

如果你是按照客戶維度刷數，加了客戶維度的分布式鎖，你要考慮鎖時間是多久，鎖時間是否可以配置（一般這種最好配置一下。）

如果你時間設置小，那這時候刷數還沒完成，鎖就超時釋放了，那不就有問題啦。

如果你時間設置過長也不太好，當然，你在刷完數，finally執行釋放鎖也可以。

finally {    redisService.deleteKey(customerNoKey);  }

10.6 大事務考慮，事務是否太多？是否可以拆分為小事務

我們在刷數的時候，為了保證數據的完整性和一致性，一般要求加事務的。

但是，切忌事務不要太大，我們可以把一些查詢放到事務外，把計算邏輯也放事務外，把數據庫的更新、新增、刪除操作放到事務內就好。

就是把大事務拆分為小事務。

10.7 打印耗時時間，如果時間夠長

一般來說，做刷數，盡量打印一下耗時，這樣我們可以根據日志，觀察是否有哪些問題需要及時處理的。

比如打印刷一個客戶要多久。或者打印一批客戶要多久，等等。

10.8 是否可以加個配置，減少掃描

有些時候，我們需要配置一定的灰度規則來支持灰度刷數。如果刷數流程是先掃描所有客戶，然后接著判斷客戶是否命中灰度。這樣每次任務執行，都會掃描客戶表。

我么可以考慮加個配置，傳特定的客戶號，根據客戶號列表，去查客戶列表，然后開始刷數邏輯，不用再全表掃描客戶表了。

10.9 是否考慮校驗邏輯

有些時候，我們沒法確認我們刷的邏輯是否正確，這時候，可以考慮是否加校驗邏輯。

你可以異步進行校驗，也可以同步校驗（當然，如果耗時不大的時候）

10.10 try...catch 包住可能的異常

如果我們是按照一個客戶維度去刷數的，你要確認A客戶刷失敗，是不是不能影響B客戶。這時候建議try...catch 包住可能的異常，這樣即有利于分析錯誤原因，又可以不不因為未知異常導致刷數中斷。

本文鏈接：http://www.www897cc.com/showinfo-26-76543-0.html實現一個刷數任務，需要思考哪些維度？

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：用 Python 優雅地玩轉 Elasticsearch：實用技巧與最佳實踐

下一篇：垃圾收集器的秘密：深入理解JVM性能調優

標簽：

熱門焦點

影音體驗是真的強簡單聊聊iQOO Pad

大公司的好處就是產品線豐富，非常細分化的東西也能給你做出來，例如早先我們看到了新的vivo Pad2，之后我們又在iQOO Neo8 Pro的發布會上看到了iQOO的首款平板產品iQOO Pad。雖
石頭自清潔掃拖機器人G10S評測：多年黑科技集大成之作懶人終極福音

科技圈經常能看到一個詞叫“縫合怪”，用來形容那些把好多功能或者外觀結合在一起的產品，通常這樣的詞是貶義詞，但如果真的是產品縫合的好、縫合的實用的話，那它就成了中性詞，今
轎車從天而降電動車主被撞身亡超速搶道所致：現場視頻讓網友吵翻

近日，上海青浦區法院判決轎車從天而降電動車主被撞身亡案，轎車車主被判有期徒刑一年。案件顯示當時男子駕駛轎車在上海某路段行駛，前車忽然轉彎提速超車，
之家push系統迭代之路

前言在這個信息爆炸的互聯網時代，能夠及時準確獲取信息是當今社會要解決的關鍵問題之一。隨著之家用戶體量和內容規模的不斷增大，傳統的靠"主動拉"獲取信息的方式已不能滿足用
三萬字盤點 Spring 九大核心基礎功能

大家好，我是三友~~今天來跟大家聊一聊Spring的9大核心基礎功能。話不多說，先上目錄：圖片友情提示，本文過長，建議收藏，嘿嘿嘿！一、資源管理資源管理是Spring的一個核心的基礎功能，不
Temu起訴SHEIN，跨境電商戰事升級

來源 | 伯虎財經（bohuFN）作者 | 陳平安日前據外媒報道，拼多多旗下跨境電商平臺Temu正對競爭對手SHEIN提起新訴訟，訴狀稱Shein“利用市場支配力量強迫服裝廠商與之簽訂獨家
拼多多APP上線本地生活入口，群雄逐鹿萬億市場

Tech星球（微信ID：tech618）文 | 陳橋輝 Tech星球獨家獲悉，拼多多在其APP內上線了“本地生活”入口，位置較深，位于首頁的“充值中心”內，目前主要售賣美食相關的
三星Galaxy Z Fold5官方渲染圖曝光：13.4mm折疊厚度依舊感人

據官方此前宣布，三星將于7月26日在韓國首爾舉辦Unpacked活動，屆時將帶來帶來包括Galaxy Buds 3、Galaxy Watch 6、Galaxy Tab S9、Galaxy Z Flip 5、
3699元！iQOO Neo8 Pro頂配版今日首銷：1TB UFS 4.0同價位唯一

5月23日，iQOO推出了全新的iQOO Neo8系列，包含iQOO Neo8和iQOO Neo8 Pro兩個版本，其中標準版搭載高通驍龍8+，而Pro版更是首發搭載了聯發科天璣9200+旗艦

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

實現一個刷數任務，需要思考哪些維度？

前言

1. 數據的備份和還原

2.刷數維度是什么？是否支持灰度?

3. 并發考慮，刷數過程是否需要加鎖。

4. 刷數失敗怎么辦？是否支持重試？

5. 恰到好處的事務處理

6. 性能優化，考慮多線并行執行。

7. 日志記錄

8.監控告警

9. 數據量大的時候，最好壓測

10. 實戰壓軸匯總：做一個刷數任務，如何更好保護你的系統

10.1 設置個配置時間，可以控制任務跑多長時間后終止。

10.2 循環分頁查詢，設置最大次數告警監控

10.3 如果定時任務是xxl-job ，路由規則是什么，并發問題考慮

10.4 SQL是否命中索引，是否存在慢SQL

10.5 如果加了分布式鎖，鎖時間考慮

10.6 大事務考慮，事務是否太多？是否可以拆分為小事務

10.7 打印耗時時間，如果時間夠長

10.8 是否可以加個配置，減少掃描

10.9 是否考慮校驗邏輯

10.10 try...catch 包住可能的異常

影音體驗是真的強簡單聊聊iQOO Pad

石頭自清潔掃拖機器人G10S評測：多年黑科技集大成之作懶人終極福音

轎車從天而降電動車主被撞身亡超速搶道所致：現場視頻讓網友吵翻

之家push系統迭代之路

三萬字盤點 Spring 九大核心基礎功能

Temu起訴SHEIN，跨境電商戰事升級

拼多多APP上線本地生活入口，群雄逐鹿萬億市場

三星Galaxy Z Fold5官方渲染圖曝光：13.4mm折疊厚度依舊感人

3699元！iQOO Neo8 Pro頂配版今日首銷：1TB UFS 4.0同價位唯一

最新推薦

猜你喜歡

熱門推薦

相關資訊