當前通訊!數據丟失不用怕,火山引擎DataLeap 提供排查解決方案
當一家公司的日均處理的數據流量在PB級別時,巨大的任務量和數據量會對消息隊列(MQ)dump的穩定性和準確性帶來極大的挑戰。
針對這一問題,火山引擎數智平臺推出的大數據研發治理套件DataLeap,可以為企業提供完整解決方案,幫助解決MQ dump在極端場景中遇到的數據丟失問題。
【資料圖】
例如,當HDFS(一種分布式文件系統)集群某個元數據節點由于硬件故障而宕機。那么在該元數據節點終止半小時后,運維工程師雖然可以通過手動運維操作將 HDFS 切到主 backup 節點,使得HDFS 恢復服務。但故障恢復后, MQ dump 在故障期間可能有數據丟失,產出的數據與 MQ 中的數據不一致的情況。
此時,技術人員可以在收到數據不一致的反饋后,立即借助火山引擎DataLeap進行故障排查。目前,火山引擎DataLeap基于開源Flink,已經實現了流批一體的數據集成服務。通過Flink Checkpoint的功能,Flink 在數據流中注入 barriers 將數據拆分為一段一段的數據,在不終止數據流處理的前提下,讓每個節點可以獨立創建 Checkpoint 保存自己的快照。
圖:Flink Checkpoint 基于 Chandy-Lamport 算法保障數據的一致性
據介紹,每個 barrier 都有一個快照 ID ,在該快照 ID 之前的數據都會進入這個快照,而之后的數據會進入下一個快照。在排查過程中,火山引擎DataLeap基于對Flink 日志查看以及HDFS 元數據查看,可以率先定位癥結所在:刪除操作的重復執行造成數據丟失。進一步解釋就是,在故障期間,寫入數據前的刪除操作在 HDFS NameNode 上重復執行,將寫入的數據刪除造成最終數據的丟失。
圖:使用文件State 前后處理流程對比
溯源后,用戶可以通過火山引擎DataLeap選擇使用文件State(當前的 Checkpoint id 和 task id)解決該問題。據悉,使用文件 State 后,企業在 Notify 階段與 HDFS 交互的 metrics(打點監控系統)的平均處理時間減少了一半。
目前,企業可以通過火山引擎DataLeap體驗到上述Flink Checkpoint實踐與優化方案,提升數據價值交付中的效率和質量。(作者:韓江)
關鍵詞:
2023-03-30 17:48:31
2023-03-30 17:45:57
2023-03-30 17:35:21
2023-03-30 17:18:15
2023-03-30 16:57:04
2023-03-30 16:55:37
2023-03-30 16:53:54
2023-03-30 16:53:33
2023-03-30 16:51:16
2023-03-30 16:46:14
2023-03-30 16:44:59
2023-03-30 16:39:47
2023-03-30 16:19:02
2023-03-30 16:18:58
2023-03-30 16:18:33
2023-03-30 16:17:08
2023-03-30 16:16:31
2023-03-30 16:16:02
2023-03-30 16:16:01
2023-03-30 16:15:56
2023-03-30 16:14:35
2023-03-30 16:14:17
2023-03-30 16:14:04
2023-03-30 16:12:31
2023-03-30 16:12:14
2023-03-30 16:08:56
2023-03-30 16:07:24
2023-03-30 16:07:13
2023-03-30 16:06:46
2023-03-30 16:05:50
2023-03-30 16:05:43
2023-03-30 16:05:25
2023-03-30 16:04:20
2023-03-30 16:04:17
2023-03-30 16:02:56
2023-03-30 16:02:55
2023-03-30 16:01:00
2023-03-30 16:00:31
2023-03-30 16:00:00
2023-03-30 15:59:32
2023-03-30 15:58:46
2023-03-30 15:58:08
2023-03-30 15:56:51
2023-03-30 15:56:22
2023-03-30 15:52:34
2023-03-30 15:51:32
2023-03-30 15:49:56
2023-03-30 15:49:46
2023-03-30 15:48:57
2023-03-30 15:48:14
2023-03-30 15:47:38
2023-03-30 15:47:28
2023-03-30 15:46:56
2023-03-30 15:46:18
2023-03-30 15:46:08
2023-03-30 15:45:43
2023-03-30 15:44:57
2023-03-30 15:44:51
2023-03-30 15:43:57
2023-03-30 15:43:34
2023-03-30 15:42:41
2023-03-30 15:42:18
2023-03-30 15:38:14
2023-03-30 15:37:15
2023-03-30 15:36:20
2023-03-30 15:35:42
2023-03-30 15:35:29
2023-03-30 15:33:58
2023-03-30 15:33:41
2023-03-30 15:33:11
2023-03-30 15:29:00
2023-03-30 15:28:07
2023-03-30 15:26:22
2023-03-30 15:18:34
2023-03-30 14:59:48
2023-03-30 14:50:25
2023-03-30 14:42:58
2023-03-30 14:40:20
2023-03-30 14:36:57
2023-03-30 14:35:00
2023-03-30 14:29:45
2023-03-30 13:57:02
2023-03-30 13:51:54
2023-03-30 13:46:57
2023-03-30 13:13:50
2023-03-30 13:00:07
2023-03-30 12:55:48
2023-03-30 12:53:44
2023-03-30 12:51:12
2023-03-30 12:43:25
2023-03-30 12:38:45
2023-03-30 12:34:57
2023-03-30 12:33:58
2023-03-30 12:19:02
2023-03-30 11:55:05
2023-03-30 11:54:38
2023-03-30 11:46:23
2023-03-30 11:37:51
2023-03-30 11:36:53
2023-03-30 11:25:42
相關新聞