視訊!火山引擎DataLeap:從抖音電商來(lái)看,“數(shù)據(jù)質(zhì)量治理”怎么做?
經(jīng)過(guò)近年發(fā)展,抖音電商的體量和規(guī)模已經(jīng)相當(dāng)可觀。
(資料圖)
基于數(shù)據(jù)驅(qū)動(dòng)思路,抖音電商在數(shù)倉(cāng)建設(shè)、數(shù)據(jù)管理等層面實(shí)現(xiàn)準(zhǔn)確分析和測(cè)量數(shù)據(jù),做出以數(shù)據(jù)為依據(jù)的決策,從而推動(dòng)業(yè)務(wù)快速發(fā)展。本文對(duì)話抖音電商團(tuán)隊(duì),為你揭秘龐大數(shù)據(jù)體量下的數(shù)據(jù)質(zhì)量管理最佳實(shí)踐。
數(shù)據(jù)有效性、及時(shí)性、準(zhǔn)確性關(guān)系到C端用戶體驗(yàn)和B端商家決策,在數(shù)據(jù)體量龐大的情況下,難以避免數(shù)據(jù)缺失、緯度錯(cuò)誤、產(chǎn)出延時(shí)等問(wèn)題,這與數(shù)據(jù)質(zhì)量管理息息相關(guān)。據(jù)抖音電商數(shù)據(jù)團(tuán)隊(duì)介紹,之前數(shù)據(jù)質(zhì)量問(wèn)題集中體現(xiàn)在:歷史數(shù)據(jù)繁多,導(dǎo)致無(wú)法準(zhǔn)確定位異常數(shù)據(jù);缺乏合理的監(jiān)控規(guī)則;補(bǔ)齊表監(jiān)控規(guī)則時(shí)間、人力成本高等。
為了高效、便捷實(shí)現(xiàn)數(shù)據(jù)質(zhì)量監(jiān)控,抖音電商數(shù)據(jù)團(tuán)隊(duì)引入火山引擎DataLeap數(shù)據(jù)質(zhì)量平臺(tái),通過(guò)數(shù)據(jù)波動(dòng)監(jiān)控、異常報(bào)警、數(shù)據(jù)內(nèi)容探查及差異對(duì)比工具等功能,保證數(shù)據(jù)在生產(chǎn)及使用流程中的可靠性和合理性,避免因?yàn)閿?shù)據(jù)質(zhì)量導(dǎo)致的數(shù)據(jù)失信、決策失誤等事故。
抖音電商數(shù)據(jù)團(tuán)隊(duì)主要介紹了數(shù)據(jù)質(zhì)量監(jiān)控、數(shù)據(jù)異常治理兩個(gè)場(chǎng)景。
在數(shù)據(jù)質(zhì)量監(jiān)控上,抖音電商通過(guò)火山引擎DataLeap對(duì)抖音APP存量數(shù)據(jù)質(zhì)量配置監(jiān)控,并沉淀合理的監(jiān)控規(guī)則,方便監(jiān)控任務(wù)的配置情況及把關(guān)數(shù)據(jù)質(zhì)量。
火山引擎DataLeap數(shù)據(jù)質(zhì)量平臺(tái)
首先,在監(jiān)控范圍上,通過(guò)數(shù)據(jù)質(zhì)量平臺(tái)實(shí)現(xiàn)ToB、ToC 任務(wù)覆蓋全量監(jiān)控,及時(shí)規(guī)避數(shù)據(jù)質(zhì)量風(fēng)險(xiǎn);其次,在推進(jìn)機(jī)制上,由于 ToC鏈路上游多且監(jiān)控任務(wù)帶來(lái)過(guò)多計(jì)算資源消耗,抖音電商團(tuán)隊(duì)優(yōu)先從核心數(shù)據(jù)鏈路開展數(shù)據(jù)質(zhì)量監(jiān)控;最后,在落地執(zhí)行上,通過(guò)確立目標(biāo)、Owner和進(jìn)度,完成表行數(shù)、重復(fù)值、空值、表字段、異常值的梳理。
最終實(shí)現(xiàn)抖音電商數(shù)據(jù)質(zhì)量管理全鏈路標(biāo)準(zhǔn)化,即由牽頭人發(fā)起配置事項(xiàng),通過(guò)火山引擎DataLeap數(shù)據(jù)質(zhì)量平臺(tái)完成監(jiān)控配置,并跟蹤完成情況,最后相關(guān)數(shù)據(jù)被推送至看板,方便相關(guān)數(shù)據(jù)研發(fā)人員查看和復(fù)盤。
對(duì)于數(shù)據(jù)異常情況,抖音電商團(tuán)隊(duì)主要通過(guò)火山引擎DataLeap表探查的能力來(lái)解決。
數(shù)倉(cāng)中較多數(shù)據(jù)表字段存在異常值、空值,在使用前無(wú)法感知,導(dǎo)致在數(shù)據(jù)使用時(shí)才發(fā)現(xiàn)質(zhì)量問(wèn)題,再由業(yè)務(wù)方反饋,處理效率較低。火山引擎DataLeap具備制定統(tǒng)一的監(jiān)控規(guī)范與開發(fā)規(guī)范能力,支持檢測(cè)歷史數(shù)據(jù)異常以及空值等情況,并默認(rèn)處理、標(biāo)注數(shù)據(jù)屬性,確保無(wú)數(shù)據(jù)質(zhì)量問(wèn)題,才推進(jìn)表上線流程。
除數(shù)據(jù)質(zhì)量治理外,火山引擎DataLeap還具備數(shù)據(jù)集成、開發(fā)、運(yùn)維、資產(chǎn)、安全等全套數(shù)據(jù)中臺(tái)建設(shè)能力,有效提升數(shù)據(jù)研發(fā)效率、降低管理成本,目前已經(jīng)應(yīng)用于泛互聯(lián)網(wǎng)、制造、新零售、汽車等領(lǐng)域。(作者:康峰)
關(guān)鍵詞:
2023-03-23 12:49:00
2023-03-23 12:42:32
2023-03-23 12:41:31
2023-03-23 12:33:57
2023-03-23 12:09:13
2023-03-23 11:47:43
2023-03-23 11:42:54
2023-03-23 11:41:31
2023-03-23 11:32:18
2023-03-23 10:55:57
2023-03-23 10:31:38
2023-03-23 09:42:49
2023-03-23 09:42:31
2023-03-23 09:39:06
2023-03-23 09:38:03
2023-03-23 09:36:35
2023-03-23 09:36:07
2023-03-23 09:35:48
2023-03-23 09:34:01
2023-03-23 09:29:33
2023-03-23 09:29:13
2023-03-23 09:26:51
2023-03-23 09:26:06
2023-03-23 09:25:46
2023-03-23 09:25:25
2023-03-23 09:25:20
2023-03-23 09:25:15
2023-03-23 09:24:17
2023-03-23 09:24:03
2023-03-23 09:23:43
2023-03-23 09:23:08
2023-03-23 09:22:40
2023-03-23 09:21:48
2023-03-23 09:21:34
2023-03-23 09:20:57
2023-03-23 09:20:52
2023-03-23 09:17:40
2023-03-23 09:16:55
2023-03-23 09:16:33
2023-03-23 09:15:12
2023-03-23 09:14:39
2023-03-23 09:14:28
2023-03-23 09:14:24
2023-03-23 08:58:55
2023-03-23 07:57:33
2023-03-23 07:50:34
2023-03-23 07:43:23
2023-03-23 07:36:19
2023-03-23 07:35:55
2023-03-23 06:56:57
2023-03-23 06:52:55
2023-03-23 06:37:10
2023-03-23 02:58:25
2023-03-22 22:53:28
2023-03-22 20:58:02
2023-03-22 20:51:56
2023-03-22 20:41:30
2023-03-22 20:38:42
2023-03-22 20:37:21
2023-03-22 20:34:59
2023-03-22 20:31:41
2023-03-22 19:54:02
2023-03-22 19:47:44
2023-03-22 19:45:13
2023-03-22 19:44:38
2023-03-22 19:44:12
2023-03-22 19:40:20
2023-03-22 19:39:43
2023-03-22 19:37:45
2023-03-22 19:34:38
2023-03-22 18:58:04
2023-03-22 18:58:02
2023-03-22 18:48:15
2023-03-22 18:46:51
2023-03-22 17:07:54
2023-03-22 17:06:45
2023-03-22 16:57:56
2023-03-22 16:54:11
2023-03-22 16:50:45
2023-03-22 16:40:59
2023-03-22 16:40:20
2023-03-22 16:40:12
2023-03-22 16:39:49
2023-03-22 16:38:48
2023-03-22 16:38:23
2023-03-22 16:37:28
2023-03-22 16:37:19
2023-03-22 16:37:00
2023-03-22 16:32:26
2023-03-22 16:28:06
2023-03-22 16:24:45
2023-03-22 16:24:04
2023-03-22 16:23:26
2023-03-22 16:22:28
2023-03-22 16:20:59
2023-03-22 16:20:44
2023-03-22 16:20:02
2023-03-22 16:19:53
相關(guān)新聞