在全面到來的AI浪潮中 重新讀懂?dāng)?shù)據(jù)價值-速讀
在智能時代,數(shù)據(jù)的價值變得前所未有的重要。以ChatGPT為代表的生成式AI讓人們看到了AI技術(shù)的顛覆性,一時間,大模型、加速計算、數(shù)據(jù)要素、數(shù)據(jù)隱私等概念風(fēng)起云涌,此時,對數(shù)據(jù)進行有效的采集、處理、分析、治理,成為企業(yè)實現(xiàn)商業(yè)成功的關(guān)鍵。每一年,Gartner都會對市場熱門的技術(shù)趨勢進行深入研究,從中找到值得關(guān)注和投資的方向,為企業(yè)主提供發(fā)展參考。5月18日,Gartner發(fā)布了2023年十大數(shù)據(jù)和分析(D&A)趨勢,包括數(shù)據(jù)即業(yè)務(wù)、數(shù)據(jù)價值規(guī)模化、以人為中心建立數(shù)據(jù)分析平臺三個主題。
2023年十大數(shù)據(jù)和分析趨勢
Gartner研究總監(jiān)孫鑫表示:“我們發(fā)現(xiàn),如果只是把數(shù)據(jù)分析能力作為一種IT能力做運維,往往難以發(fā)揮讓業(yè)務(wù)比較大的價值。但是,如果把數(shù)據(jù)能力變成一種業(yè)務(wù)能力進行拓展,就會衍生出一些獨立的、更有意思的商業(yè)模式,因此,‘?dāng)?shù)據(jù)即業(yè)務(wù)’已經(jīng)發(fā)展為一種全球的趨勢,吸引了很多中國企業(yè)關(guān)注。”例如,有時數(shù)據(jù)分析會作為一種產(chǎn)品進行銷售,更多的業(yè)務(wù)人員也會承擔(dān)一些數(shù)據(jù)分析或數(shù)據(jù)管理的職責(zé)。
(資料圖片)
孫鑫認(rèn)為,企業(yè)要讓數(shù)據(jù)分析與業(yè)務(wù)價值產(chǎn)生更清晰的聯(lián)系,以此來進行更有針對性的投入,避免重復(fù)勞動。對此,Gartner推薦企業(yè)使用“業(yè)務(wù)價值流工具”進行數(shù)據(jù)的分析和管理,可以自上而下的幫助企業(yè)了解重要的業(yè)務(wù)節(jié)點和流程,輔助管理者做出決策,實現(xiàn)應(yīng)有的價值。隨著更多的創(chuàng)新發(fā)生在云端,圍繞AI和數(shù)據(jù)分析的擴展性、兼容性、持續(xù)性和成本被頻繁提及,由此也引發(fā)了有關(guān)數(shù)據(jù)編織和數(shù)據(jù)網(wǎng)格的熱議,企業(yè)希望可以提升數(shù)據(jù)的業(yè)務(wù)場景化能力。
Gartner對數(shù)據(jù)網(wǎng)格(Data Mesh)的定義是以業(yè)務(wù)主導(dǎo)的方式管理數(shù)據(jù),用于定義、交付、維護、管理數(shù)據(jù)產(chǎn)品,讓數(shù)據(jù)發(fā)揮更大的價值。如果想實施好數(shù)據(jù)網(wǎng)格,需要在業(yè)務(wù)端配備數(shù)據(jù)產(chǎn)品經(jīng)理的崗位,輔助做一些自服務(wù)分析,根據(jù)不同層級設(shè)置相互關(guān)聯(lián)的治理模式。數(shù)據(jù)編織(Data Fabric)可以視為較為新型的數(shù)據(jù)管理設(shè)計模式,能夠獲取到靈活可復(fù)用、且被AI增強的數(shù)據(jù)集成管道,其中,會涉及知識圖譜等技術(shù),去更好地分析和理解元數(shù)據(jù),提升基于用戶的數(shù)據(jù)服務(wù)體驗。
基于用戶數(shù)據(jù)消費行為的分析,并在此基礎(chǔ)之上進行推薦,是數(shù)據(jù)編織要解決的主要問題,讓相關(guān)的數(shù)據(jù)找到相應(yīng)的人。根據(jù)企業(yè)所處的數(shù)字化階段和能力不同,Gartner提供了兩種數(shù)據(jù)編織的設(shè)計路徑——最小可用數(shù)據(jù)編制的設(shè)計和完整版的數(shù)據(jù)編制設(shè)計,企業(yè)可以據(jù)此進行數(shù)據(jù)優(yōu)化和調(diào)整。招商銀行建立了新一代數(shù)據(jù)目錄,希望進一步優(yōu)化數(shù)據(jù)分類體系,在該目錄中進行的搜索、檢查、請求等操作會被記錄,這些操作型的元數(shù)據(jù)會被反饋到數(shù)據(jù)分類體系中,結(jié)合機器學(xué)習(xí)等技術(shù)進行自主演進,從多維度了解不同用戶的實際需求。數(shù)據(jù)編織可以幫助企業(yè)用戶實現(xiàn)快速的自服務(wù),幫助數(shù)據(jù)管理團隊實現(xiàn)更高效的數(shù)據(jù)生產(chǎn)力,大幅縮短數(shù)據(jù)需求響應(yīng)時間,幫助企業(yè)主體加速投資回報。
借助高度可組合的數(shù)據(jù)分析生態(tài),數(shù)據(jù)分析能力可以和微服務(wù)等技術(shù)整合,以模塊化的方式快速落地到業(yè)務(wù)場景中。企業(yè)對于分析平臺的可組合性較為關(guān)注,不同崗位的人員會在不用階段根據(jù)不同需求選擇匹配的技術(shù)路徑,包括數(shù)據(jù)可視化、自動數(shù)據(jù)洞察、數(shù)據(jù)故事、數(shù)據(jù)敘事、自然語言驅(qū)動的分析、數(shù)據(jù)準(zhǔn)備和報表會滿足不同的業(yè)務(wù)需求,由企業(yè)按需來進行定制化的組合,而底層則是通過合作能力、指標(biāo)平臺/中臺、治理能力、數(shù)據(jù)科學(xué)整合能力、數(shù)據(jù)目錄能力,以及對數(shù)據(jù)源的連接來提供基礎(chǔ)支撐。
在孫鑫看來,使用商業(yè)智能和數(shù)據(jù)科學(xué)平臺的用戶愈發(fā)多元化,既有業(yè)務(wù)分析師,也有數(shù)據(jù)分析的開發(fā)者、數(shù)據(jù)科學(xué)家,還有被增強過的數(shù)據(jù)消費者,“面對更廣闊的用戶,也要有更靈活的使用數(shù)據(jù)分析產(chǎn)品的架構(gòu),去建立更靈活的分析體驗,這也是今年我們在‘魔力四象限’評估時比較重要的點。”除此之外,還會有一些新的產(chǎn)品形態(tài)來輔助建設(shè)業(yè)務(wù)指標(biāo)。例如,指標(biāo)平臺/指標(biāo)中臺可以利用虛擬層管理不同的數(shù)據(jù)源,分析目錄可以管理不同廠商的報表,帶來統(tǒng)一的使用體驗,這些目錄可以被進行評級和打分,便于各方選擇使用,同時,很多企業(yè)也在對外輸出數(shù)據(jù)分析能力,使得數(shù)據(jù)的生產(chǎn)者和消費者相互轉(zhuǎn)換,形成了對數(shù)據(jù)分析能力的發(fā)布-組合-再創(chuàng)新的生態(tài)循環(huán)。
分析目錄
如今,AI已經(jīng)是擺在企業(yè)面前的一道必答題。Gartner將Emergent AI視為今年的科技趨勢之一,AI技術(shù)已經(jīng)能夠以更少量的數(shù)量達到更高的復(fù)雜度,預(yù)計到2026年,通過生成式AI驅(qū)動的數(shù)據(jù)分析能力,將吸引20%的大型企業(yè)數(shù)據(jù)和分析的支出,以支持這些企業(yè)對于自動化閉環(huán)數(shù)據(jù)分析結(jié)果的需求。此時,企業(yè)要學(xué)會主動迎接AI的浪潮,可以借助NLP等技術(shù)實現(xiàn)“決策智能”,完成從數(shù)據(jù)分析到業(yè)務(wù)行為的閉環(huán)。
孫鑫認(rèn)為,生成式AI實現(xiàn)了嵌入式的增強體驗,可以幫助用戶完成更高級的數(shù)據(jù)分析,大幅降低了使用門檻。Gartner建議企業(yè)可以學(xué)習(xí)掌握提示工程(Prompt Engineering),通過全新的交互界面進行驗證,從輸入的角度核實、輸出的角度理解并拓展大語言模型,輔以專門的工程師開發(fā)和優(yōu)化由AI生成的文本。在招商銀行內(nèi)部,已經(jīng)在使用聊天軟件進行數(shù)據(jù)分析的相關(guān)討論,提升數(shù)據(jù)使用效率。未來,數(shù)據(jù)科學(xué)家會更加關(guān)注大語言模型的調(diào)參,使其能夠運用到千差萬別的業(yè)務(wù)場景中。
AI戰(zhàn)略的實施往往“事與愿違”
盡管AI可以為企業(yè)帶來更低的成本和更好的決策,但是像生成式AI這樣的新技術(shù)也會帶來不少風(fēng)險,例如所學(xué)習(xí)的數(shù)據(jù)存在偏見和錯誤,企業(yè)既要保證數(shù)據(jù)來源的多樣性,也要避免遭遇一些瑕疵,同時,如果錯誤的信息沒有經(jīng)過適當(dāng)?shù)谋O(jiān)管和審查,也會造成額外的損失。企業(yè)不能過度依賴AI提供的結(jié)果,要建立一套責(zé)任機制進行數(shù)據(jù)治理,確保生成式AI的使用是可靠的,遵守當(dāng)?shù)氐碾[私和安全法規(guī)。錯誤的信息、認(rèn)知偏見,以及數(shù)據(jù)版權(quán)等問題,使得人工審查有著充分的必要性。
談及生成式AI的未來走向,孫鑫給出了進一步解讀,涉及架構(gòu)、模型和運營。首先,英偉達在加速計算領(lǐng)域為AI算力奠定了重要基礎(chǔ),不過考慮到產(chǎn)品供應(yīng)等問題,AWS、GCP等云廠商同樣具有很大的發(fā)展空間,一些基礎(chǔ)設(shè)施供應(yīng)商也會集成預(yù)訓(xùn)練模型來提升硬件的價值。此外,大模型和“Fine-Tuning”模型會越來越多,F(xiàn)ine-Tuning模型的匹配度更高,使用相對較小、貼近業(yè)務(wù)場景的數(shù)據(jù)集即可滿足要求,成本會隨之降低,開源技術(shù)也會發(fā)揮更多的作用。同時,基于大模型構(gòu)建的具有行業(yè)屬性的特定模型將愈發(fā)普及。對于技術(shù)供應(yīng)商來說,AI的安全治理、性價比等能力將是差異化或是護城河的體現(xiàn)。運營方面,“提示工程”的市集可以從多方面完善大模型的體驗,“矢量數(shù)據(jù)庫”則能夠讓生成式AI更了解企業(yè)所需,再加上Fine-Tuning模型和API管理工具,就能讓企業(yè)在使用AI技術(shù)時更加得心應(yīng)手。
“最后,我還是要強調(diào)一下,對于‘負責(zé)任人工智能工具’的投入是非常重要的。在中國,可能這一塊相對來講還比較空白一些,我們看到這種負責(zé)任的人工智能工具將在運營側(cè)發(fā)揮關(guān)鍵的作用,甚至可以提供一些‘紅隊測試’、可解釋性或者內(nèi)容的管控,以減少我們基于人工智能用例的有害影響。“孫鑫說。
關(guān)鍵詞:
2023-06-06 11:38:09
2023-06-06 11:34:41
2023-06-06 11:01:17
2023-06-06 10:52:59
2023-06-06 10:50:27
2023-06-06 10:46:41
2023-06-06 10:46:17
2023-06-06 10:39:11
2023-06-06 10:37:22
2023-06-06 10:33:12
2023-06-06 09:53:50
2023-06-06 09:53:12
2023-06-06 09:48:05
2023-06-06 09:46:52
2023-06-06 09:43:52
2023-06-06 09:42:38
2023-06-06 09:37:47
2023-06-06 09:37:15
2023-06-06 09:06:46
2023-06-06 08:57:29
2023-06-06 08:56:33
2023-06-06 08:53:48
2023-06-06 08:53:43
2023-06-06 08:53:42
2023-06-06 08:52:10
2023-06-06 08:48:37
2023-06-06 08:43:02
2023-06-06 08:39:10
2023-06-06 08:37:06
2023-06-06 08:20:48
2023-06-06 08:05:20
2023-06-06 07:56:51
2023-06-06 07:56:39
2023-06-06 07:44:45
2023-06-06 07:13:03
2023-06-06 06:50:56
2023-06-06 06:48:55
2023-06-06 06:45:55
2023-06-06 06:44:47
2023-06-06 06:40:13
2023-06-06 06:07:13
2023-06-06 05:51:58
2023-06-06 05:49:16
2023-06-06 05:47:08
2023-06-06 05:41:17
2023-06-06 05:34:32
2023-06-06 05:22:07
2023-06-06 04:18:37
2023-06-06 03:05:16
2023-06-06 02:14:34
2023-06-06 01:32:28
2023-06-06 00:50:56
2023-06-05 23:30:55
2023-06-05 22:46:04
2023-06-05 22:27:03
2023-06-05 20:45:33
2023-06-05 20:43:24
2023-06-05 19:53:28
2023-06-05 19:08:08
2023-06-05 19:06:41
2023-06-05 18:46:50
2023-06-05 18:41:53
2023-06-05 18:35:55
2023-06-05 18:35:15
2023-06-05 18:34:13
2023-06-05 18:26:25
2023-06-05 17:53:29
2023-06-05 17:50:39
2023-06-05 17:45:07
2023-06-05 17:44:41
2023-06-05 17:41:15
2023-06-05 17:37:52
2023-06-05 17:37:43
2023-06-05 17:35:59
2023-06-05 17:21:20
2023-06-05 16:40:04
2023-06-05 16:38:17
2023-06-05 16:16:54
2023-06-05 15:45:32
2023-06-05 15:43:31
2023-06-05 15:19:33
2023-06-05 15:00:47
2023-06-05 14:57:03
2023-06-05 14:49:28
2023-06-05 14:47:21
2023-06-05 14:42:21
2023-06-05 14:41:50
2023-06-05 14:27:59
2023-06-05 14:22:25
2023-06-05 13:55:22
2023-06-05 13:51:31
2023-06-05 13:49:45
2023-06-05 13:47:38
2023-06-05 13:46:01
2023-06-05 13:42:38
2023-06-05 12:56:33
2023-06-05 12:53:45
2023-06-05 12:53:43
2023-06-05 12:46:59
2023-06-05 12:46:01
相關(guān)新聞