12 月 18 日,在 2024 冬季火山引擎 FORCE 原動(dòng)力大會(huì)上,火山引擎數(shù)智平臺(tái)(VeDI)正式升級(jí)發(fā)布數(shù)據(jù)飛輪 2.0 模式。
延續(xù)去年 4 月發(fā)布的數(shù)據(jù)飛輪“以數(shù)據(jù)消費(fèi)促資產(chǎn)建設(shè),以數(shù)據(jù)消費(fèi)助業(yè)務(wù)發(fā)展”的核心內(nèi)涵,此次升級(jí)后,數(shù)據(jù)飛輪 2.0 將 AI 視作數(shù)智化的核心競(jìng)爭(zhēng)力,借助 AI 技術(shù)推動(dòng)企業(yè)更普惠的數(shù)據(jù)消費(fèi)。
火山引擎數(shù)據(jù)飛輪2.0模式圖
本次模式升級(jí)包括了:智能數(shù)據(jù)洞察DataWind ChatBI智能體、增長(zhǎng)分析DataFinder智能分析助手、A/B測(cè)試DataTester智能實(shí)驗(yàn)助手、客戶數(shù)據(jù)平臺(tái)VeCDP智能營(yíng)銷助手、增長(zhǎng)營(yíng)銷平臺(tái)GMP創(chuàng)意助手、大數(shù)據(jù)研發(fā)治理套件DataLeap運(yùn)維助手和E-MapReduce全模態(tài)數(shù)據(jù)處理引擎等,全系列火山引擎數(shù)智平臺(tái)產(chǎn)品AI能力的發(fā)布。
與此同時(shí),兩大數(shù)據(jù)飛輪2.0核心解決方案首次公開(kāi)亮相。
其一為 “DataFabric 驅(qū)動(dòng)下的 ChatBI 智能體解決方案”,亮點(diǎn)在于賦予業(yè)務(wù)自定義的數(shù)據(jù)智能體能力,有效降低業(yè)務(wù)調(diào)用與理解數(shù)據(jù)的難度;
其二是 “多模態(tài)數(shù)據(jù)湖解決方案”,該方案專注于處理全模態(tài)數(shù)據(jù),擴(kuò)容企業(yè)潛在數(shù)字資產(chǎn)規(guī)模。
至此,數(shù)據(jù)飛輪 2.0 實(shí)現(xiàn)數(shù)據(jù)生產(chǎn)、管理與應(yīng)用各環(huán)節(jié)全方位 AI 能力深度融合,推動(dòng)企業(yè)數(shù)據(jù)消費(fèi)便捷化、資產(chǎn)建設(shè)低門檻化,加速企業(yè)數(shù)據(jù)價(jià)值實(shí)現(xiàn)進(jìn)程。
數(shù)據(jù)消費(fèi)的新體驗(yàn):ChatBI智能體
在2.0升級(jí)前,火山引擎數(shù)據(jù)飛輪已在近兩年的時(shí)間里,幫助眾多企業(yè)通過(guò)數(shù)據(jù)消費(fèi)挖掘數(shù)據(jù)價(jià)值,助力業(yè)務(wù)增長(zhǎng):
領(lǐng)克汽車通過(guò)數(shù)據(jù)飛輪構(gòu)建用戶數(shù)據(jù)平臺(tái),精準(zhǔn)洞察消費(fèi)者需求,實(shí)現(xiàn)差異化營(yíng)銷,運(yùn)營(yíng)成本降低70%;德邦快遞通過(guò)數(shù)據(jù)飛輪解決數(shù)據(jù)"黑盒"問(wèn)題,用戶識(shí)別和營(yíng)銷效率顯著提升,月?tīng)I(yíng)銷活動(dòng)峰值可達(dá)100場(chǎng),效率提高5倍;瑪麗黛佳兩年內(nèi)完成數(shù)智化轉(zhuǎn)型,搭建的“數(shù)據(jù)找人”模式,讓數(shù)據(jù)自動(dòng)生成并流向業(yè)務(wù)負(fù)責(zé)人,實(shí)現(xiàn)實(shí)時(shí)決策……
數(shù)據(jù)飛輪模式并非靜態(tài)技術(shù)框架,而是有生命力的生態(tài)系統(tǒng),其生命力源于數(shù)據(jù)消費(fèi)。而,企業(yè)數(shù)據(jù)消費(fèi)的廣度與深度,則直接決定企業(yè)數(shù)智化的程度。
上述企業(yè)在數(shù)據(jù)飛輪模式助力下,內(nèi)部數(shù)據(jù)消費(fèi)水平顯著提升。
然而,在與更廣泛的客戶合作中,火山引擎數(shù)智平臺(tái)察覺(jué)到一個(gè)關(guān)鍵難點(diǎn):企業(yè)內(nèi)部各崗位角色間的的數(shù)字化水平存在較大差異,數(shù)據(jù)分析與應(yīng)用產(chǎn)品的使用往往局限在少部分專業(yè)角色中,這在一定程度上制約了企業(yè)級(jí)數(shù)據(jù)消費(fèi)活力的釋放。
這也引發(fā)了火山引擎數(shù)智平臺(tái)的思考:如何確保企業(yè)各業(yè)務(wù)角色以及每一層級(jí)組織,都能便捷、高效地獲取和使用數(shù)據(jù)?
在AI涌現(xiàn)的趨勢(shì)下,他們摸索著找到了新解法——構(gòu)建業(yè)務(wù)自己的數(shù)據(jù)智能體,在經(jīng)由內(nèi)部多個(gè)產(chǎn)品實(shí)踐后,最終發(fā)布了“Data Fabric驅(qū)動(dòng)下的ChatBI智能體”解決方案。
火山引擎Data Fabric驅(qū)動(dòng)下的ChatBI智能體解決方案
事實(shí)上,在去年,圍繞大模型能力,火山引擎數(shù)智平臺(tái)已經(jīng)推出了智能數(shù)據(jù)洞察DataWind分析助手等功能。企業(yè)員工可以通過(guò)自然語(yǔ)言輸入,查收到對(duì)應(yīng)的可視化圖表并實(shí)現(xiàn)下鉆分析,實(shí)現(xiàn)數(shù)據(jù)分析效率的提升。
但在企業(yè)具體的實(shí)踐中,重新學(xué)習(xí)輸入prompt(提示),并不能為專業(yè)的分析師“減負(fù)”;而對(duì)BI工具不精通的員工,在使用這類能力時(shí),又會(huì)遇到如何選擇數(shù)據(jù)集等“專業(yè)”難題。
同時(shí),籠統(tǒng)的分析助手無(wú)法理解不同行業(yè)與業(yè)務(wù)中的“黑話”,不理解使用者的真實(shí)意圖,從而大幅降低分析準(zhǔn)確性。
“Data Fabric驅(qū)動(dòng)下的ChatBI智能體”解決方案,正在試圖解決上述這些問(wèn)題:通過(guò)構(gòu)建完整的智能數(shù)據(jù)服務(wù)體系,打破數(shù)據(jù)“專業(yè)”壁壘,幫助企業(yè)內(nèi)每個(gè)業(yè)務(wù)都能定制專屬智能體,持續(xù)降低數(shù)據(jù)使用門檻,提升大模型能力下的數(shù)據(jù)反饋效率和準(zhǔn)確率。
在這套解決方案中, Data Fabric通過(guò)語(yǔ)義層和數(shù)據(jù)模型的整合,重構(gòu)了數(shù)據(jù)生產(chǎn)關(guān)系,在顯著降低數(shù)據(jù)存儲(chǔ)和計(jì)算成本的基礎(chǔ)上,讓數(shù)據(jù)服務(wù)變得更加敏捷;而ChatBI智能體則能更貼合業(yè)務(wù)個(gè)性化需求,通過(guò)交互理解、數(shù)據(jù)訪問(wèn)、分析推理和結(jié)果生成四大模塊,極大提升業(yè)務(wù)員工的數(shù)據(jù)生產(chǎn)力,讓數(shù)據(jù)消費(fèi)變得更加簡(jiǎn)單直接。
數(shù)據(jù)顯示,在字節(jié)跳動(dòng)內(nèi)部,這套方案已覆蓋超200個(gè)分析場(chǎng)景,每天處理10萬(wàn)余次分析請(qǐng)求,平均分析時(shí)間降低了 80%,數(shù)據(jù)開(kāi)發(fā)和運(yùn)維成本也大幅下降。
數(shù)據(jù)資產(chǎn)的新生力:多模態(tài)數(shù)據(jù)湖
如果說(shuō)“Data Fabric驅(qū)動(dòng)下的ChatBI智能體”解決方案,是火山引擎數(shù)智平臺(tái)持續(xù)在服務(wù)企業(yè)過(guò)程中,不斷洞察新的業(yè)務(wù)需求,實(shí)現(xiàn)的“數(shù)據(jù)+AI”能力沉淀和升級(jí)。那么“多模態(tài)數(shù)據(jù)湖”解決方案的誕生,則更像他們洞見(jiàn)當(dāng)下企業(yè)即將遇到的問(wèn)題時(shí),所作出的敏捷反應(yīng)。
LLM的大熱,讓企業(yè)對(duì)于AI賦能的數(shù)字化滿懷憧憬,眾多企業(yè)投身大模型于業(yè)務(wù)場(chǎng)景的落地實(shí)踐。然而技術(shù)魅力與現(xiàn)實(shí)困境共生,大模型催生的圖像、視頻、音頻等海量多模態(tài)數(shù)據(jù)正在挑戰(zhàn)傳統(tǒng)湖倉(cāng)技術(shù)。
傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)處理,無(wú)法滿足當(dāng)下對(duì)多模態(tài)數(shù)據(jù)的存儲(chǔ)、計(jì)算,也無(wú)法挖掘出這部分?jǐn)?shù)據(jù)背后的資產(chǎn)價(jià)值。
在深度參與大模型產(chǎn)業(yè)的同時(shí),火山引擎數(shù)智平臺(tái)亦敏銳感知到了非結(jié)構(gòu)數(shù)據(jù)變現(xiàn)成企業(yè)核心數(shù)據(jù)資產(chǎn)的意義。
多模態(tài)數(shù)據(jù)湖解決方案,應(yīng)運(yùn)而生。
火山引擎多模態(tài)數(shù)據(jù)湖解決方案
火山引擎數(shù)據(jù)飛輪2.0所推出的多模態(tài)數(shù)據(jù)湖解決方案,可實(shí)現(xiàn)海量結(jié)構(gòu)化、半結(jié)構(gòu)化及非結(jié)構(gòu)化數(shù)據(jù)的統(tǒng)一精細(xì)化管理,全方位兼容各類數(shù)據(jù)格式,為L(zhǎng)LM預(yù)訓(xùn)練、持續(xù)訓(xùn)練和微調(diào)全程各個(gè)環(huán)節(jié)提供更好的數(shù)據(jù)支持。
從數(shù)據(jù)源來(lái)看,火山引擎多模態(tài)數(shù)據(jù)湖方案可實(shí)現(xiàn)各類數(shù)據(jù)的統(tǒng)一管理;在算子處理方面,該方案提供了100多種開(kāi)箱即用的非結(jié)構(gòu)數(shù)據(jù)處理算子;在多元異構(gòu)計(jì)算上,方案提供了CPU+GPU異構(gòu)計(jì)算,能讓數(shù)據(jù)計(jì)算提效3倍以上。
目前,該解決方案已廣泛應(yīng)用在泛互聯(lián)網(wǎng)、汽車等行業(yè),并取得實(shí)效。
以聚焦于智能網(wǎng)聯(lián)汽車的某科創(chuàng)公司為例,最初該公司使用自建開(kāi)源大數(shù)據(jù)平臺(tái)支撐車聯(lián)網(wǎng)數(shù)據(jù)采集、加工及分析,但存在實(shí)時(shí)離線數(shù)據(jù)割裂、數(shù)據(jù)膨脹、系統(tǒng)穩(wěn)定性低等問(wèn)題。
通過(guò)引入火山引擎多模態(tài)數(shù)據(jù)湖解決方案,該公司將火山引擎E-MapReduce作為數(shù)據(jù)湖 OLAP 引擎,構(gòu)建兼具離線、實(shí)時(shí)的湖倉(cāng)一體架構(gòu),并運(yùn)用其存算分離架構(gòu)應(yīng)對(duì)高膨脹增量數(shù)據(jù),在確保計(jì)算性能 SLA 穩(wěn)定的同時(shí),成功將維護(hù)成本降為零;還進(jìn)一步借助全域數(shù)據(jù)集成DataSail 實(shí)現(xiàn)OLAP、OLTP 兩種不同負(fù)載要求的任務(wù)分離,保障了服務(wù)的可用性。最終在數(shù)據(jù)處理實(shí)效性提升為秒級(jí)的基礎(chǔ)上,資源成本還降低了30%。
技術(shù)之外,能力的培養(yǎng)至關(guān)重要
數(shù)據(jù)飛輪2.0模式的誕生,不僅僅是火山引擎在當(dāng)下技術(shù)變革的頂層設(shè)計(jì)進(jìn)化。它更是來(lái)自字節(jié)跳動(dòng)內(nèi)部的數(shù)據(jù)驅(qū)動(dòng)、AI實(shí)踐經(jīng)驗(yàn)的再次總結(jié)。
事實(shí)上,目前火山引擎數(shù)據(jù)飛輪2.0模式提供給企業(yè)客戶的能力,均已在字節(jié)跳動(dòng)內(nèi)部進(jìn)行了長(zhǎng)期的沉淀與優(yōu)化。
比如,多個(gè)業(yè)務(wù)線搭建了專屬ChatBI智能體,數(shù)據(jù)顯示,基于ChatBI智能體,業(yè)務(wù)用戶可自閉環(huán)完成“從業(yè)務(wù)問(wèn)題到數(shù)據(jù)問(wèn)題”的診斷和分析,數(shù)據(jù)自助分析率達(dá)90%。
再比如,另一款數(shù)智產(chǎn)品增長(zhǎng)營(yíng)銷平臺(tái)GMP所提供的創(chuàng)意助手能力,生成營(yíng)銷內(nèi)容80%可以無(wú)需人工干預(yù)直接投放。
經(jīng)由內(nèi)部的充分實(shí)踐,火山引擎數(shù)據(jù)飛輪2.0模式已經(jīng)積累豐富的場(chǎng)景經(jīng)驗(yàn)。這些技術(shù)之外的經(jīng)驗(yàn)?zāi)芰,亦是飛輪2.0模式能運(yùn)行良好的重要保障。
因此,除了能力與方案的發(fā)布外,火山引擎在本次大會(huì)上也發(fā)布了“數(shù)據(jù)飛輪2.0加速計(jì)劃”,不僅為想要嘗試新能力的企業(yè)提供為期3個(gè)月的免費(fèi)試用,更為需要深度挖掘數(shù)據(jù)飛輪2.0場(chǎng)景的企業(yè),提供了最多3個(gè)月周期的免費(fèi)項(xiàng)目制陪跑服務(wù)。
在為企業(yè)提供工具能力的同時(shí),更要向企業(yè)傳遞方法與經(jīng)驗(yàn)。
據(jù)了解,該陪跑服務(wù)涵蓋了企業(yè)大模型數(shù)據(jù)應(yīng)用方案規(guī)劃、企業(yè)Data+AI能力培育、業(yè)務(wù)陪跑等多個(gè)方面,目的是幫助企業(yè)用更短時(shí)間,更快構(gòu)建并高效運(yùn)行數(shù)據(jù)飛輪2.0,實(shí)現(xiàn)業(yè)務(wù)價(jià)值提升。