界面新聞記者 | 苗藝偉
界面新聞編輯 | 江怡曼
在大模型火爆的兩年內(nèi),馬上消費金融正在實踐中不斷通過?“小步快跑”,以實現(xiàn)金融大模型的快速演進。
11月28日,在重慶舉辦的數(shù)字生態(tài)伙伴創(chuàng)新大會上,馬上消費金融CTO蔣寧在接受采訪時表示,經(jīng)過兩年多以來的探索實踐,對大模型的認識更加深刻,原本業(yè)界普遍認為大模型必須滿足巨大的參數(shù),有著高昂訓練成本,然而實踐得出的結(jié)論卻并非如此。
他表示,金融大模型可以實現(xiàn)“輕量化應用”,在降低成本與提高效率之間尋求最優(yōu)解,也可以將金融大模型從單場景創(chuàng)新演進成為零售金融全價值鏈大模型,乃至應用于更廣泛社會生活的領(lǐng)域;最后,金融大模型正在演進成為“智能體”,推理能力而非數(shù)據(jù)訓練,將成為大模型具備的更重要的能力。
金融大模型“溢出效應”
蔣寧表示,1.0版本的天鏡大模型還只是一個局部的創(chuàng)新,是由場景驅(qū)動的,主要訓練了人機交互來解決金融客服、營銷等場景的應用。當時是基于2億用戶,訓練了約100P數(shù)據(jù),實現(xiàn)了100億的交易額。
他稱,但在1.0以后,一直在思考在金融這個長價值鏈的產(chǎn)業(yè)中,大模型是否能在包括營銷、風控、消費者權(quán)益保護,甚至客戶體驗、合規(guī)等場景進行應用,因此做了深度探索。
蔣寧表示,例如,在反金融黑灰產(chǎn)領(lǐng)域,馬上消金應用了多項大模型技術(shù)來進行高效反黑。可以在貸款人允許下記錄聲紋,如果后續(xù)交互過程中,發(fā)現(xiàn)他的聲音發(fā)生變化的時候,就有理由懷疑,這可能不是他本人的意思表達從而識別黑灰產(chǎn)。此外,整合多模態(tài)大模型還可以識別借款人的周邊的環(huán)境、地址、網(wǎng)絡地址等,再結(jié)合復雜網(wǎng)絡技術(shù),隱私計算技術(shù),多種技術(shù)結(jié)合,就形成了打擊黑產(chǎn)的科技能力。
除了金融領(lǐng)域,馬上消費人工智能研究院院長陸全也表示,馬上消金也把在金融領(lǐng)域積累的能力又反哺到國家重大項目里,通過參與社會生態(tài)建設,讓人工智能團隊的知識、經(jīng)驗能在更廣泛的領(lǐng)域得到鍛煉提升機會。
馬上消費人工智能研究院鄧偉洪也表示,目前,公司在養(yǎng)老機器人上做了比較大的投入,可以滿足老年人在社交、康養(yǎng)方面的需求。他表示,養(yǎng)老機器人未來應用場景豐富,一是社交陪伴場景,可以做一個數(shù)字人跟老年人進行心理疏導。二是游戲娛樂場景,可以給老人開發(fā)認知小游戲,鍛煉他們的認知功能,也可以給他們放一些好看的電影。三是安全觀察場景,老年人摔倒是一個很大的風險,可以做一些監(jiān)護。四是未來當機器人可以做到自由運動,可以給老人做一些家務,給老人送藥。
從單體大模型到“智能體”
在采訪中,馬上消費金融人工智能研究院院長陸全表示,在過去兩年的金融大模型實踐過程中,第一個發(fā)現(xiàn)就是光靠單一、單體基礎大模型,或者說單體大模型不能適應產(chǎn)業(yè)界絕大多數(shù)應用,因此,馬上的天鏡從單體大模型,也逐漸變成了目前的“邏輯”與“記憶”分離的“智能體”。
陸全表示,所謂“智能體”,其背后包括了多個大模型和小模型,通過把這些模型組合在一起,多個模型之間互相協(xié)作,來完成一連串的復雜任務。
他表示,發(fā)現(xiàn)金融多個領(lǐng)域的應用都需要多智能體系統(tǒng)來處理,這是因為單體大模型能力相當有限,就像一個人不可能是文科狀元,還是理科狀元,還懂管理。而在智能體情況下,大模型就可以相互配合,把邏輯和數(shù)據(jù)分析分離,讓大模型做專業(yè)上最擅長的事情。
陸全稱,這意味著,智能體在某些價值鏈上天然就具備泛化能力,可以移植到類似場景,比如防偽,可能所有場景的要求是一致的。當智能體掌握了某個邏輯,且在業(yè)務形態(tài)比較接近的情況下,就會更具備泛化應用的能力。
從高成本到“輕量化”
蔣寧表示,在實踐中,對大模型的認知也在逐步深入。在天鏡大模型1.0時代,普遍認為需要建設一個高成本、參數(shù)巨大的大模型來訓練,才能讓模型能夠發(fā)揮效力。然而,當大模型應用從單場景向全價值鏈演進,就發(fā)現(xiàn)可能有些場景參數(shù)沒有那么大的時候,也可以保證在很短時間內(nèi)可以得出正確答案,而有些場景非常注重嚴密的邏輯,就可能需要更大的參數(shù)。因此,2.0版本的天鏡大模型正在向更輕量,更小型化發(fā)展,根據(jù)不同場景選擇能夠起效的最小參數(shù),來實現(xiàn)對成本的有效地控制。
他還表示,此前,大模型創(chuàng)新成本比較貴,一張算力卡初始階段只能支持50個機器人和人的交互,而現(xiàn)在通過大模型各種調(diào)優(yōu)技術(shù)輕量化,一張同樣的卡可以支持10倍以上的交互。
陸全也表示,過去大家一直把更多的算力都關(guān)注在基礎大模型的訓練上,而現(xiàn)在,馬上消費金融的大模型絕大部分算力都消耗在推理上,其次才是消耗在持續(xù)訓練上。目前,一些基礎開源大模型發(fā)展得很快,金融垂類模型只需要在它的基礎上做微調(diào)就可以快速吃到紅利;另一方面,是發(fā)現(xiàn)在實際過程中,并沒有那么大的必要來做基礎模型的精益求精。
陸全表示,目前,公司的金融大模型天鏡在銷售上已經(jīng)為公司帶來了盈利,而且還在探索建立一套商業(yè)模式。目前,天鏡大模型正在通過“小步快跑”,不斷證明自身的盈利能力。
還沒有評論,來說兩句吧...