如何讓大模型在提升專(zhuān)業(yè)能力的同時(shí)不損失通用能力,是當(dāng)下大模型落地具體場(chǎng)景的最大阻礙。12月23日,百川智能推出全鏈路領(lǐng)域增強(qiáng)金融大模型Baichuan4-Finance,采用自約束訓(xùn)練方案,同步提升模型專(zhuān)項(xiàng)能力和通用能力,提高金融場(chǎng)景可用性。
百川智能由前搜狗公司CEO王小川于2023年創(chuàng)辦。全鏈路領(lǐng)域增強(qiáng)方案覆蓋了構(gòu)建、模型預(yù)訓(xùn)練、微調(diào)、強(qiáng)化學(xué)習(xí)等從模型研發(fā)到場(chǎng)景應(yīng)用全流程,旨在提升模型多元場(chǎng)景可用性。據(jù)了解,Baichuan4-Finance的金融數(shù)據(jù)集包含金融專(zhuān)業(yè)教材與學(xué)術(shù)著作、頂級(jí)金融期刊論文、監(jiān)管機(jī)構(gòu)政策文件、金融法律法規(guī)等核心專(zhuān)業(yè)金融知識(shí)數(shù)據(jù),以及金融專(zhuān)業(yè)問(wèn)答集、企業(yè)財(cái)報(bào)與年度報(bào)告、金融類(lèi)研究分析報(bào)告等實(shí)踐應(yīng)用類(lèi)數(shù)據(jù)。
在此基礎(chǔ)上,Baichuan4-Finance在領(lǐng)域自約束訓(xùn)練過(guò)程中引入更高精的通用數(shù)據(jù)混合訓(xùn)練,實(shí)現(xiàn)模型通用能力不下降、金融能力穩(wěn)定增長(zhǎng),并在后訓(xùn)練環(huán)節(jié)通過(guò)合成數(shù)據(jù)、指令數(shù)據(jù)對(duì)模型實(shí)施有監(jiān)督的微調(diào);在強(qiáng)化學(xué)習(xí)策略中,針對(duì)數(shù)學(xué)計(jì)算等金融領(lǐng)域特別關(guān)注的場(chǎng)景進(jìn)行樣本增強(qiáng)等,提升模型性能。
在中國(guó)人民大學(xué)財(cái)政金融學(xué)院12月17日發(fā)布的金融評(píng)測(cè)體系FLAME的測(cè)評(píng)中,Baichuan4-Finance在銀行、保險(xiǎn)、基金、證券等資格認(rèn)證領(lǐng)域的準(zhǔn)確率突破95%,整體準(zhǔn)確率93.62%。
金融行業(yè)數(shù)據(jù)豐富,適合大模型落地。但在業(yè)內(nèi)人士看來(lái),當(dāng)下大模型落地金融,還要解決四大問(wèn)題:一是合規(guī)性,金融是強(qiáng)監(jiān)管行業(yè),任何新技術(shù)的應(yīng)用都要滿(mǎn)足監(jiān)管要求。二是安全性,如果幻覺(jué)問(wèn)題不能徹底避免或消失,大模型落地金融就存在風(fēng)險(xiǎn),與此同時(shí),在涉及用戶(hù)敏感數(shù)據(jù)的問(wèn)答時(shí),大模型存在泄漏隱私數(shù)據(jù)風(fēng)險(xiǎn)。三是解釋性,金融是邏輯性強(qiáng)的行業(yè),數(shù)據(jù)處理結(jié)果要求準(zhǔn)確。四是經(jīng)濟(jì)性,大模型更新速度越來(lái)越快,對(duì)算力、數(shù)據(jù)的要求越來(lái)越高,金融機(jī)構(gòu)落地大模型還要考慮成本,“有時(shí)候小模型的效果不一定比大模型差。大模型和小模型的配合也會(huì)起很大作用,比如輿情分析、財(cái)務(wù)異常識(shí)別等?!?/p>
還沒(méi)有評(píng)論,來(lái)說(shuō)兩句吧...