界面新聞?dòng)浾?| 伍洋宇
界面新聞編輯 | 劉方遠(yuǎn)
2024年,AI大模型的戰(zhàn)火不熄,反而愈演愈烈。
相較于2023年一片混沌的百模大戰(zhàn),行業(yè)在經(jīng)歷一年洗牌后,開始呈現(xiàn)出更清晰的市場格局。?
互聯(lián)網(wǎng)大廠們各自建立起了相對成熟的模型能力,在擴(kuò)張?jiān)茦I(yè)務(wù)的基礎(chǔ)上,開始向自己的既有產(chǎn)品體系滲透。不僅是AI原生應(yīng)用,部分原有應(yīng)用與AI大模型的適配度也極高,這將是大廠進(jìn)一步鞏固自己護(hù)城河的地方。
而對標(biāo)OpenAI的中國大模型創(chuàng)業(yè)“六小虎”,或艱難或順利地陸續(xù)完成了這一年的關(guān)鍵融資,獲得繼續(xù)留在牌桌上的資格。與此同時(shí),各家對于模型側(cè)與應(yīng)用側(cè)的方向選擇顯現(xiàn)差異化,其各自的不同商業(yè)化脈絡(luò)開始成型。
值得關(guān)注的是,其中誰的選擇停留在了大廠射程內(nèi),而誰的選擇人跡罕至但異??部?。
此外,在端側(cè)模型、視頻模型等賽道,仍有其他創(chuàng)業(yè)公司展現(xiàn)出了不俗活力,它們都有可能是各自細(xì)分領(lǐng)域的核心競爭者。
互聯(lián)網(wǎng)大廠:備好基座模型能力,向業(yè)務(wù)滲透
百度文心一言
作為最早入局AI大模型的互聯(lián)網(wǎng)大廠,百度的模型與產(chǎn)品此前并未得到與之匹配的認(rèn)可和聲量,它這一年仍在努力自證。?
在模型側(cè),目前文心大模型矩陣包括ERNIE 4.0 Turbo等旗艦大模型、ERNIE Speed等輕量模型,以及基于基礎(chǔ)模型生產(chǎn)的系列思考模型和場景模型。根據(jù)百度披露的數(shù)據(jù),文心大模型日均調(diào)用量超15億,相較一年增長約30倍,用戶規(guī)模達(dá)到4.3億。
在產(chǎn)品側(cè),文心一言App上線一年之際,百度在9月官宣該產(chǎn)品升級(jí)為“文小言”,定位“新搜索”智能助手,希望從富媒體搜索、多模態(tài)輸入、記憶、自由訂閱等能力體現(xiàn)出差異化。據(jù)官方數(shù)據(jù),截至9月,文小言月活躍用戶達(dá)到千萬級(jí)別,累計(jì)調(diào)用量超過20億次。
另外,在百度的核心業(yè)務(wù)場景下,其大模型最為強(qiáng)調(diào)的是知識(shí)增強(qiáng)、檢索增強(qiáng)以及智能體等技術(shù)。對此,百度還發(fā)布了檢索增強(qiáng)的文生圖技術(shù)iRAG,以及多智能體在代碼場景里的應(yīng)用秒噠和文心快碼。
這一年,百度對于AI大模型應(yīng)用的戰(zhàn)略抉擇也愈發(fā)清晰。
對于看起來極為火熱的視頻模型領(lǐng)域,李彥宏在一場內(nèi)部講話中明確表示,不會(huì)投入Sora這類投入周期太長且10-20年沒有業(yè)務(wù)收益的視頻生成模型。
與之相對應(yīng)的是,李彥宏公開強(qiáng)調(diào)了智能體應(yīng)用方向的價(jià)值。他表示,過去24個(gè)月AI行業(yè)最重要的變化是大模型基本消除了幻覺,“智能體是AI應(yīng)用的最主流形態(tài),即將迎來它的爆發(fā)點(diǎn)”。
阿里通義千問
過去一年,通義千問的核心動(dòng)作是對標(biāo)Llama系列,從性能和豐富度上,拉高國內(nèi)開源模型的整體水平。
9月云棲大會(huì),阿里云發(fā)布通義千問新一代開源模型Qwen2.5,其中旗艦?zāi)P蚎wen2.5-72B性能超越Llama 405B,其余模型尺寸包括0.5B、1.5B、3B、7B、14B、32B,幾乎覆蓋從端側(cè)到工業(yè)級(jí)全場景。
隨之而來的一系列開源模型還包括語言模型Qwen2.5、視覺語言模型Qwen2-VL-72B、編程模型Qwen2.5-Coder、數(shù)學(xué)模型Qwen2.5-Math等,累計(jì)上架超100個(gè)。12月,阿里云又發(fā)布了開源多模態(tài)推理模型QVQ-72B-Preview。
至此,通義千問Qwen被認(rèn)為是僅次于Llama的世界級(jí)模型群,在商業(yè)考量上,這是為充分適配各種場景的開發(fā)者和中小企業(yè)需求。根據(jù)官方數(shù)據(jù),截至9月中旬,通義千問開源模型累計(jì)下載量已突破4000萬,衍生大模型超5萬個(gè)。?
阿里旗下另一個(gè)值得關(guān)注的AI業(yè)務(wù)在于夸克。
定位“AI全能助手”的夸克,在今年發(fā)布了PC端產(chǎn)品,重點(diǎn)升級(jí)了AI搜索、AI寫作、AI PPT、AI文件總結(jié)等一系列主打效率提升的功能。實(shí)際上,夸克的存量用戶與AI應(yīng)用的用戶畫像高度吻合 ,這款應(yīng)用如何利用大模型取得增益,也會(huì)是阿里AI戰(zhàn)略未來的一個(gè)重要看點(diǎn)。
騰訊混元
在一眾大廠大力投入AI大模型的趨勢中,騰訊混元被認(rèn)為今年在基座模型和產(chǎn)品應(yīng)用上有所掉隊(duì),不過其多模態(tài)能力仍是亮點(diǎn)。?
這一年,它最突出的能力體現(xiàn)在視頻生成領(lǐng)域。12月,騰訊混元大模型宣布正式上線視頻生成能力,并開源該130億參數(shù)量視頻生成大模型,這也是當(dāng)前最大的視頻開源模型。在眾多測試中,其生成視頻在質(zhì)感和語義理解等方面有較高水準(zhǔn)的表現(xiàn)。?
至此,騰訊混元系列模型包含文本大模型,AI繪圖大模型,3D生成大模型以及視頻模型。其他模型進(jìn)展上,騰訊于9月發(fā)布混元Turbo,于11月開源混元Large和混元3D生成大模型Hunyuan3D-1.0。
基于騰訊自身的業(yè)務(wù)積累和優(yōu)勢,多模態(tài)大模型或?qū)⑹瞧浯竽P蜆I(yè)務(wù)的最大看點(diǎn)。
今年7月WAIC上,騰訊集團(tuán)副總裁蔣杰表示,大模型行業(yè)正從最初的單模態(tài)向多模態(tài)過渡。對于騰訊混元大模型,多模態(tài)是一道必答題,混元正在積極部署多模態(tài)到全模態(tài)的技術(shù),很快將在騰訊元寶App、騰訊內(nèi)部業(yè)務(wù)及場景中體驗(yàn),同時(shí)會(huì)通過騰訊云向外部應(yīng)用開放。
字節(jié)豆包
字節(jié)跳動(dòng)就算曾經(jīng)對AI大模型重視不夠,在這一年也窮追猛補(bǔ)回來了。
在模型側(cè),目前豆包系列已包含通用模型Pro,音樂模型,文生圖模型,3D生成模型,視頻生成模型PixelDance和Seaweed等等,覆蓋文本、語音、圖片及視頻等多模態(tài)能力。近期,字節(jié)再度發(fā)布豆包視覺理解模型,加強(qiáng)了模型的視頻識(shí)別與理解能力。?
這一年,字節(jié)還通過降價(jià)等方式加速了大模型在應(yīng)用端的使用。在今年年中的API降價(jià)潮中,字節(jié)跳動(dòng)是第一個(gè)跟進(jìn)的大廠,并且力度出奇,直接將大模型從以分計(jì)價(jià)帶到以厘計(jì)價(jià)時(shí)代。12月,字節(jié)又將豆包視覺理解模型價(jià)格降至0.003元/千Tokens,比行業(yè)平均價(jià)格降低85%。
據(jù)字節(jié)透露,豆包大模型12月日均tokens使用量超過4萬億,較5月發(fā)布時(shí)期增長超過33倍。
在模型性能和產(chǎn)品投流的共同支持下,字節(jié)豆包App在2024年成為日活斷層領(lǐng)先的AI應(yīng)用。據(jù)數(shù)據(jù)分析機(jī)構(gòu)QuestMobile,豆包App今年9月的日活已達(dá)760萬,同應(yīng)用場景的其他產(chǎn)品日活級(jí)別均在一百萬級(jí)別上下。
在應(yīng)用側(cè),字節(jié)跳動(dòng)已經(jīng)打造了自己的AI應(yīng)用艦隊(duì)。除去豆包和即夢兩大頭部產(chǎn)品,字節(jié)旗下已有十幾款A(yù)I應(yīng)用,幾乎完全覆蓋AIGC、Agent等所有主流方向。另外,字節(jié)還通過Ola耳機(jī)切入AI耳機(jī),并已在AI眼鏡等智能硬件品類上蓄勢待發(fā)。
六小虎:留在牌桌上,找到活下去的路
智譜AI
在“六小虎”中,智譜AI的To B(面向企業(yè))定位依舊明確。
過去一年,智譜相繼發(fā)布新一代基座大模型GLM-4和GLM-4-Plus,在多模態(tài)上推出了視覺模型GLM-4V,視頻生成模型CogVideoX,以及端到端情感語音模型GLM-4-Voice。?
在開源水平上,除了GLM-4-9B和CogVideoX兩款主力模型外,智譜共開源ChatGLM等50余款模型,全球下載量超過3000萬。?
進(jìn)入年末,智譜在Agent戰(zhàn)略上發(fā)布重要成果AutoGLM,以“人類歷史上首次用AI發(fā)紅包”引起一陣熱度,并同時(shí)推出推出GLM-PC,開啟“無人駕駛”PC的技術(shù)探索。
智譜AI今年完成兩輪融資,繼續(xù)站穩(wěn)“六小虎”地位。9月,中關(guān)村科學(xué)城公司以投前200億估值領(lǐng)投智譜;12月,公司再完成新一輪三十億人民幣融資,新投資方包括多家戰(zhàn)投及國資。
值得關(guān)注的是,智譜AI是少見的主動(dòng)披露商業(yè)化收入及增速的大模型創(chuàng)業(yè)公司。
智譜AI今年商業(yè)化收入增長超過100%,平臺(tái)日均Tokens消耗量增長150倍。其C端產(chǎn)品智譜清言App擁有超過2500萬用戶,年化收入(ARR)超千萬。
月之暗面
月之暗面大概是所有創(chuàng)業(yè)公司中,在產(chǎn)品層面唯一能夠正面對抗字節(jié)跳動(dòng)的存在。
回頭看,它今年最重要的動(dòng)作是聚焦Kimi,并把“長文本”這個(gè)標(biāo)簽做到了極致。今年3月,Kimi Chat將上下文輸入限制突破至200萬文字,產(chǎn)品熱度一度致其小程序宕機(jī),甚至在二級(jí)市場形成Kimi概念股板塊。?
這股熱度一直延續(xù)至今。盡管在用戶活躍度層面,Kimi與豆包之間相差一個(gè)數(shù)量級(jí),但它已經(jīng)基本與文小言持平,并超越一眾創(chuàng)業(yè)公司的同類應(yīng)用。
不過,在應(yīng)用層,月之暗面已經(jīng)暫時(shí)收縮了C端(個(gè)人用戶端)的出海戰(zhàn)略。月之暗面表示,這是公司主動(dòng)選擇做減法,將更加聚焦Kimi的開發(fā)。
進(jìn)入年末,盡管身陷創(chuàng)始人風(fēng)波,但月之暗面仍在Kimi Chat一周年時(shí)發(fā)布了新一代數(shù)學(xué)推理模型,其數(shù)學(xué)能力對標(biāo)OpenAI o1系列。
融資層面,去年還不算突出的月之暗面,在2024年完成了自己的站位轉(zhuǎn)變。今年2月,阿里巴巴入局,公司完成一輪超十億美金融資,以25億美金估值站穩(wěn)行業(yè)第一梯隊(duì)。8月,騰訊跟進(jìn)投資,月之暗面融資規(guī)模超過110億元人民幣,以33億美金刷新大模型創(chuàng)業(yè)公司估值最高紀(jì)錄。
Minimax
Minimax今年的優(yōu)勢相對明顯,其C端應(yīng)用已初具矩陣形態(tài),并在出海戰(zhàn)略上頗為成功。
在國內(nèi)和海外,海螺AI、星野、Talkie已成為其認(rèn)知度較高的產(chǎn)品。根據(jù)Sensor Tower的數(shù)據(jù),Talkie在美國免費(fèi)娛樂類應(yīng)用榜上排名第五,全球月活躍用戶數(shù)已達(dá)1100萬。此外,根據(jù)QuestMobile數(shù)據(jù),星野活躍率達(dá)到25.7%,月人均使用天數(shù)為7.7天。
這些產(chǎn)品熱度帶來了實(shí)在的商業(yè)化進(jìn)展。據(jù)英國金融時(shí)報(bào),Minimax今年的ARR收入或達(dá)7000萬美金。
模型側(cè),Minimax在4月推出萬億參數(shù)MoE大語言模型abab6.5,多模態(tài)方面,8月推出音樂生成模型與視頻生成模型。并且,Minimax的視頻生成能力頗有后來居上的態(tài)勢,在可信度上表現(xiàn)突出,與快手可靈、字節(jié)即夢均有可比性。
從基座模型進(jìn)展來看,采用新一代技術(shù)的“abab7”系列文本模型,以及o1類產(chǎn)品,將是Minimax在明年上半年的重大看點(diǎn)。
融資方面,今年3月,MiniMax完成B輪的6億美元融資,投資方為阿里巴巴,其估值達(dá)到25億美元。
百川智能?
“六小虎”中,百川智能在AI應(yīng)用場景層面的戰(zhàn)略選擇最為明確。?
今年5月,百川智能發(fā)布最新一代基座大模型Baichuan 4,并推出成立之后的首款A(yù)I助手“百小應(yīng)”。
Baichuan 4仍是一個(gè)數(shù)千億參數(shù)級(jí)別大模型,相較Baichuan 3,其通用能力提升超過10%,數(shù)學(xué)和代碼能力分別提升14%和9%。“百小應(yīng)”定位于專業(yè)AI助手,功能涉及整理資料、輔助創(chuàng)作、多輪搜索等。
而后,百川智能重點(diǎn)投入醫(yī)療大模型,目前已在兒科領(lǐng)域取得一定進(jìn)展,與兒童醫(yī)院合作推出了“一大四小”醫(yī)療產(chǎn)品。
王小川強(qiáng)調(diào),醫(yī)療應(yīng)用需要精準(zhǔn)和高效的智能支持,因而提升模型智力的上限對于醫(yī)療領(lǐng)域尤為重要。
關(guān)于大模型公司可能放棄“預(yù)訓(xùn)練”的傳聞。他明確表示,中國的大模型公司仍需堅(jiān)持“預(yù)訓(xùn)練”這一戰(zhàn)略,因?yàn)檫@是國家戰(zhàn)略資源的一部分。與海外通過超級(jí)平臺(tái)推動(dòng)預(yù)訓(xùn)練不同,中國的預(yù)訓(xùn)練更多依賴于場景驅(qū)動(dòng),而醫(yī)療正是一個(gè)理想的應(yīng)用場景。
融資方面,百川智能今年完成了A輪融資,總?cè)谫Y金額達(dá)50億元,公司表示將以200億元估值開啟B輪融資。
零一萬物?
雖然在外界看來,零一萬物的高管團(tuán)隊(duì)在今年發(fā)生了動(dòng)蕩,但這家公司目前在模型層和應(yīng)用層也梳理出了自己的明確方向。
今年上半年和下半年,零一萬物分別發(fā)布千億參數(shù)模型Yi-Large,以及最新旗艦?zāi)P蚘i-Lightning,后者在國際權(quán)威盲測榜單LMSYS上排名世界第六。
在應(yīng)用層,經(jīng)歷B端和C端產(chǎn)品試水以及海內(nèi)外業(yè)務(wù)同時(shí)推進(jìn)后,零一萬物在趨緊年末的節(jié)點(diǎn)捋出了更適合自己的清晰打法。
針對國內(nèi)市場,零一萬物采取ToB戰(zhàn)略,并將其概括為“Infra+大模型+應(yīng)用”三位一體戰(zhàn)略,囊括三條業(yè)務(wù)線分別是,面向電商直播、辦公會(huì)議等場景的“如意”數(shù)字人解決方案,基于自身AI Infra能力提煉的AI Infr 解決方案,以及原有的Yi API和開放模型訓(xùn)練平臺(tái)。
C端產(chǎn)品上,零一萬物面向海外市場的Pop AI,有望繼續(xù)為其產(chǎn)生穩(wěn)定現(xiàn)金流,而面向國內(nèi)市場的AI智能助手“萬知”將維持基礎(chǔ)運(yùn)營,并在未來伺機(jī)尋找其他增長機(jī)會(huì)。?
8月,消息稱零一萬物完成新一輪融資,金額達(dá)數(shù)億美元,此輪融資參與方包括某國際戰(zhàn)投、東南亞財(cái)團(tuán)等多家機(jī)構(gòu)。
階躍星辰
階躍星辰的低調(diào)作風(fēng)延續(xù)了一整年。雖然市場輿論有所看衰行業(yè)發(fā)展,但這家公司仍然堅(jiān)定AGI目標(biāo)與基座模型預(yù)訓(xùn)練。?
在模型層,階躍星辰今年率先發(fā)布了行業(yè)首個(gè)萬億參數(shù)級(jí)別MoE大模型Step-2,并推出了Step-1V多模態(tài)理解?模型。
據(jù)統(tǒng)計(jì),過去10個(gè)月,公司一共發(fā)布了11個(gè)自研基座模型,包括千億、萬億參數(shù)的語言大模型,圖像、視頻理解大模型,圖像、視頻生成大模型以及不久前發(fā)布的國內(nèi)首個(gè)端到端千億參數(shù)語音模型。?
商業(yè)化方面,階躍星?執(zhí)行的是“超級(jí)模型+超級(jí)應(yīng)?”戰(zhàn)略,通過?研和?態(tài)合作的模式面向C端市場發(fā)布產(chǎn)品,目前已有AI智能助手躍問、AI開放世界冒泡鴨,以及在?融財(cái)經(jīng)、內(nèi)容創(chuàng)作、智能終端等領(lǐng)域與各企業(yè)合作完成的AI應(yīng)用。
接近年末,階躍星辰成為2024年最后一家傳出融資消息的“六小虎”。
12月這輪融資后,其總?cè)谫Y金額達(dá)數(shù)億美元,新一輪核心投資方包括上海國有資本投資有限公司及其旗下基金,戰(zhàn)略和財(cái)務(wù)投資人包括騰訊投資、五源資本、啟明創(chuàng)投等,但仍未透露估值信息。
牌桌上還有這些玩家
面壁智能
作為端側(cè)大模型玩家的代表,面壁智能的行業(yè)站位突出且明確。
2月,面壁智能開始推出端側(cè)大模型小鋼炮MiniCPM系列,并于9月發(fā)布4B版本MiniCPM 3.0 文本模型,在自然語言理解、知識(shí)、代碼、數(shù)學(xué)等能力上可達(dá)到GPT-3.5水平。
多模態(tài)方面,面壁智能8月發(fā)布8B版本MiniCPM-V 2.6多模態(tài)模型,首次將超清OCR識(shí)圖、實(shí)時(shí)視頻理解等能力集成到端側(cè)。?
據(jù)統(tǒng)計(jì),面壁小鋼炮MiniCPM系列累計(jì)下載量400萬。
當(dāng)前,智能硬件成為AI大模型最重要的落地場景之一,這為端側(cè)模型供應(yīng)商構(gòu)成一定商業(yè)化想象空間。對此,面壁智能正在與華為、聯(lián)發(fā)科技、聯(lián)想、英特爾、長城汽車、易來智能等企業(yè)協(xié)作,業(yè)務(wù)覆蓋AI Phone、AI PC、智能座艙、智能家居與具身機(jī)器人等領(lǐng)域。
12月,面壁智能完成新一輪數(shù)億元融資。
對標(biāo)Sora的創(chuàng)業(yè)公司們:生數(shù)科技、愛詩科技?
AI視頻生成是這一輪大模型創(chuàng)業(yè)中格外火熱的一條賽道,在這里競爭的不止有互聯(lián)網(wǎng)大廠和“六小虎”。
生數(shù)科技在商業(yè)化層面瞄準(zhǔn)了影視、文化、泛娛樂等領(lǐng)域。今年4月,公司推出長視頻大模型Vidu,以一鍵生成32s視頻,同時(shí)支持4D、音視頻融合生成等特性產(chǎn)生了一定熱度。11月,Vidu 1.5版本上線,進(jìn)一步攻克視頻模型多主體一致性難題。
愛詩科技是另一個(gè)重要代表,創(chuàng)始人王長虎曾擔(dān)任字節(jié)跳動(dòng)的視覺技術(shù)負(fù)責(zé)人。
今年2月,愛詩科技核心產(chǎn)品PixVerse上線,產(chǎn)品增速一度迅猛,4月其視頻生成總量超越1000萬。11月,PixVerse毒液變身特效在抖音走紅。截至目前,PixVerse全球用戶數(shù)超1200萬,月活躍用戶數(shù)近600萬。
12月,愛詩科技宣布完成A2至A4輪融資,總金額近3億元人民幣。
還沒有評論,來說兩句吧...