前沿科技,數智經濟
文|白 鴿
編|王一粟
當 AI 大模型已開始走向千行百業之時,備受看好的金融行業,卻似乎陷入了落地瓶頸。
打開手機銀行想查下貸款額度,對著屏幕說了半天,AI 客服卻只回復 " 請點擊首頁貸款按鈕 ";
客戶經理想用大模型生成一份客戶資產配置方案,結果推薦的產品與客戶風險等級完全不符;
風控團隊測試的 AI 模型,在審批中小企業貸款時頻頻給出 " 幻覺答案 "......
這些看似荒誕的場景,卻是當前 AI 落地金融行業時的真實困境。
當金融機構滿懷期待地將 AI 請進門,卻發現它既讀不懂復雜的信貸政策,算不清理財產品的費率結構,更搞不懂不同銀行的 " 行話體系 "。
通用大模型的 " 聰明 ",在嚴肅的金融場景里似乎失靈了,大模型與金融場景之間,也仿佛橫亙著一道看不見的鴻溝。
" 企業和產業需要的不是實驗室的技術,而是真正能夠解決真實問題的可信生產力。" 螞蟻數科 CEO 趙聞飆在 2025WAIC 智能體驅動產業變革論壇上如此說道。
也正因此,面向 AI 大模型在具體行業中的落地,想要真正釋放 AI 價值,關鍵就在于要從水平通用轉向垂直專用,只有深度理解行業的大模型,才能懂行話,做行活兒,創造真實的業務價值。
金融行業的 AI 落地,更是如此。
因此,構建專業的金融大模型是推進金融與 AI 深度融合的必然路徑,未來,金融大模型的應用深度將成為金融機構競爭力的關鍵要素。
大會上,螞蟻數科正式發布了一款專為金融領域打造的金融推理大模型 Agentar-Fin-R1,其基于 Qwen3 研發的垂直行業大模型,包括 32B 和 8B 參數兩個版本,在 FinEval1.0、FinanceIQ 等權威金融大模型評測基準上表現出色,超越 DeepSeek-R1 等同尺寸開源通用大模型及金融大模型。
同時,螞蟻數科還推出基于百靈大模型的 MOE 架構模型,獲得更優推理速度。此外,還有非推理版本的 14B 和 72B 參數大模型,以滿足金融機構在多樣化場景下的部署需求。
" 螞蟻數科主要專注于金融板塊,這也意味著把過去所積累的,對客戶、對場景以及對解決方案的了解,能更深入地提取并實現向垂直專用的轉變。" 螞蟻數科 CTO 王維說道," 而一個好的垂直大模型,特別是具備強大推理能力的那種,才能成為智能體可控、可信賴并且易于優化的核心組件。"
螞蟻數科的金融推理大模型,還將通過 Expertise、Efficiency、Evolution 三大理念,實現金融大模型的深度專業能力和高效迭代,為金融 AI 應用構建起 " 可靠、可控、可優化 " 的智能中樞。
那么,為什么 AI 落地金融行業這么難?螞蟻數科又是怎么解決這些難題的?
金融不是 " 題海戰術 "
得有專業的 " 課程表 "
金融行業的特殊性在于,每個細分領域都有自己的 " 知識密碼 ":
銀行的對公業務要分析企業三表(資產負債表、利潤表、現金流量表),證券的投研需要理解 K 線形態與宏觀政策的關聯,保險的核保要掌握數百條健康告知細則等等。
而通用大模型的 " 通識教育 " ,在金融行業顯然是不夠用。
更為重要的一點在于,金融行業很多政策都是在實時變化的。
如去年 LPR(貸款市場報價利率)調整后,有銀行的 AI 客服還在按舊利率計算還款額;新的資管新規出臺,模型推薦的理財產品突然成了 " 不合規產品 "
因此,很多靜態的大模型,根本追不上金融行業的 " 政策跑速 "。
想要解決這些問題,懂行,且能 " 實時充電 " 的垂直大模型成為關鍵。
事實上,想要訓練行業大模型,就需要對行業知識進行系統化地學習,其關鍵在于一個科學、專業的任務數據體系作為 " 課程大綱 "。
基于長期深耕金融業務的經驗,螞蟻數科給 AI 量身定制一套金融專業 " 課程體系 "。其梳理出覆蓋銀行、證券、保險、基金、信托的 6 大類 66 小類任務,從 " 信用卡逾期風險預測 " 到 " 基金持倉調整建議 ",每個任務都像一門專業課,讓模型逐個攻克。
" 教材 " 已經有了,但更關鍵的則是 " 教材 " 的質量,畢竟,只有高質量的數據,才能 " 喂養 " 出高質量的 AI 大模型效果。
因此,螞蟻數科以該金融任務體系為框架,從千億級交易、風控和財富等場景中積累的真實原始數據出發、經過嚴格的質量評估、再經過專門設計的可信數據合成和 CoT 數據精標鏈路,構建了迄今已知最專業最全面的金融領域訓練數據集。
此外,通過加入原則類合成數據,確保大模型在所有任務中都遵循金融業的安全合規要求,以應對例如身份類、合規性、數據安全等問題,提升大模型的安全合規性。
這種 " 金融思維鏈 " 訓練,讓 AI 不僅能給出答案,更能說清 " 為什么這么判斷 "。
與此同時,在訓練層面,螞蟻數科也做了很多功課,如通過創新的加權訓練算法,提高大模型對復雜金融任務的學習效率與性能。在后續業務應用中,可顯著減少二次微調的數據需求與算力消耗,有效降低大模型在企業落地的門檻與成本等。
" 本質上,任何一個軟件或大模型訓練,一定要對數據或者訓練的算法有更好的工程化能力。" 王維說道," 所以我們也結合對數據訓練的實踐結果,對包括課程學習、差錯歸因分析、微調過程中算力和數據更好比例配方,如何進行調整權重等算法進行了改良。"
螞蟻數科的金融推理大模型 Agentar-Fin-R1,將這種專業訓練發揮到極致,經過專業體系數據集訓練的金融大模型,能夠達到 " 出廠即專家 "。
此外,螞蟻數科還給模型裝上了 " 進化引擎 "。
一方面通過 RAG 技術實時抓取最新政策文件、市場動態,就像給 AI 開通了 " 金融資訊 VIP 通道 ";另一方面,模型會定期 " 體檢 ",通過 Finova 評測基準自查能力缺口。比如發現對 " 個人養老金賬戶稅收優惠 " 理解不到位,就會自動生成相關訓練數據,完成針對性升級。
這種自主進化能力,讓某股份制銀行的智能投顧在新規落地當天就更新了產品推薦邏輯,避免了合規風險," 金融 AI 不能是‘一次性買賣’,得像金融專家一樣持續學習。"
因此,Agentar-Fin-R1 能夠實現不斷更新迭代,吸收最新的金融政策、市場動態等關鍵信息,并通過配套評測工具進行針對性優化,讓模型能力在真實業務場景中不斷進化。
以保險行業為例,當新的保險法規出臺,對某些險種的理賠條件或費率計算方式做出調整時,Agentar-Fin-R1 能迅速捕捉到這些變化,自動更新相關知識,并在后續處理保險業務時,按照新的規則進行準確操作,確保保險機構的業務始終符合法規要求 。
無疑,垂直行業大模型的能力問題已經解決,但最終還是要讓 AI 能夠真正嵌入業務流程。
從 " 能說話 " 到 " 會做事 "
智能體架起最后一座橋
如果說金融推理大模型是金融 AI 落地的大腦,那么智能體就是給這個大腦裝上了手腳,成為 AI 大模型落地企業業務場景中最關鍵的形態。
" 智能體的價值,不在于解決 1000 個淺層問題,而在于攻克行業深層痛點。" 趙聞飆說," 智能體要圍繞場景出發,適應企業業務場景,才能在專業知識領域價值最大化。"
事實上,智能體的核心就是將模型大腦與自動化工具結合,完成從對話到執行的躍升,這也成為智能體在產業落地的關鍵。
今年 4 月,螞蟻數科發布智能體開發平臺 Agentar,為金融機構提供一站式、全棧的智能體開發工具,基于該智能體平臺,螞蟻數科整把 AI 從 " 聊天機器人 " 變成 " 業務多面手 "。
如螞蟻數科助力上海某銀行打造的 AI 手機銀行,創新 " 對話即服務 " 模式,用戶通過自然對話即可獲取各類金融服務,這種 " 對話即服務 " 的模式,讓老年客戶滿意度提升顯著,月活用戶同比增長 25%。目前,螞蟻數科累計已服務 100% 的國有銀行和股份制銀行、超 60% 的地方性商業銀行、數百家金融機構。
而這背后就得益于螞蟻數科聯合上海銀行共同打造的 AI 客服智能體," 可以說重塑了服務的本質,通過 AI 實現了服務的宜人化。" 趙聞飆說道。
無疑,智能體成為 AI 大模型從 " 能說話 " 到 " 會做事 " 的關鍵橋梁。
這背后,是螞蟻數科智能體把大模型能力與金融業務系統無縫對接,就像給 AI 配備了 " 工具箱 ",需要算收益時調用計算器,需要查征信時對接征信系統,需要寫報告時調用文檔生成工具。
當然," 智能體背后不僅是大模型的能力,更重要的是專業度,要把專業的數據激活,所以在像金融這一類行業中,我們能夠把螞蟻的經驗輸出出來,這將是非常有價值的事情,且能夠給行業帶來更多智能體標桿應用案例。" 王維說道。
相比于其他行業,金融 AI 落地進展并不迅速,但實際上整個金融 AI 和金融智能體已經重塑了很多金融類的企業級流程,其也正從 copilot 的輔助角色,慢慢變成一個決策者角色。
" 智能體其實是改寫了軟件的底層規則,基于其泛化能力和可以自主編程代碼能力,我們也相信智能體會越來越在企業級復雜場景中大放異彩。" 王維說道。
不過,金融智能體這件事情只有進行時,沒有完成時,所以 Everything 還在繼續。
或許在不久的將來,當我們再用 AI 處理金融業務時,會忘記它是 " 人工智能 ",只覺得它是一位懂業務、守規矩、會變通的 " 老金融人 " ——這大概就是 AI 落地金融的最高境界。
光錐智能"AI 交流群 "已建立,
感興趣的朋友可以添加小助手微信(GZZN2019)溝通進群。
聯系我們
王一粟
創始人 / 主編
ID:cishicike000
商務合作請添加微信:GZZN2019
轉載開白請留言或添加微信:GZZN2019
進群交流請添加微信:GZZN2019
※添加時請備注公司 + 姓名 + 來意
「往期精彩推薦」
深度研報:
AI 大爆炸:
云計算:
數智化案例:
更多精彩內容,歡迎關注: