國產AI大模型正迎來一波密集的“開源潮”。7月30日,南都灣財社記者從中興通訊方面獲悉,其宣布一次性開源11項核心技術成果,包括6個自研大模型和5個行業數據集。
在開源的6個大模型中,NTele-R1-32B-V1電信大模型是其中的焦點。該模型使用約800個經過篩選的樣本進行訓練,“小樣本高效訓練”的模式,為降低AI開發成本提供了新的可能性。中興通訊AI研發中心負責人表示,“NTele-R1-32B-V1 是從 DeepSeek-32B-Distill訓練的,實現了‘少而精’的訓練效果。”目前,該數據集已同步開源,開發者可直接獲取用于模型優化。
針對多模態領域,中興通訊開源了7B和3B參數的兩款模型。這兩款模型通過“課程強化學習”與“拒絕樣本自我改進”機制,使小參數模型獲得與更大規模模型相近的推理能力。該技術路徑適用于智能終端、邊緣計算等計算資源受限的場景。
同步開源的5個數據集中,TFCE數據集是為電信行業AI開發設計的函數調用測評工具。據介紹,該數據集整合了中興通訊的技術積累,包含1800余個函數和917道Python題目,覆蓋了4G到6G的核心技術應用場景。
此次開源是在“煥新社區”的背景下。據悉,“煥新社區”是由國務院國資委指導、中國移動牽頭運營的國家級AI開源開放平臺,也是國家推動AI自主生態建設的最新舉措之一,中興通訊此次開源的項目,成為該平臺收到的首批核心技術。
中興通訊高級副總裁張萬春表示,中興將以技術開源為紐帶,在模型創新、算力優化、場景落地三大領域深度參與,為中國AI自主可控體系提供支撐。
從行業來看,AI技術的競爭正從單一的模型能力比拼,延伸至涵蓋軟硬件適配和開發者生態的全方位競爭。開源協同,正成為構建自主技術體系的關鍵路徑。
事實上,這股“開源潮”在近期的世界人工智能大會上表現得尤為明顯。大會期間,階躍星辰便宣布其新一代基礎大模型Step-3將于7月31日向全球開源。與此同時,阿里云也在此前透露其通義千問模型開源后下載量已突破4億次。值得注意的是,開源正與國產算力深度綁定,階躍星辰聯合華為昇騰、沐曦等近10家國產芯片企業共同發起了“模芯生態創新聯盟”,旨在構建從芯片到模型的協同創新體系。
這一趨勢背后,是國內大模型產業從追求“通用”到深耕“垂直”的集體轉向。“通用大模型好比是大學生,知識面廣但解決不了專業問題。行業現在需要的是有深厚領域知識的‘專科博士’,”一位AI行業分析師向南都灣財社記者表示,“開源電信模型和數據集,價值不在于參數大小,而在于其高度的專業性和稀缺性,這正是產業應用需要的東西。”
此外,高質量的國產開源模型生態,也被視為激活國產AI芯片產業鏈的關鍵。過去,國產AI芯片廠商在追趕英偉達時,不僅面臨硬件性能的差距,更受制于CUDA生態的壁壘。
“沒有好用的模型和工具鏈,我們的芯片就只是‘裸奔’的硬件。”一家國產AI芯片公司的技術負責人對記者坦言,“開源的這些適配好的模型,為我們提供了一個完整的測試和優化靶場,能夠加速軟硬件一體化的進程,這是打破國外生態壟斷的必要一步。”
行業分析指出,這種由國家級平臺牽引、龍頭科技企業貢獻核心技術的“國家隊+主力隊員”協同模式,正成為國內AI產業發展的新趨勢。通過開源共享,可以降低創新門檻,加速技術迭代和應用落地,推動中國AI產業從“技術跟跑”向“生態領跑”進行轉變,為構建自主可控的AI技術體系提供支撐。