科大訊飛昇級星火大模型,持續推動AI大模型產業化應用

2024-10-27 01:35:02 5

有“通用大模型國家隊”之稱的科大訊飛,再次升級大模型能力。

10月24日,第七屆世界聲博會暨2024科大訊飛全球1024開發者節開幕式上,科大訊飛董事長劉慶峰釋出了訊飛星火4.0 Turbo。

劉慶峰介紹稱,訊飛星火4.0 Turbo全新升級,根據鮮活的真實資料背靠背測試,七大能力全面超過GPT-4 Turbo,數學能力、程式碼能力超過GPT-4o,國內外中英文14項主流測試集中實現9項第一。

釋出會現場,科大訊飛還展示了大模型在多模態互動能力上的進展。據瞭解,在原有的遠場高噪、全雙工、多語種多方言能力上,此次升級了多模態能力,新增了超擬人和個性化能力,實現了語音、影片、圖文全部聯動的多模態互動。

算力方面,科大訊飛一直堅持基於國產算力打造自主可控通用大模型底座。去年10月,科大訊飛曾聯合華為推出首個國產萬卡規模大模型算力平臺“飛星一號”。

本次釋出會上,科大訊飛、華為、合肥市大資料資產運營有限公司三方聯合打造的國產超大規模智算平臺“飛星二號”也正式啟動。劉慶峰表示,此次啟動升級版的“飛星二號”,將帶來新模型新演算法的持續適配和智算叢集規模的再次躍遷,引領國產大模型底座的發展、給世界提供第二選擇。

今年以來,有一批大模型公司停下了預訓練的腳步。預訓練模型是大模型公司的底層核心技術,停了通常意味著走下了牌桌。透過升級星火模型和啟動新智算平臺,科大訊飛傳達了持續預訓練的態度和信心。

科大訊飛研究院院長劉聰在接受36氪採訪時表示,訊飛的大語言模型會堅持迭代,在類似於o1大模型、多模態互動、語音端到端等方面持續佈局。

劉聰坦言,訊飛的算力規模不及頭部大廠;使用國產算力平臺,也需要花費不少額外精力進行適配等工作,但訊飛堅持基於國產算力打造和升級自主可控的通用底座大模型,在國內晶片和算力叢集相較於國外領先水平有一定差距的情況下,做出了可觀的效果。

據介紹,在過去一年多的實踐中,星火大模型在“飛星一號”上的訓練推理效能不斷最佳化,部分測試集表現甚至超過國際領先的GPT-4 Turbo。

在大模型產業化應用方面,科大訊飛一直推進積極,致力於“用人工智慧技術解決社會剛需”。公開資訊顯示,今年1-9月,科大訊飛成功中標38個專案,披露的中標金額為2.16億元,專案數量和金額,均在行業內排名首位。

“未來AI技術的探索,必須大規模產業化,必須在場景中進入到真正的深水區,所有玩‘概念’的都不會有大未來。”劉慶峰在演講中表示。

釋出會上,基於訊飛星火底座能力,科大訊飛面向教育、醫療、司法、政務服務、企業辦公等多個行業場景釋出了最新的產品應用。據悉,截至2024年10月,科大訊飛已與各頭部企業共建20多個行業大模型,覆蓋了300+應用場景。