2024-11-01 01:34:26 3
IT之家 10 月 31 日訊息,百川大模型公眾號今日發文宣佈,百川智慧推出一站式大模型商業化解決方案,包含全鏈路通用訓練資料,Baichuan4-Turbo、Baichuan4-Air 兩款模型和全鏈路領域增強工具鏈,可幫助企業實現低成本私有化部署,實現高達 96% 的多場景可用率。
據悉,該方案具備“工具豐富、響應快速、效果顯著、成本低廉”的特性,在 Baichuan4-Turbo、Baichuan4-Air 的基礎上,再結合超參動態搜尋和自適應配比等演算法,與企業私有資料混合微調,兩個模型多場景下的可用率可獲得極大提升,在金融、教育、醫療等場景下的專業細分任務的平均可用率高達 96%。
IT之家附兩個模型的主要特徵如下:
Baichuan4-Turbo—— 探索複雜場景:
文字生成、知識問答、多語言處理、資料分聚類等核心能力均有顯著提升,其中資訊摘要總結能力大幅提升了 50%;
只需 2 卡 4090 的算力即可完成部署;
推理成本只有 Baichuan 4 的 15%;
相較 Baichuan 4 首 Token 速度提升 51%、Token 流速提升 73%;
Baichuan4-Air—— 經過驗證的較大規模流量的場景:
效果與 Baichuan 4 基本持平;
推理成本僅為 Baichuan 4 的 1%;
百萬 Token 只需 0.98 元;
相較 Baichuan 4 首 Token 速度提升 77%、Token 流速提升 93%;
官方更表示,在相同訓練資料下,Baichuan4-Air 不僅時效率更高,效能也大幅領先於 GPT4-style、Mixtral-style 結構的 MoE 模型。
目前,該方案能夠高效適配英偉達 4090 / A / H 系列、華為昇騰、寒武紀、高通、MTK、天數等多種主流晶片。
2024-11-03 2 人在看
2024-11-02 2 人在看
2024-11-02 2 人在看
2024-11-02 2 人在看
2024-11-02 1 人在看
2024-11-02 1 人在看
2024-11-01 2 人在看
2024-11-01 1 人在看