中國人工智慧新創 DeepSeek 宣布推出升級版 DeepSeek-V3.1 模型,不僅在處理速度上有所提升,還具備針對國產晶片的最佳化功能。
根據公司公告,DeepSeek-V3.1 採用 UE8M0 FP8 精度格式,這是一種 8 位元浮點數運算方式,可在降低記憶體佔用的同時提升運行效率,並已針對「即將推出的下一代國產晶片」進行設計。FP8 被視為新一代 AI 模型的關鍵資料處理格式,能在相同硬體條件下加速訓練與推理。
由於美國出口限制,中國企業難以取得 NVIDIA H20 等閹割版 GPU,因此 DeepSeek 也開始調整模型架構,以配合未來國產晶片的發展。此次升級同時引入 混合推理架構,用戶可透過官方平台的「深度思考」按鈕自由切換思考與非思考模式。
此外,DeepSeek 表示,經過「思維鏈壓縮訓練」後,V3.1-Think 模型在各項任務的平均表現與 R1-0528 大致相當,但輸出 token 數減少 20% 至 50%,展現更高的運算效率。
(Source:Deepseek)
DeepSeek 今年以低成本 AI 模型震撼市場,被視為中國對抗西方技術的代表。此次 V3.1 升級凸顯公司正推動 AI 模型與本土半導體的深度結合,以減少對美國技術的依賴,並鞏固中國在新興 AI 生態中的自主優勢。不過,公司並未透露支援的晶片型號或製造商。
(首圖來源:DeepSeek )
文章看完覺得有幫助,何不給我們一個鼓勵
請我們喝杯咖啡您的咖啡贊助將是讓我們持續走下去的動力
總金額共新臺幣 0 元 《關於請喝咖啡的 Q & A》 取消 確認(责任编辑:周丽淇)
精细化到每一个广告位所带来的转化量、订单销量等等。...[详细]
有些人喜欢第一种,有些人喜欢第二种,但是对于那些没有足够金钱的玩家来说,第二种模式在他们的世界观里往往意味着更加的有公平性。...[详细]
2017.1.11 新增荣耀战区系统:全新LBS玩法;开启S6新赛季。...[详细]广东省市场监管局对央视3·15晚会曝光相关问题迅速开展执法检查行动
作为婚礼,其中一些环节是可以抽离出来的,将环节分解后,选择可标准化的、sku较少的、利润较高的环节,进行互联网化,例如场地排期选择,例如司仪推介。...[详细]
问答平台就更不用说了,现在基本上只有专业的操作团队才能够留下吧。...[详细]
其中,有40家企业依然保持40%以上的增长。...[详细]世界速看:沪上黄金周|“五一”酒店搜索量达去年9倍 连锁投资加盟升温
做过BP、见过BP的都知道,前几页PPT里一定有一页跟你说“赛道”,意思就是当下的市场需求多旺盛,空间有多大。...[详细]
实际上,这几年各行各业的创业都很火热,你可以去看一下每年有多少项目拿到天使,到年底又剩下多少,绝大多数肯定是没有办法赚到钱的。...[详细]
狼人杀手机端应用的推出更加推波助澜。...[详细]
这一年,依靠流量实现用户增长的模式已被淘汰,系统正在修正,那些盲目加入创业大军的人,终会被商业法则淘汰,不留下任何踪迹。...[详细]