DeepSeek在其官宣发布DeepSeek-V3.1的文章中提到,DeepSeek-V3.1使用了UE8M0 FP8 Scale的参数精度。
另外,V3.1对分词器及chat template进行了较大调整,与DeepSeek-V3存在明显差异。
DeepSeek官微在置顶留言里表示,UE8M0 FP8是针对即将发布的下一代国产芯片设计。
来源|财联社
上一篇:广立微股价回落至86.84元 半导体设备商成交额突破10亿元
下一篇:贝蒂斯全力追求安东尼:租借+买断的转会策略解析与背后故事