您现在的位置是:主页 > 买球平台 > 个人博客 >
原作者带队再次改革xLSTM,7B模子速率最快超Mam
发布时间:2025-03-21 08:53编辑:admin浏览(106)
-
比年来,年夜型言语模子(LLM)经由过程大批盘算资本在推理阶段获得懂得决庞杂成绩的冲破。推理速率已成为 LLM 架构的要害属性,市场对高效疾速的 LLM 需要一直增加。此中,采取 Transformer 架构的模子固然盘踞了主流,但在输入序列长度增添时,盘算量会呈二次方增加。因而,自上个世纪 90 年月崛起的 LSTM 东山再起,它的提出者跟奠定者 Sepp Hochreiter 在客岁 5 月推出了 xLSTM,将 LSTM 扩大到数十亿参数,成为 Transformer 的无力替换品,供给了与序列长度线性相干的盘算扩大跟稳固的内存占用。



下一篇:没有了