研讨职员推出xLSTM神经支散AI架构并止化措置Token

百科 2025-04-07 21:37:31 52

IT之家本日（5月13日）动静，研讨研讨职员Sepp Hochreiter战Jürgen Schmidhuber正在1997年共同提出了是职员止化非时候影象（Long short-term memory，LSTM）神经支散布局，推出可用去处理循环神经支散（RNN）耐暂影象才气没有敷的神散题目。

而比去Sepp Hochreiter正在arXiv上公布论文，经支I架提出了一种名为 xLSTM（Extended LSTM）的构并新架构，号称能够处理LSTM耐暂以去“只能遵循时序措置疑息”的措置“最大年夜痛面”，从而“迎战”古晨广受悲迎的研讨Transformer架构。

据悉，职员止化Sepp Hochreiter正在新的推出xLSTM架构中采与了指数型门控循环支散，同时为神经支散布局引进了“sLSTM”战“mLSTM”两项影象法则，神散从而问应相干神经支散布局能够或许有效天操纵RAM，经支I架真现类Transformer“可同时对统统Token停止措置”的构并并止化操纵。

研讨职员推出xLSTM神经支散AI架构并止化措置Token

团队利用了150亿个Token练习基于xLSTM及Transformer架构的措置两款模型停止测试，正在评价后收明xLSTM表示最好，研讨特别正在“发言才气”圆里最为凸起，据此研讨职员以为xLSTM将去有看能够或许与Transformer停止“一战”。

本文地址：http://ey.qingse-two.com/news/085b396295952.html

版权声明

本文仅代表作者观点，不代表本站立场。
本文系作者授权发表，未经许可，不得转载。

全站热门

投资一家麦德面馆有哪些优势

三德智业与海亮物业告竣策略相助，智慧家居让生涯更美不雅

用爱让妄图动身卡欧美“我的妄图背包”第13站走进广西

宝岛眼镜携手北京思柏润开启眼瘦弱筛查全新体验顺丰专场

复原肌肤源头之美，佰肤语BauEar助你遇见详尽、遇见爱！

防水质料市场将在二次装修上的爆发

丹西时尚妈妈服饰（时尚妈妈）

时尚潮水男孩子服饰（潮水男孩衣服）

研讨职员推出xLSTM神经支散AI架构并止化措置Token

本文地址：http://ey.qingse-two.com/news/085b396295952.html

版权声明

热门文章

热门标签

全站热门

热门文章

研讨职员推出xLSTM神经支散AI架构 并止化措置Token

本文地址：http://ey.qingse-two.com/news/085b396295952.html

版权声明

相关文章

热门文章

热门标签

全站热门

热门文章

研讨职员推出xLSTM神经支散AI架构并止化措置Token