at length - 搜索 News

10美元成功复现DeepSeek顿悟时刻，3B模型爆发超强推理！微软论文实锤 ...

1. 荷兰研究人员Raz成功将DeepSeek的顿悟时刻复刻到3B模型上，成本仅为10美元，刷新纪录。 2. 他采用轻量级强化学习算法Reinforce-Lite，消除了对替代目标比率和旧策略模型的需求。

来自MSN10 小时

梁文锋参与发表的 DeepSeek 新论文 NSA 注意力机制，有哪些信息值得 ...

Codesign真是妙不可言啊 Dynamic sparse attention的主要问题就是如果用flashattention style的kernel写法，那么对于每个query block，需要load每个token激活的key/value block的并集，在最坏条件下是会degrade到full attention的。

腾讯网5 小时

【陈巍翻译】罗氏的伸展 DNA 测序技术

内容简介罗氏公司（Roche）推出了一种全新的高通量测序技术，名字叫“SPX”技术，是“Expansion Technology”的缩写。通过给4种碱基加上长的链子，链子上带特定序列信号，再在 DNA ...

19 小时

Oil States四季度业绩:每股收益超预期但营收不及预期

Oil States International (OIS)公布2024年第四季度业绩,每股收益 (EPS)超出预期但营收未达预期。公司报告每股收益为$0.09,高于预期的$0.075,但营收为$164.6百万,低于预期的$182.13百万。受营收不及预期影响,股价下跌4.66%至$5.12。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果