Token - 搜索 News

16 小时

不少行业专家都对UPFT寄予厚望，认为它有潜力颠覆传统的机器学习微调方法。专家指出，UPFT所引入的无监督学习理念，将进一步减少开发与训练时间成本，进而增强应用推广能力。不过，从更长远的角度来看，该技术的推广面临的挑战也不可忽视，如如何适应各种语言背景和使用场景，因此研发团队需在实际应用过程中不断优化其算法与实施策略。

18 小时

DeepSeek最高日赚346万元？官方回应→

若根据官方公布的这一理论数据测算，用每日56.2万美元的收入，减去每日8.7万美元的GPU成本， DeepSeek理论上最高每天可盈利47. 5万美元（折合人民币约346万元）。关于盈利话题， DeepSeek创始人梁文锋曾公开表示， ...

18 小时

DeepSeek亮出降价“底牌”，545%的利润率意味着什么？

持续五天的“ DeepSeek 开源周”刚结束， DeepSeek团队就在国内知乎平台注册官方账户，并在3月1日当天发布了第一条动态。这篇最新的帖子首次对外公布模了型的优化技术细节、成本利润率等关键信息。

23 小时

潞晨科技突然宣布暂停DeepSeek API服务背后：巨额亏损与成本压力

此言论一出，立刻在业界引起轩然大波。面对质疑声浪，尤洋于3月1日下午删除了相关言论，并公开道歉，承认自己情绪失控，对deepseekinfrastructure团队的技术贡献表示敬意。尽管如此，这一事件还是揭示了AI行业在追求技术创新的同时所面临的严峻挑战。

1 天

DeepSeek新研究：NSA注意力机制让推理速度飙升11倍

DeepSeek此次发布的论文详细阐述了NSA的设计理念与技术细节，这一创新机制旨在解决长上下文训练与推理中的效率瓶颈。NSA的核心策略包括动态分层稀疏策略、粗粒度的token压缩以及细粒度的token选择，这三项技术的结合不仅显著降低了预训练成本， ...

1 天

DeepSeek开源周揭秘：日赚346万只是理论？成本利润大公开！

据DeepSeek公布的数据显示，从2月27日24时至2月28日24时，其每日总成本达到了87072美元（约合人民币63万元）。而如果以DeepSeek-R1的定价来计算，其每日理论总收入将高达562027美元（约合人民币409万元），成本利润率惊人 ...

来自MSN1 天

免费使用一年的满血deepseek

【本文由小黑盒作者@国士无双吕奉先于03月01日发布，未经许可不得转载！】前文 ...

来自MSN3 天

AI产品经理红宝书：深入浅出token（3）

本系列会继续用通俗易懂的语言深入浅出为小白介绍AI知识，尤其是近年火起来的大模型、AIGC、Agent等内容，本章节内容尝试用生活中的场景解释一下使用大模型要关注的“token”。 01 Token是什么？大模型感知世界的元素 ...

3 天

不要自回归！扩散模型作者创业，首个商业级扩散LLM来了，编程秒出 ...

如此高效且达到商业级的新型语言模型自然吸引了不少关注，著名 AI 研究科学家 Andrej Karpathy 发帖阐述了这项成果的意义。他表示，不同传统的自回归 LLM（即从左到右预测 token），扩散模型是一次性向所有方向进行预测 —— ...

5 天

Anthropic发布Claude 3.7 Sonnet，3美元/百万输入token

Anthropic发布Claude 3.7 Sonnet，3美元/百万输入token,token,anthropic,claude,sonnet ...

6 天

深夜重磅！全球首个混合推理模型发布，Claude能“思考”了，实测 ...

在标准模式下，它是 Claude 3.5 Sonnet 的升级版；切换到扩展思考（Extended Thinking）模式（可简单理解为推理），它会在回答前进行自我反思，大幅提升在数学、物理、指令理解和编程等复杂任务上的表现。

21经济网6 天

千亿阿里云谋变，吴泳铭狂飙基建

当晚的电话会上，阿里巴巴集团CEO吴泳铭表示，未来三年在云和AI的基础设施投入，将超过去十年的总和。其平均每月资本开支，已超100个亿。一周前，苹果与阿里的AI合作也已确认。年初至今，浓浓AI味的阿里，股价涨幅近6成，市值突破2.6万亿港元。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果