他在发言中指出,当前大模型中的一大技术挑战便是开源数据的获取。开源社区的参与至关重要,沈向洋希望能有更多学术和技术贡献,在新的学习范式中共同探索,推动整个行业的进步。开源数据的缺乏限制了算法的训练和测试,进而影响到模型的性能和应用推广。在这样一个信息化的时代,鼓励开放合作,利用丰富的数据资源将成为提升模型效率的关键。
时间倒回到2024年7月,腾讯混元披露单日调用量达千亿Tokens。豆包大模型日均Tokens使用量已突破5000亿,12月,这一数据涨至超过4万亿。与此同时,腾讯未再披露其日均调用量。
在 AI 应用落地的 2024 年,腾讯和字节这两个社交媒体流量大户做AI to C几乎呈现出了完全相反的状态。这不仅仅体现在了豆包元宝的下载量差距上,也体现在了他们的C端产品矩阵形式上: ...
“DeepSeek让大家看到开源社区的胜利。把了不起的模型开源后,让更多人得到机会,在这个模型上做更多了不起的事情”。
沈向洋提到,未来最大的机会,在人和机器的关系,即人机交互。“回看过去四五十年,哪个公司抓住了人和机器的交互的入口,就会成为世界上最伟大的公司。”而自然交互,是人机交互的 新里程 碑,无论是Chatbot还是Agent,都在推动这一领域的进步。
2月24日,在上周DeepSeek宣布本周将是开源周(OpenSourceWeek),并将连续开源五个软件库后。今日上午9:30时许,DeepSeek宣布开源了本次开源周首款代码库——针对Hopper ...
从现场展示的数据来看,Grok3 在数学、科学与编程的基准测试上已经超越了目前所有的主流模型,马斯克甚至宣称 Grok 3 未来将用于 SpaceX 火星任务计算,并预测「三年内将实现诺贝尔奖级别突破」。
故事的主人公叫 Blake Anderson,而他之所以能如此猛猛吸金,靠的是三个 APP:约会指导 Rizz GPT,年收入达 250 万美元;颜值管理软件 Umax,年收入接近 500 万美元;还有一个是卡路里计算器 Cal AI,每月收入超过 ...
人们甚至不愿意多问几句阿里巴巴的电商业务。 昨日(2 月 20 日)阿里巴巴 2025 财年第三财季(2024 年第四季度)的财报电话会上,9 位分析师中仅有一位提到了与电商相关的业务,剩下的问题几乎全部与 AI 和云计算有关。 即便当季淘天集团各项数据均表现不错,营收同比增长 5%,经调整 EBITA 在连续两季度下降后重回增长,同比微增 2%。淘天线上 GMV 实现高单位数增长,客户管理收入同 ...
2月24日,阿里巴巴集团CEO吴泳铭在公开场合宣布了一项震惊业界的重大决策:未来三年,阿里巴巴将投入超过3800亿元,用于建设云和AI硬件基础设施。这一投资总额不仅超过去了阿里巴巴过去十年在相关领域的总和,更创下了中国民营企业在云和AI硬件基础设施建设领域有史以来最大规模的投资纪录。
DeepSeek宣布开源了针对Hopper GPU进行优化的高效型MLA解码核——FlashMLA,并在GitHub上已经获得了超过5000Star收藏和188个Fork。业内专家认为,对于国产GPU而言,这是一个重大利好,可以通过FlashMLA提供的优化思路和方法论大幅提升性能。FlashMLA在英伟达H800 SXM5 GPU上表现出色,能够实现3000 GB/s的内存速度和580TFLOP ...