2月25日,360集团创始人周鸿祎受清华大学邀请,进行了一场主题为“DeepSeek给我们带来的创业机会”的授课。他以DeepSeek带来的变革为切入点,剖析AI行业发展趋势,并分享了AI技术于创业的应用前景。
近年来全球人工智能技术加速迭代,中国的大模型企业展现出强大的创新活力。尤其DeepSeek-R1模型的横空出世,不仅以一系列颠覆式创新重新定义了行业标准,更为全球范围内的AI普惠与产业升级提供了全新路径,也因此成为近期AI创业领域无可比拟的焦点所在。
从早期GPU加速深度学习,到如今大规模预训练模型的突破与演进,开发者与算力已构建起深度协同的创新生态。2月21日至23日,以“模塑全球 无限可能”为主题的2025全球开发者先锋大会(GDC)在浦江之畔隆重举行。大会聚焦大模型、算力、语料、工具及软件平台等前沿技术,汇集Hugging Face、华为、微软、CSDN、阿里魔搭社区等头部平台在内的国内外100家开发者社区及各界专家代表,共同探索开发者在 ...
就在刚刚,Anthropic祭出首个混合推理Claude 3.7 Sonnet,堪称扩展思考模式的最强模型。在最新编码测试中,新模型暴击o3-mini、DeepSeek R1,AI编码王者出世了。
经常打游戏的朋友肯定知道,近期最火的游戏插件莫过于补帧软件 Lossless Scaling 小黄鸭了。它可以通过补帧的方式直接让游戏的帧数翻倍,想比起大几千显卡的才有的 DLSS 而言,这软件只需要 29 元,史低甚至只要 4 元(不过是很久之前了 ...
在自然语言处理领域,一个引人瞩目的现象正在显现:传统的通过增加模型规模和数据量来提升性能的Scaling Law似乎已逼近瓶颈。业界开始担忧,单纯依赖这种策略或许已难以带来显著的性能飞跃,低精度训练和推理正使得模型性能提升的边际效益逐渐递减。然而,在自然语言处理遭遇挑战的同时,多模态模型领域却似乎尚未触及这一限制。
而2025年,全球企业生成式人工智能支出预计将达到691亿美元,2028年超过2022亿美元,2023-2028年五年年复合增长率为59.2%。
近年来,人工智能的迅猛发展仿佛在昭示着一场新的技术革命,而在这场革命的背后,Scaling Law理论为我们理解AI模型性能与规模之间的关系提供了重要的视角。Scaling Law的核心要素包括数据、算法和算力。这一理论最早由百度硅谷人工智能实验室于2017年提出 ...
首个FP4精度的大模型训练框架来了,来自微软研究院! 在相同超参数的设置下,可以达到与FP8以及BF16相当的训练效果。 这意味着所需的存储和计算 ...
产品侧:人形机器人,AI眼镜,智能驾驶,AI陪伴 技术侧:Inference-Scaling,视频生成,AI Coding,空间智能 这是编辑部在纵观岁末年初全球各式各样的 ...