distilation - 搜索 News

2 天

这篇推文是由美国著名TMT（科技、媒体和通信）投资人Gavin Baker发布，马斯克对此评论道：“分析得很好”。那么，下面就让我们来看下Gavin Baker究竟表达了什么内容。

10 天

近日，上海AI实验室（上海AI Lab）在数学推理领域取得重大突破，通过强化学习（Reinforcement Learning，简称RL）技术，成功在数学推理能力上超越了DeepSeek，这一成果引发了广泛关注。上海AI ...

12 天

【新智元报道】在一项开创性的研究中，苹果公司与牛津大学的科学家们共同提出了一个名为「蒸馏扩展定律」的理论。通过深入实验，他们详细分析了知识蒸馏（Distillation）与监督学习（Supervised Learning）之间的优劣，以及模型性能与计算资源之间的内在关系，探索全新的模型优化路径。

机器之心报道机器之心编辑部蒸馏模型的性能可以量化估算了。众所周知，知识蒸馏技术当前正被大模型领域广泛使用，它可以在大幅压缩模型体量的同时保持一定的性能、降低模型时延、提升模型精度，与此同时还能对知识域进行集成和迁移。近日，苹果研究人员提出了一种蒸馏扩 ...

TrendForce集邦咨询研究指出，DeepSeek采用蒸馏模型（Model Distillation）技术，压缩大型模型以提升推理速度并降低硬件需求，同时充分发挥英伟达Hopper降 ...

英国金融时报稍早报导，OpenAI公司表示，已掌握DeepSeek疑似对ChatGPT使用「蒸馏」（distillation）技术的证据，这一技术可让AI开发者利用更大、更强的 ...

已掌握疑似DeepSeek利用“蒸馏”（distillation）技术的证据。OpenAI是聊天机器人ChatGPT的开发商。蒸馏技术可让开发者利用更大、更强的模型输出成果 ...

「除了 Claude、豆包和 Gemini 之外，知名的闭源和开源 LLM 通常表现出很高的蒸馏度。」这是中国科学院深圳先进技术研究院、北大、零一万物等机构 ...

一些您可能无法访问的结果已被隐去。