性能 capability - 搜索 News

作者：answer论文原文链接: https://arxiv.org/pdf/2501.12948作者原文链接：https://zhuanlan.zhihu.com/p/205302041461、Approach先前的大型语言模型（LLMs）相关的很多工作里都依赖大量的人工标注的数据去提升模型性能。但在Deep Seek R1这篇论文中指出：模型的推理能力（reasoning capabiliti ...

来自MSN1 天

通用：硅含量更高的电动汽车电池即将问世

盖世汽车讯据外媒报道，通用汽车电池研发总监George Cintra在接受采访时表示：“向硅负极技术演进的趋势已经开始。未来，电动汽车电池中将会融入更多硅材料，因为它能提升续航里程，并有助于提升快充性能。” 体积更小、续航更长、充电性能更优，这已经成为了整个电动汽车电池行业共同追求的目标。为了实现这一目标，汽车制造商和电池企业正在探索多种潜在的解决方案。其中，硅负极技术将成为关键路径之一。在电 ...

15 小时

DeepSeek崛起，如何影响AI技术发展路径与国际竞争格局？

2025年以来，中国人工智能初创企业深度求索（DeepSeek）迅速崛起，引发全球科技界、投资界与政策界热议——DeepSeek于2025年前后分别推出开源通用模型DeepSeek-V3与推理模型DeepSeek-R1，其在数学、编码、推理等方面的表现可以媲美甚至优于OpenAI等科技巨头推出的前沿模型，在硬件条件有限的情况下大幅提高训练效率并成功缩减算力成本。

2 天

一文讲透关于DeepSeek的7个核心问题

DeepSeek技术创新的答案，在2024年底和2025年年初发布的两篇技术报告——《DeepSeek-V3 Technical Report》、《DeepSeek-R1:Incentivizing Reasoning Capability in ...

腾讯网1 天

Z Tech｜关于DeepSeek部署的一切，都在这里

得益于量化技术（GPTQ、AWQ）、推理框架优化（vLLM、TensorRT），DeepSeek的显存需求相比其他大模型可降低约30～70%。

中国科学院1 天

快速增强台风预测研究获进展

台风快速增强定义为24小时内最大持续风速增加超过13米/秒，是台风突变致灾的主要原因。然而，快速增强事件仅占所有台风事件的5%，且受复杂物理机制影响，因此传统的数值和统计模型的预报准确率仅为50%。现有深度学习模型将预报准确率提升至82%，但误报率达27%。

3 天

DeepSeek：掀起人工智能革命的七大核心问题

作为全球AI行业吸引眼球的明星，DeepSeek的热度在最近的巴黎AI峰会上攀升至顶点。这场盛会让各界专家和企业纷纷聚焦这家中国企业，大家纷纷猜测DeepSeek凭借其超强推理模型，将如何改变行业格局。根据《纽约时报》的报道，DeepSeek的强大引擎震撼了全球市场。过去一个月间，已有超过一百家中国公司宣布接入DeepSeek，这些公司覆盖了从硬件制造到应用开发的多层次生态圈。

中時新聞網3 天

美国空军机队妥善率创20年最低！F-22、F-35为主因

本周二（18日）公布的最新数据显示，美国空军2024财年的机队妥善率（Mission Capable ...

来自MSN5 天

至顶智库 | 图文并茂万字解读DeepSeek核心技术概念

DeepSeek（深度求索）是一家源自中国的人工智能公司，成立于2023年，总部位于中国杭州。前身是国内量化投资巨头幻方量化的子公司。公司专注于开发低成本、高性能的AI模型，致力于通过技术创新推动人工智能技术的普惠化。DeepSeek由幻方量化提供研发资金。独特的经营模式使DeepSeek能够在没有外部压力的情况下持续开展大模型研发，优先考虑大模型的长期研发价值。DeepSeek在深度学习、强化学 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果