gemma - 搜索 News

1 天

DeepSeek震撼发布：高性能+低成本AI模型引领普惠时代，全球AI新格局 ...

2025年1月20日，DeepSeek发布新一代推理大模型DeepSeek-R1，以极致的“性价比”在全球AI竞技场投下“技术普惠”的深水炸弹。这不仅是算法对算力的逆袭，更是开源生态对闭源生态的降维打击……随后全球47万个衍生模型在20天内破土而出， ...

腾讯网4 小时

Logic-RL: 小模型也能强推理，通过基于规则的强化学习提升大语言模型 ...

研究团队还分析了模型规模与训练效率之间的关系。结果表明，较大模型通常需要更少的训练步骤即可达到相同的性能水平，但较小模型通过更长时间的训练也能达到相近的性能上限。这种"规模-训练时间"权衡为资源受限环境下的模型选择提供了有价值的指导。

腾讯网8 天

DeepMind发布Matryoshka（套娃）量化：利用嵌套表示实现多精度LLM的低 ...

点击上方“Deephub Imba”,关注公众号,好文章不错过 !本文将介绍 Google DeepMind 提出的 Matryoshka 量化技术，该技术通过从单个大型语言模型 (LLM) ...

20 小时

【闲聊杂谈】全球首个净利润超1000亿美元的科技公司，谷歌是如何 ...

虽然近些年逐渐被苹果、微软与英伟达公司抢占了风头，但谷歌公司的表现依旧强劲。

1 天

DeepSeek开源AI新突破：超越'开放权重'，详解源代码发布计划

近日，DeepSeek在AI领域掀起了一波热潮，其发布的全新模拟推理模型不仅性能强劲，更承诺将开源代码全面透明化。这一消息让无数AI爱好者和开发者为之振奋，同时也引发了关于开源AI未来的深度讨论。今天，我们就来聊聊这个备受关注的开源计划，以及它可能带 ...

2 天

国外权威认证！DeepSeek超150万模型，成最受欢迎开源大模型

值得一提的是，R1仅用了几周的时间就超过了类ChatGPT开源鼻祖Meta发布的Llama系列，国内的开源大模型领头羊Qwen系列，以及微软开源的Phi系列，谷歌开源的Gemma系列。

21ic8 天

BleuIO如何与HibouAir进行通信来实现Gemma智能蓝牙空气质量分析

该项目演示了BleuIO如何与HibouAir进行通信，允许检索实时环境数据，而谷歌的Gemma模型处理和分析数据，通过聊天界面提供有意义的，易于理解的响应。该系统从hibouairs获取实时传感器数据，并根据环境条件提供相关建议。通过利用谷歌的轻量级Gemma模型 ...

3 天

Arm Ethos-U85 NPU：利用小语言模型在边缘侧实现生成式AI

该演示搭载了 Arm Ethos-U85 NPU ，并在嵌入式硬件上运行小语言模型。尽管大语言模型 (LLM) 更加广为人知，但由于小语言模型能够以更少的资源和较低的成本提供出色的性能，而且训练起来也更为简易且成本更低，因此越来越受到关注。

来自MSN1 天

开分9.0，年度悬疑烧脑剧实至名归！

等了三年的时间，科幻悬疑热剧《人生切割术》第二季终于归来了。作为一个忠实粉丝，这三年想必等的很煎熬。但作为普通观众，仿佛自己大脑也被分离了一样，估计已经很多人都忘记第一季讲了什么内容了。

来自MSN14 天

超算互联网上线DeepSeek-R1全家桶、API部署、Chatbot免费对话

【环球网科技综合报道】2月11日消息，为满足多方的DeepSeek模型应用需求，近日国家超算互联网平台上线了包含：DeepSeek-R1全家桶、最高671B满血版的API部署与AI Web应用、Chatbot可视化对话界面服务，并就DeepSeek模型开发等提供7x24小时专业技术团队服务支持。目前，超算互联网平台提供的DeepSeek-R1全家桶模型，无需部署即可一键体验DeepSeek-R1 ...

Lianhe Zaobao3 天

国家美术馆餐饮大换血七家不获续租仅两家保留

为确保提供价格实惠和多元餐饮服务，新加坡国家美术馆启动餐饮租户大换血行动，现有九家餐饮业者在提出营运新提案后，只有两家获保留，七家在租约到期后无法续约，必须结束营业。

中文科技资讯2 天

DeepSeek超150万模型，成最受欢迎开源大模型

对于通用数据，则采用奖励模型来捕捉复杂和微妙场景中的人类偏好。基于 DeepSeek-V3的流程，采用类似的偏好对和训练提示分布。在评估有用性时，仅关注最终总结，确保评估重点在于响应对用户的实用性和相关性，同时尽量减少对底层推理过程的干扰; ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果