dataSet - 搜索 News

Vision Transformer中的图像块嵌入详解：线性投影和二维卷积的数学原理 ...

点击上方“Deephub Imba”,关注公众号,好文章不错过 !Transformer 架构因其强大的通用性而备受瞩目，它能够处理文本、图像或任何类型的数据及其组合。其核心的“Attention”机制通过计算序列中每个 token ...

腾讯网22 小时

【新刊速递】《亚太国际关系》(IRAP), Vol. 25, No. 1, January 2025 | 国政学人

期刊简介《亚太国际关系》是在该领域出版最佳原创研究的重要国际期刊。该刊于 2001 ...

6 天

现场视频：二战遗留美制炸弹在日本宫崎机场爆炸

特朗普称普京希望结束俄乌战争 ...

3 天

DeepSeek团队推出代码思维链，助力大模型推理能力全方位提升

近年来，人工智能（AI）技术的快速发展引发了各界的广泛关注，尤其是在大模型的推理能力方面。中国的DeepSeek团队近日发布了一项划时代的研究成果，成功将代码转化为思维链，进而提升了大模型在各类推理任务中的表现。

小黑盒生活 on MSN3 天

博导私藏的DeepSeek论文指令被我挖到啦🔥

▫ ️当我把「暴躁导师」人设喂给AI：【输入咒语】"现在扮演纳米材料领域毒舌教授，用红色标注我论文中3个最智障的结论" （第二天收到批注："这段实验设计，狗看了都得汪两声"😅） ▫ ️当SCI润色开启贵族模式：【输入咒语】"把'我们发现效果很好 ...

生物通1 天

解锁伊朗 ILI “时空密码”：超 10 万病例大数据助力公共卫生防控新 ...

为解决 ILI 地理传播和季节性机制不明、缺乏精准防控数据的问题，马什哈德医科大学研究人员开展伊朗 2015 - 2019 年 ILI 通知研究，获全面数据集。该成果助力分析 ILI 模式，对防控意义重大，值得科研读者一读。

头部财经2 天

Chinese Companies Open-Source AI Models as Computing Power Rises

On the same day, Kunlun Wanwei, a leading Chinese Internet company, also released two open-source video generation models—SkyReels-V1 for AI short films and SkyReels-A1 for facial action control.

6 天

直逼DeepSeek-R1-32B，碾压李飞飞s1，UC伯克利等开源全新SOTA推理模型

【导读】近日，斯坦福、UC伯克利等多机构联手发布了开源推理新SOTA——OpenThinker-32B，性能直逼DeepSeek-R1-32B。其成功秘诀在于数据规模化、严格验证和模型扩展。

生物通3 天

中国海洋表层原核生物多样性最新数据集发布，解锁海洋生态奥秘新 ...

为解决中国海洋原核生物多样性研究不足的问题，厦门大学的研究人员开展中国海洋表层原核生物多样性研究，构建数据集，揭示其多样性和群落结构。该成果为海洋生态研究提供关键数据，强烈推荐科研人员阅读。

First Online on MSN3 天

伊隆·马斯克推出 Grok 3：人工智能的新前沿

Il multimiliardario annuncia il lancio della nuova versione del chatbot sviluppato dalla sua società che promette di superare ...

2 天

我们应如何看待DeepSeek的557.6万美元训练成本？

简单来说，DeepSeek-V3仅使用了2048块英伟达H800 GPU，耗费了557.6万美元就完成了训练，相比同等规模的模型（如GPT-4、GPT-4o、Llama 3.1），训练成本大幅降低。

财富中文网6 天

人工智能侧重英语，使许多国家处于不利地位

Aleph Alpha首席研究官亚瑟·贾迪迪（Yasser Jadidi）指出：“大多数享有全球知名度的模型开发工作都侧重于英语。这是由于绝大多数可获取且可访问的互联网文本数据都是英文的，这使得其他语言处于不利地位。” ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果