搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
房地产
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
时间不限
过去 1 小时
过去 24 小时
过去 7 天
过去 30 天
按时间排序
按相关度排序
虎嗅网
3 小时
谷歌ViT核心骨干集体投奔OpenAI:他们为Sora打下基础
明敏、白小交,题图来自:AI生成爆炸消息:ViT三大核心作者集体离职谷歌DeepMind。下一站:OpenAI!他们分别是翟晓华、卢卡斯·拜尔、亚历山大·科列斯尼科夫。相关消息已被本人证实,三人均官宣了新动向。2021年,他们三人作为共同一作的计算机 ...
5 小时
刚刚,三名谷歌Vision Transformer作者官宣加入OpenAI
在 DeepMind 工作期间,Beyer 似乎一直在密切关注 OpenAI 发布的研究成果以及该公司卷入的公共争议,他经常在 X 上向自己的 7 万多名粉丝发布相关信息。去年,当首席执行官 Sam Altman 被 OpenAI ...
6 小时
谷歌Vision Transformer三位创作者加盟OpenAI:多模态AI研究再添强劲动力
近日,OpenAI宣布重磅人事变动,三名来自谷歌DeepMind的资深研究科学家翟晓华、Lucas Beyer和Alexander ...
8 小时
揭秘注意力机制真正起源,10年前3项研究几乎同时独立提出,背后 ...
现在,这项研究背后更多细节被公开了!来自Karpathy与真正作者两年前的邮件往来,引起了很多讨论。 一作Dzmitry Bahdanau,当时是Bengio实验室的一位实习生,在实习只剩5周时灵光一现提出了一个简化方案,相当于实现了对角注意力。
9 小时
on MSN
RockAI Yan大模型:非Transformer架构首获网信办备案,AI技术新突破!
上海岩芯数智人工智能科技有限公司(RockAI)近期宣布,其自主研发的Yan架构大模型已成功通过国家互联网信息办公室发布的《生成式人工智能服务管理暂行办法》备案。这一成就标志着Yan架构大模型成为国内首个通过备案的非Transformer架构、非At ...
腾讯网
9 小时
揭秘注意力机制真正起源!10年前3项研究几乎同时独立提出
一作Dzmitry Bahdanau,当时是Bengio实验室的一位实习生,在实习只剩5周时灵光一现提出了一个简化方案,相当于实现了对角注意力。 Pytorch等经典代码中,正是把注意力称为Bahdanau Attention,还保留着他贡献的痕迹。
9 小时
被忽略的起点?Karpathy揭秘最初的注意力论文被Transformer光芒掩盖的故事
其中最值得注意的一个故事是真正首次提出注意力机制的论文其实是 Dzmitry Bahdanau、Kyunghyun Cho 和 Yoshua Bengio 的《Neural Machine Translation by Jointly ...
10 小时
RockAI国内首个「非Transformer架构大模型」Yan通过网信办备案
近日,上海岩芯数智人工智能科技有限公司 (以下简称RockAI)的Yan架构大模型成功通过《生成式人工智能服务管理暂行办法》备案,这是国内首个非Transformer架构大模型通过备案。
15 小时
惊掉下巴!被字节起诉800万实习生,拿下NeurIPS 2024最佳论文
太戏剧了!攻击字节训练集群的实习生,居然刚刚获得了NeurIPS 2024最佳论文奖?虽然看起来像爽文剧情,但这位高材生接下来的路,应该是难走了。 刚刚,恶意攻击字节训练集群的实习生田柯宇,获得了NeurIPS 2024的最佳论文奖。
16 小时
揭秘AI大模型的基石:Transformer如何推动全球智能革命
在人工智能领域,Transformer作为一种革命性的技术架构,成为了大型语言模型(LLM)和各种语言处理应用的核心。自2017年被提出以来,Transformer不仅提升了自然语言处理(NLP)领域的创新性,还推动了智能写作、智能营销、智能对话等多 ...
人人都是产品经理 on MSN
16 小时
AI大模型的基石——Transformer
现有的大模型几乎都是在Tranformer的基础上开发的,可以说Tranformer就是大模型的基石。这篇文章 […] ...
16 小时
Andrej Karpathy 首次公开私人邮件:揭秘Transformer 注意力机制真相
注意力机制的本质是一种“数据依赖的加权平均”,是一种灵活、高效的全局池化操作。它的提出不仅是技术上的突破,也反映了人类认知的深刻影响。正如 Andrej Karpathy 所评价的:“注意力是一种重大解锁,是神经网络架构设计的一次飞跃。” ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈