attention to - 搜索 News

2 天

近期，浙江省人民医院神经外科胡韶山研究团队在《Nature communications》（IF：14.7/Q1 TOP）发表了题为《Turning attention to tumor-host interface and focus on ...

1 天

YOLO已经悄悄来到v12，首个以Attention为核心的YOLO框架问世

YOLO 系列模型的结构创新一直围绕 CNN 展开，而让 transformer 具有统治优势的 attention 机制一直不是 YOLO 系列网络结构改进的重点。这主要的原因是 attention 机制的速度无法满足 YOLO ...

3 天

月之暗面MoBA核心作者自述：一个新晋大模型训练师的三入思过崖

今天，MoBA 的一位主要研发同学 Andrew Lu 在知乎发帖，自述研发过程的三次踩坑，他称为 “三入思过崖”。他在知乎的签名是“新晋 LLM 训练师”。注意力机制之所以重要，是因为它是当前大语言模型（LLM）的核心机制。回到 2017 年 6 ...

腾讯网1 小时

DeepSeek 发布开源第一弹！让 H800 GPU 性能狂飙，AI 推理加速

就在刚刚，DeepSeek 第一天的开源项目 FlashMLA 正式发布。 DeepSeek 官方在 X 平台发文称：「很荣幸能分享 FlashMLA —— 我们专为 Hopper GPU 优化的高效 MLA ...

大江网2 天

Foreign investors eye AI, robotics opportunities in China

Foreign investors have actively engaged with Chinese listed companies to gather insights on topics such as the potential impact of DeepSeek on the AI industry, future industry trends in the robot ...

腾讯网1 天

傅莹：人工智能安全合作应超越地缘政治干扰（英文）

傅莹资料图。2月12日，《南华早报》整理并发表了中国外交部前副部长傅莹在巴黎人工智能行动峰会边会上的演讲英文稿《人工智能安全合作应超越地缘政治干扰》（Cooperation for AI safety must transcend ...

5 天

国漫崛起! using AI to create your own comic avatar

Creating your own animated avatar is not just about looking cool; it's also about expressing your personality and uniqueness. By uploading a photo and selecting your desired style, you can generate a ...

15 分钟

DeepSeek 发布开源第一弹！让大模型在GPU上跑得更快

据介绍，这是DeepSeek针对Hopper GPU优化的高效MLA解码内核，专为处理可变长度序列而设计，现在已经投入生产使用。“在H800上能实现3000 GB/s 的内存带宽 & 580 TFLOPS 的计算性能。”DeepSeek说。

中青在线3 天

The Chinese Two Sessions are coming soon, the experts concern these keywords

In March, China's Two Sessions will once again attract global attention. For many foreign professionals who follow China, the ...

来自MSN11 分钟

DeepSeek开源周首日推出FlashMLA项目可以显著降低内存占用和计算开销

开源人工智能技术开发商 DeepSeek 上周已经预告将在本周陆续推出 5 个已经在生产环境中使用的技术，目前首个项目 FlashMLA 已经在 GitHub 上公布。 FlashMLA 是一种针对 NVIDIA Grace Hopper ...

11 分钟

谷歌AI掌门人Jeff Dean对话Transformer作者：AI提速300%，1000万倍工程师要来了

谷歌首席科学家Jeff Dean与Transformer作者Noam Shazeer在一场访谈中不仅揭秘了让模型速度提升三倍的低精度计算技术，分享了「猫神经元」等早期AI突破的背后故事，还大胆畅想了AI处理万亿级别Token、实现「1000万倍工程师 ...

4 天

Centerspace第四季度业绩报告：亏损扩大但股价上涨

Centerspace (NYSE: CSR)公布2024年第四季度每股亏损0.31美元,低于分析师预期的亏损0.15美元。尽管业绩不及预期,但该公司股价在盘后交易中上涨1.69%至63.30美元。第四季度营收为6570万美元,略低于预期的6586万美元。尽管第四季度业绩未达预期,但Centerspace整体表现仍显韧性。公司2024年全年核心运营资金(FFO)为每股4.88美元,显示出稳定的运 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果