TOKEN - 搜索 News

微软发布3.48T token训练数据集+高质量处理管线，覆盖通用、代码 ...

在当前大模型训练耗尽了越来越多可用数据的状况下，高质量训练数据的重要性日益凸显。前不久，微软研究院公布了一项名为 REDSTONE 的开源项目，提供了一套完整的数据处理框架，包括通用领域和特定领域数据的处理脚本，以及经过筛选的高质量 Common ...

2 天

未来AI发展的关键：低精度计算与数万亿token的挑战

随着技术的进一步成熟，能够处理多个上下文的模型逐渐成为现实。例如，现今的神经网络已能应对数百万token的输入，这相当于分析数百页的PDF文档。然而，更具挑战性的目标在于处理数万亿token的信息，这将使AI可以分析并整合整个互联网的数据，满足用户个 ...

6 天

模型预训练模式“变天”？Meta推出预训练框架，训练token减少21.5%

近日，通过结合“预测下一个 token”概念与连续概念，Meta 提出一款名为“连续概念混合（CoCoMix，Continuous Concept Mixing）”的预训练框架。（注：连续概念，指的是连续思维链技术，这是一种旨在提升模型推理能力的方法 ...

1 小时on MSN

DeepSeek新研究：NSA注意力机制，让推理速度飙升11倍！

在科技界风起云涌的浪潮中，一项新兴的研究成果犹如一股清流，迅速吸引了业界的广泛关注。近日，DeepSeek研究团队携其最新力作——一种名为NSA的全新注意力机制，强势回归，与马斯克发布的Grok 3形成了鲜明的对比，两者热度不相上下。

腾讯网7 小时

Llasa TTS：基于LLAMA 8B 大模型微调，打造顶尖语音克隆效果

今天要为大家隆重介绍一款在语音合成领域取得重大突破的新型 TTS 模型—— Llasa 8B。这款模型由香港科技大学（HKUST）倾力打造，基于强大的 LLaMA 8B 大语言模型进行微调，专注于实现极致的语音克隆效果，并支持令人惊艳的中英双语生成能力。Llasa 8B 并非横空出世，它巧妙地选择了 Meta 公司开源的 LLaMA 8B ...

来自MSN6 天

嚯！大语言扩散模型来了，何必只预测下一个token | 人大高瓴&蚂蚁

明敏发自凹非寺量子位 | 公众号 QbitAI 用扩散模型替代自回归，大模型的逆诅咒有解了! 人大高瓴人工智能研究院、蚂蚁共同提出LLaDA（a Large Language Diffusion with mAsking）。

中华网8 小时

DeepSeek播种，阿里云“收割”？

2月20日，阿里发布2025财年第三季度业绩报告（截至2024年12月31日止）。报告期内，阿里云实现营收317.42亿元，同比增长13%，相比上一季度7%的增速接近翻倍。整体收入（不计来自阿里巴巴并表业务的收入）实现双位数同比增长11%。调整后EB ...

21经济网1 小时

千亿阿里云谋变，吴泳铭狂飙基建

当晚的电话会上，阿里巴巴集团CEO吴泳铭表示，未来三年在云和AI的基础设施投入，将超过去十年的总和。其平均每月资本开支，已超100个亿。一周前，苹果与阿里的AI合作也已确认。年初至今，浓浓AI味的阿里，股价涨幅近6成，市值突破2.6万亿港元。

GitHub6 天

GLM AI Free 服务

支持GLM-4-Plus高速流式输出、支持多轮对话、支持智能体对话、支持Zero思考推理模型、支持视频生成、支持AI绘图、支持联网搜索、支持长文档解读、支持图像解析，零配置部署，多路token支持，自动清理会话痕迹。与ChatGPT接口完全兼容。打开智能体的聊天界面 ...

GitHub6 天

LLM-Red-Team/emohaa-free-api

支持高速流式输出、支持多轮对话，零配置部署，多路token支持，自动清理会话痕迹。与ChatGPT接口完全兼容。此链接仅临时测试功能，不可长期使用，长期使用请自行部署。每次请求服务会从中挑选一个。 Docker部署请准备一台具有公网IP的服务器并将8000端口 ...

中国家电网11 小时

阿里云与AI业务齐发力 DeepSeek冲击下行业格局生变

在 AI 大模型领域，春节期间 DeepSeek 发布的一系列动作，重新点燃行业热情。李飞飞利用开源大模型 Qwen，以低成本复刻 DeepSeek-R1 模型性能;苹果与阿里通义合作，为国内手机提供 AI 服务，均获得市场高度认可。DeepSeek 接连开源 671B 参数的 MoE 模型 “DeepSeek-V3”、对标 OpenAI o1 的 “DeepSeek-R1” 和代码模型 ...

IT之家6 天

听力熊 AI 虚拟伙伴“哪吒”单日对话量突破 28 亿 token，领跑青少年 ...

在《哪吒 2》票房突破 100 亿元、跻身全球动画影史前三之际, 听力熊旗下 AI 虚拟伙伴“哪吒”同步缔造行业里程碑 —— 上线首日角色对话量飙升至 28 亿 token, 刷新国内 AI 交互终端单日调用量纪录。这一数据不仅印证了产品强大的用户吸引力, 更彰显了其在多 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果