SONNET - 搜索 News

19 小时

新研究：AI在意识到自己即将输掉国际象棋比赛时会试图“作弊”

IT之家 2 月 22 日消息，据外媒 TechSpot 21 日报道，计算机科学家发现，AI 系统能够操控国际象棋游戏，从而获得不公平的优势，部分模型甚至在没有人类干预的情况下“作弊”，引发了对未来 AI 系统诚信的担忧。

2 天

OpenAI掀「百万美金」编程大战，Claude 3.5 Sonnet狂赚40万拿下第一

OpenAI刚刚发布SWE-Lancer编码基准测试，直接让AI模型挑战真实外包任务！这些任务总价值高达100万美元。有趣的是，测试结果显示，Anthropic的Claude 3.5 ...

3 天

SONN股价触及52周新低1.38美元，市场面临挑战

在其他近期新闻中，Sonnet BioTherapeutics Holdings, Inc.在临床试验和药物开发方面取得重大进展。公司宣布完成了SON-1010的SB101第一阶段临床试验剂量递增研究，确定最大耐受剂量为1200 ...

3 天

Sonnet BioTherapeutics推进创新ADC平台研发

新泽西州普林斯顿讯 - 市值470万美元的临床阶段生物科技公司Sonnet BioTherapeutics Holdings, Inc. (NASDAQ: SONN )宣布将进一步开发其专有抗体药物偶联物 ...

3 天

OpenAI推出百万美金编程挑战，Claude 3.5 Sonnet夺冠引发热议

近日，人工智能领域再掀波澜，OpenAI发布了一项名为“SWE-Lancer”的编码基准测试，向多款AI模型发起了总价值高达100万美元的挑战。这一测试的核心目的是通过真实外包任务，评估AI在实际编码中的表现。令人惊讶的是，Anthropic的Cla ...

头部财经4 天

马斯克，重磅发布！

作为xAI推出的第三代人工智能模型，此前马斯克在发布预告时曾经称其为“地球上最聪明的人工智能”。根据最新基准测试，Grok-3在与DeepSeek-V3、GPT-4o、Gemini-2 Pro、Claude 3.5 ...

4 天

全球华人决战AI之巅！马斯克Grok 3险胜DeepSeek，疯狂启动钞能力，压力 ...

Grok-3的早期版本在Chatbot Arena中获得1400分，排名第一。Chatbot Arena是一项众包测试，让不同的AI模型相互竞争，并让用户对他们喜欢的回答进行投票。Grok-3也是有史以来第一个突破1400分的模型。

IT之家17 天

全球第一：阿里云宣布通义千问 Qwen2.5-Max 数学及编程能力登顶最新 AI ...

阿里云今日宣布，Qwen2.5-Max 在 Chatbot Arena 大模型盲测中超越 DeepSeek-V3、Open AI o1-mini 和 Claude-3.5-Sonnet 等模型，以 1332 分位列全球第七名，也是非推理类的中国大模型冠军。同时，Qwen2.5-Max 在数学和编程等单项能力上排名第一，在硬提示（Hard prompts）方面排名第二。

搜狐18 天

双引擎开源 AI 项目：DeepSeek-R1 与 Claude 3.5 Sonnet 的协同之美

随着人工智能技术的不断发展，越来越多的开源项目涌现出新的可能性。其中，DeepSeek-R1 与 Claude 3.5 Sonnet 的结合引起了广泛关注，这不仅因两者各自的强大功能，还因为它们能够通过协同工作创造出更高质量的内容。本文将深入探讨这一双引擎开源 AI 项目的 ...

51CTO29 天

Cline 3.2 重磅更新：免费调用 Claude Sonnet 3.5 和 GPT 4o，开发效率直接拉 ...

从创建与编辑文件到执行终端命令，Cline 借助 Claude 3.5 Sonnet 的代理编程能力，将开发者从繁琐的手动任务中解放出来。同时，它通过 Model Context Protocol (MCP) 支持扩展能力，可以为用户创建新的工具，进一步提升开发效率。Cline 还注重安全性，提供“人类审核”的 ...

51CTO1 个月

字节跳动豆包大模型 1.5 Pro 发布，综合得分优于 GPT-4o、Claude 3.5 Sonnet

字节跳动旗下豆包大模型 1.5 Pro 正式发布，全新 Doubao-1.5-pro 模型增强了综合能力，在知识、代码、推理、中文等多个测评基准上，综合得分优于 GPT-4o、Claude 3.5 Sonnet 等模型。 1 月 22 日消息，字节跳动旗下豆包大模型 1.5 Pro 今日正式发布，全新 Doubao-1.5-pro 模型 ...

IT之家1 个月

字节跳动豆包大模型 1.5 Pro 发布，综合得分优于 GPT-4o、Claude 3.5 Sonnet

IT之家1 月 22 日消息，字节跳动旗下豆包大模型 1.5 Pro 今日正式发布，全新 Doubao-1.5-pro 模型增强了综合能力，在知识、代码、推理、中文等多个测评基准上，综合得分优于 GPT-4o、Claude 3.5 Sonnet 等模型。目前，Doubao-1.5-pro 已在豆包 App 灰度上线，同时开发者也可在 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果