Lancer - 搜索 News

3 天

在近期的AI科技圈中，一则引人注目的消息瞬间点燃了行业热情。OpenAI发布并开源了全新标准化评估基准——SWE-Lancer，这个基准旨在测试大型AI模型的编码能力。它的发布覆盖了来自全球著名自由职业平台Upwork的1400多个软件工程任务，总价 ...

3 天

Claude挣钱强于o1！OpenAI开源百万美元编码基准，检验大模型钞能力

研究人员写道：他们的基准测试结果表明，现实世界中的自由职业工作对前沿语言模型来说仍然是一个挑战。测试显示，基础模型还无法完全取代人类工程师。尽管它们可以帮助解决漏洞，但还没有达到能够独立赚取自由职业收入的水平。

虎嗅网2 天

Intel股价单日暴涨16% 10天累涨40%创半年来新高；OpenAI 推出大模型测试 ...

2月19日消息，美东时间2月18日收盘，Intel股价大涨16.06%，创2024年8月1日以来收盘新高。美国副总统万斯表示，美国政府将保障最强大的AI芯片在美国设计与生产，吸引投资者购买Intel股票。Intel是美国唯一能生产高端AI芯片的企业， ...

来自MSN3 天

OpenAI 推出大模型测试基准 SWE-Lancer

品玩2月19日讯，OpenAI 官方宣布，推出一款全新的大模型测试基准SWE-Lancer，主要用于评测大模型的编程能力。

腾讯网3 天

OpenAI推出真实世界百万报酬AI编程能力测试基准：实测Claude 3.5 最强！

OpenAI 联合一众大佬发布了一项重磅研究，直接把目光瞄准了真实世界的软件工程！他们推出了一个全新的、价值百万美元的超硬核 benchmark —— SWE-Lancer！具体是啥，我们来扒一扒划重点：什么是 ...

腾讯网3 天

全球首测！OpenAI开源SWELancer，大模型冲击100万年薪

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！今天凌晨2点，OpenAI开源了一个全新评估大模型代码能力的测试基准——SWE-Lancer。目前，测试模型代码能力的基准主要有SWE-Bench和SWE-BenchVerified，但这两个有一个 ...

2 天

OpenAI掀「百万美金」编程大战，Claude 3.5 Sonnet狂赚40万拿下第一

OpenAI刚刚发布SWE-Lancer编码基准测试，直接让AI模型挑战真实外包任务！这些任务总价值高达100万美元。有趣的是，测试结果显示，Anthropic的Claude 3.5 ...

腾讯网7 小时

阿尔法公社

AI创投周报是阿尔法公社推出的聚焦于以生成式AI为代表的人工智能新浪潮的创投资讯周报。阿尔法公社发现和投资非凡创业者（AlphaFounders），相信非凡创业者们在技术、商业和社会方面的巨大推动力，他们指引着创投生态的风向。本图片由“千象”（网址： ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果