三体AI日报
2026/5/26
MAY 2026三体AI日报
23周六

三体AI日报 2026-05-23

NVIDIA发布Nemotron-Labs扩散语言模型,支持三种生成模式

#1

NVIDIA发布新型Nemotron-Labs扩散语言模型,支持自回归、扩散和混合三种生成模式,显著提升文本生成速度,向光速推理目标迈进。该模型可通过Hugging Face获取。

正文

NVIDIA发布Nemotron-Labs扩散语言模型,这是一种新型扩散语言模型(Diffusion Language Model),支持三种生成模式:自回归、扩散和混合模式。该模型旨在实现更快的文本生成速度,向光速文本生成目标迈进。模型可通过Hugging Face和SGLang部署推理。

NVIDIA发布Nemotron-Labs扩散语言模型,支持三种生成模式 素材

Qwen3.7-Max在俄罗斯方块Agent测试中击败Opus 4.7和GPT-5.5

#2

最新测试显示,阿里Qwen3.7-Max在一个真实Agent任务中击败了Claude Opus 4.7和GPT-5.5。该测试要求模型编写能自我训练的俄罗斯方块机器人,10轮迭代后Qwen3.7-Max表现最优。

正文

atomic.chat测试显示,Qwen3.7-Max在一个真实Agent任务中击败了Opus 4.7和GPT-5.5。该任务要求模型编写一个能自我训练俄罗斯方块机器人,模型需读取自己代码、运行基准测试并重写,经过10轮迭代后比较最终机器人表现。

Anthropic发布Project Glasswing初始更新

#3

Anthropic发布Project Glasswing初始更新,这是该公司的重要AI研究项目,旨在推进AI系统的能力和安全性。

正文

Anthropic发布Project Glasswing初始更新。这是Anthropic的重要AI研究项目,旨在推进AI系统的能力和安全性。该更新将分享项目的研究进展和技术细节。

Anthropic发布Project Glasswing初始更新 素材

Runway发布Aleph 2.0,支持单帧编辑自动贯穿全局

#4

AI视频编辑领域重大更新:Runway发布Aleph 2.0,被评价为目前最佳视频编辑器。该工具支持单帧编辑并自动贯穿应用到整个视频,用户可以预览单帧修改效果,AI会自动将修改应用到视频其余部分。

正文

Runway发布Aleph 2.0视频编辑工具,这是目前最佳的视频编辑器。该工具支持单帧编辑并自动贯穿应用到整个视频,用户可以在Edit Studio中预览修改效果后,AI会自动将修改应用到视频的其余部分。

阿里Qwen嵌入淘宝客服系统 助力交易成交

#5

阿里巴巴将Qwen AI嵌入淘宝,客服AI能完成交易而非仅回答问题。

正文

阿里巴巴将Qwen应用嵌入淘宝商业栈,AI客服不仅回答问题还能完成交易。数千亿token驱动智能店小蜜,取代传统脚本聊天机器人,处理复杂对话并完成销售。

阿里Qwen嵌入淘宝客服系统 助力交易成交 素材

中国AI首次完整绘制全国可再生能源电网地图

#6

中国AI首次完整绘制全国可再生能源电网地图。北京大学和阿里DAMO Academy使用深度学习模型处理卫星图像,识别出32万个太阳能设施和9万个风电设施。研究显示风光互补可显著减少发电波动性。

正文

北京大学和阿里DAMO Academy研究团队首次完整绘制中国全国可再生能源基础设施地图。使用深度学习模型处理亚米级卫星图像,识别出319,972个太阳能设施和91,609个风电设施。研究显示风光互补可显著减少发电波动性,地理覆盖范围越大效果越好。

中国AI首次完整绘制全国可再生能源电网地图 素材

Cursor开发替代GitHub核心功能软件

#7

AI编程工具Cursor正在开发可能取代GitHub核心功能的软件,包括代码仓库、安全审查和自动化测试工具。面对AI原生编程竞争对手的崛起,GitHub正面临前所未有的压力。

正文

Anthropic旗下AI编程工具Cursor正在开发可替代GitHub核心功能的软件,包括代码仓库、安全审查和自动化测试工具。此举正值GitHub面临宕机问题,同时来自AI原生编程竞争对手的压力日益增大。这一动向预示着AI编程工具正在从辅助角色向平台核心功能替代者演进。

Cursor开发替代GitHub核心功能软件 素材

GitHub连续三年获评Gartner企业AI编码代理领导者

#8

GitHub连续第三年被评为Gartner企业AI编码代理领域的领导者。Copilot现在服务14万家企业,年增长率超过100%。Gartner预测到2028年,AI编码代理将提升软件工程团队生产力30%到50%,远超当前AI代码助手0%到20%的收益。

正文

GitHub宣布在2026年Gartner企业AI编码代理魔力象限中连续第三年被评为领导者。GitHub Copilot目前服务140,000家组织,年增长率超过100%。大多数用户使用多个AI模型。GitHub Copilot CLI使用量环比增长近一倍。Gartner预测到2028年异步AI编码代理工作流将提升软件工程团队生产力30%至50%。

GitHub连续三年获评Gartner企业AI编码代理领导者 素材

Garry Tan 开源 GBrain:为 AI 代理构建自记忆知识层

#9

Y Combinator总裁Garry Tan开源了一个名为GBrain的项目,为AI代理赋予记忆能力。这个工具可以自动从笔记、邮件、推文中提取知识图谱,让AI代理记住之前会话中的关键信息。目前该系统已存储超过14万页内容,并可与Claude Code等开发工具无缝集成。

正文

GBrain是Y Combinator总裁Garry Tan为AI代理构建的开源记忆层项目,采用markdown优先、Postgres支持的设计,可摄入会议、邮件、推文和笔记,自动构建类型化知识图谱。该项目目前支撑着Garry Tan实际代理系统的146,646页内容、24,585人、5,339公司和66个自主cron任务。在BrainBench基准测试中,GBrain达到P@5 49.1%和R@5 97.9%,比禁用图谱层高出31.4点。项目通过MCP服务器向Claude Code、Cursor等工具暴露74个工具。

HuggingFace 上线 Common Crawl 2026 年 4 月数据索引

#10

HuggingFace推出重磅数据工具!现在可以直接SQL查询21.9亿网页,无需下载任何数据。配合DuckDB约35秒即可完成全量统计,为AI模型训练和数据分析提供极大便利。

正文

HuggingFace宣布用户现在可以通过SQL直接查询21.9亿网页数据,无需下载。Common Crawl 2026年4月的抓取数据及URL索引已上线HuggingFace Storage Buckets,配合DuckDB可直接通过hf://协议读取数据。开发者在大约35秒内完成了全量21.9亿网页的统计,也可以基于此构建自己的AI代理。

HuggingFace 上线 Common Crawl 2026 年 4 月数据索引 素材

llama.cpp 发布 WebGPU 后端:浏览器可运行本地 AI 模型

#11

开源大模型推理框架llama.cpp发布WebGPU后端,用户可在浏览器中本地运行AI模型,享受GPU加速且数据不离开计算机。该工作历时约一年半,由Reese Levine团队主导开发。

正文

llama.cpp正式发布WebGPU后端支持,该工作历时约一年半,由Reese Levine团队在SCS主导开发。用户可以在浏览器中运行本地AI模型,享受GPU加速,且数据不会离开计算机。这是开源大模型推理框架的重要技术突破。

llama.cpp 发布 WebGPU 后端:浏览器可运行本地 AI 模型 素材

AI 成本危机显现:科技巨头 AI 预算告急

#12

AI行业正经历成本危机。Microsoft取消内部Claude Code许可,Uber的AI预算四个月就花光,美国AI软件价格普遍上涨20%到37%。这标志着AI补贴时代正在终结,企业用户面临更高的AI使用成本,AI公司需要重新审视其定价策略和商业模式

正文

Microsoft本周取消内部Claude Code许可证,因token计费模式使成本变得不可承受,即使用于拥有几乎无限云资源的大公司也是如此。Uber CTO发送内部备忘录警告,公司2026年AI预算在仅四个月内就全部耗尽。美国AI软件价格过去六个月上涨20%至37%,GitHub正取消固定费率计划转向使用量计费。分析师指出AI补贴时代正在终结,各大AI公司过去六个月都提高了有效价格

AI 成本危机显现:科技巨头 AI 预算告急 素材

OpenAI在新加坡设立首个海外应用AI实验室

#13

OpenAI在新加坡开设首个美国以外的应用AI实验室,投资超3亿新元,将创造200多个技术岗位。同时新加坡更新Agentic AI治理框架,新增多Agent系统和自动化偏差等风险指导。

正文

OpenAI在新加坡开设首个美国以外的应用AI实验室,计划投资超3亿新元,将创造200多个技术岗位。实验室将配合新加坡AI Mission优先领域,包括公共服务、金融和数字基础设施。同时IMDA更新Agentic AI治理框架,新增多Agent系统、第三方Agent、自动化偏差等风险指导。

OpenAI在新加坡设立首个海外应用AI实验室 素材

Meta大规模调动7000名员工进入AI工作组

#14

Meta在最新一轮裁员中,将7000名员工重新分配到AI工作组。这些员工将被调入Applied AI团队和多个AI代理相关团队,直接向CTO汇报,反映公司加速AI布局的战略。

正文

Meta在本周裁员8000人的同时,7000名员工收到邮件被选中加入新的AI initiative。这些员工将被调入Applied AI团队,由工程副总裁Maher Saba领导,向首席技术官Andrew Bosworth汇报。另有一些员工被分配到Agent Transformation Accelerator和Agent Data and Optimization团队。内部邮件称这是基于员工的技术能力和表现。

Meta大规模调动7000名员工进入AI工作组 素材

宁德时代计划投资DeepSeek首轮融资

#15

宁德时代计划投资DeepSeek首轮融资,这是中国最大EV电池制造商首次投资AI公司。交易凸显AI竞争已从模型和芯片扩展到电力基础设施领域,反映AI算力对能源的依赖

正文

全球最大动力电池制造商宁德时代(CATL)计划投资DeepSeek首轮融资。DeepSeek是中国增长最快的AI公司之一。该交易凸显AI竞争已从模型和芯片扩展到电力基础设施领域,反映了AI算力需求对能源的依赖

宁德时代计划投资DeepSeek首轮融资 素材

DeepSeek V4 Pro价格永久下调75%

#16

DeepSeek再次掀起价格战,V4 Pro模型永久降价75%。调整后的输入token价格仅为约0.44美元每百万tokens,缓存更是低至约0.0036美元。这一举措将大幅降低开发者使用先进AI模型的成本,可能对整个行业的价格格局产生深远影响。

正文

DeepSeek宣布将V4 Pro的折扣永久化,降价幅度达75%。新的定价结构为:带缓存的输入token约0.0036美元/百万,不带缓存的输入token约0.435美元/百万,输出token约0.87美元/百万。缓存价格几乎免费。

DeepSeek V4 Pro价格永久下调75% 素材

特朗普废除AI行政令 马斯克扎克伯格游说成功

#17

特朗普废除AI行政令,马斯克、扎克伯格等科技巨头游说成功。

正文

特朗普废除已准备好的AI行政令,该命令本将建立AI开发者与联邦机构自愿合作机制。马斯克、扎克伯格和David Sacks直接与特朗普沟通后,该命令被推迟并最终废除。

新型域伪装注入攻击 威胁多代理LLM系统安全

#18

来自arXiv的重要安全研究指出:针对多代理LLM系统的新型攻击方式——域名伪装注入攻击已经被发现。这种攻击能够绑过现有安全检测机制,研究团队呼吁业界加强相应防护措施。

正文

.arXiv最新发表的论文揭示了一种名为Domain-Camouflaged Injection的新型攻击方法。该攻击通过伪装域名来注入恶意指令,能够成功规避当前多代理LLM系统的安全检测。研究提醒业界需加强对此类威胁的防护。

内容来源:三体 AI 日报 · AI 辅助整理,内容仅供参考