2026/5/26

MAY 2026三体AI日报

23周六

三体AI日报 2026-05-23

视频版play_arrow哔哩哔哩 smart_displayYouTube

今日概览

模型技术3

#1NVIDIA发布Nemotron-Labs扩散语言模型，支持三种生成模式
#2Qwen3.7-Max在俄罗斯方块Agent测试中击败Opus 4.7和GPT-5.5
#3Anthropic发布Project Glasswing初始更新

产品应用4

#4Runway发布Aleph 2.0，支持单帧编辑自动贯穿全局
#5阿里Qwen嵌入淘宝客服系统助力交易成交
#6中国AI首次完整绘制全国可再生能源电网地图
#7Cursor开发替代GitHub核心功能软件

开发生态4

#8GitHub连续三年获评Gartner企业AI编码代理领导者
#9Garry Tan 开源 GBrain：为 AI 代理构建自记忆知识层
#10HuggingFace 上线 Common Crawl 2026 年 4 月数据索引
#11llama.cpp 发布 WebGPU 后端：浏览器可运行本地 AI 模型

行业商业5

#12AI 成本危机显现：科技巨头 AI 预算告急
#13OpenAI在新加坡设立首个海外应用AI实验室
#14Meta大规模调动7000名员工进入AI工作组
#15宁德时代计划投资DeepSeek首轮融资
#16DeepSeek V4 Pro价格永久下调75%

政策监管1

#17特朗普废除AI行政令马斯克扎克伯格游说成功

安全伦理1

#18新型域伪装注入攻击威胁多代理LLM系统安全

Lead Story

NVIDIA发布Nemotron-Labs扩散语言模型，支持三种生成模式

NVIDIA发布新型Nemotron-Labs扩散语言模型，支持自回归、扩散和混合三种生成模式，显著提升文本生成速度，向光速推理目标迈进。该模型可通过Hugging Face获取。

正文

NVIDIA发布Nemotron-Labs扩散语言模型，这是一种新型扩散语言模型（Diffusion Language Model），支持三种生成模式：自回归、扩散和混合模式。该模型旨在实现更快的文本生成速度，向光速文本生成目标迈进。模型可通过Hugging Face和SGLang部署推理。

Qwen3.7-Max在俄罗斯方块Agent测试中击败Opus 4.7和GPT-5.5

最新测试显示，阿里Qwen3.7-Max在一个真实Agent任务中击败了Claude Opus 4.7和GPT-5.5。该测试要求模型编写能自我训练的俄罗斯方块机器人，10轮迭代后Qwen3.7-Max表现最优。

正文

atomic.chat测试显示，Qwen3.7-Max在一个真实Agent任务中击败了Opus 4.7和GPT-5.5。该任务要求模型编写一个能自我训练俄罗斯方块机器人，模型需读取自己代码、运行基准测试并重写，经过10轮迭代后比较最终机器人表现。

Anthropic发布Project Glasswing初始更新

Anthropic发布Project Glasswing初始更新，这是该公司的重要AI研究项目，旨在推进AI系统的能力和安全性。

正文

Anthropic发布Project Glasswing初始更新。这是Anthropic的重要AI研究项目，旨在推进AI系统的能力和安全性。该更新将分享项目的研究进展和技术细节。

Runway发布Aleph 2.0，支持单帧编辑自动贯穿全局

AI视频编辑领域重大更新：Runway发布Aleph 2.0，被评价为目前最佳视频编辑器。该工具支持单帧编辑并自动贯穿应用到整个视频，用户可以预览单帧修改效果，AI会自动将修改应用到视频其余部分。

正文

Runway发布Aleph 2.0视频编辑工具，这是目前最佳的视频编辑器。该工具支持单帧编辑并自动贯穿应用到整个视频，用户可以在Edit Studio中预览修改效果后，AI会自动将修改应用到视频的其余部分。

阿里Qwen嵌入淘宝客服系统助力交易成交

阿里巴巴将Qwen AI嵌入淘宝，客服AI能完成交易而非仅回答问题。

正文

阿里巴巴将Qwen应用嵌入淘宝商业栈，AI客服不仅回答问题还能完成交易。数千亿token驱动智能店小蜜，取代传统脚本聊天机器人，处理复杂对话并完成销售。

中国AI首次完整绘制全国可再生能源电网地图

中国AI首次完整绘制全国可再生能源电网地图。北京大学和阿里DAMO Academy使用深度学习模型处理卫星图像，识别出32万个太阳能设施和9万个风电设施。研究显示风光互补可显著减少发电波动性。

正文

北京大学和阿里DAMO Academy研究团队首次完整绘制中国全国可再生能源基础设施地图。使用深度学习模型处理亚米级卫星图像，识别出319,972个太阳能设施和91,609个风电设施。研究显示风光互补可显著减少发电波动性，地理覆盖范围越大效果越好。

Cursor开发替代GitHub核心功能软件

AI编程工具Cursor正在开发可能取代GitHub核心功能的软件，包括代码仓库、安全审查和自动化测试工具。面对AI原生编程竞争对手的崛起，GitHub正面临前所未有的压力。

正文

Anthropic旗下AI编程工具Cursor正在开发可替代GitHub核心功能的软件，包括代码仓库、安全审查和自动化测试工具。此举正值GitHub面临宕机问题，同时来自AI原生编程竞争对手的压力日益增大。这一动向预示着AI编程工具正在从辅助角色向平台核心功能替代者演进。

GitHub连续三年获评Gartner企业AI编码代理领导者

GitHub连续第三年被评为Gartner企业AI编码代理领域的领导者。Copilot现在服务14万家企业，年增长率超过100%。Gartner预测到2028年，AI编码代理将提升软件工程团队生产力30%到50%，远超当前AI代码助手0%到20%的收益。

正文

GitHub宣布在2026年Gartner企业AI编码代理魔力象限中连续第三年被评为领导者。GitHub Copilot目前服务140,000家组织，年增长率超过100%。大多数用户使用多个AI模型。GitHub Copilot CLI使用量环比增长近一倍。Gartner预测到2028年异步AI编码代理工作流将提升软件工程团队生产力30%至50%。

Garry Tan 开源 GBrain：为 AI 代理构建自记忆知识层

Y Combinator总裁Garry Tan开源了一个名为GBrain的项目，为AI代理赋予记忆能力。这个工具可以自动从笔记、邮件、推文中提取知识图谱，让AI代理记住之前会话中的关键信息。目前该系统已存储超过14万页内容，并可与Claude Code等开发工具无缝集成。

正文

GBrain是Y Combinator总裁Garry Tan为AI代理构建的开源记忆层项目，采用markdown优先、Postgres支持的设计，可摄入会议、邮件、推文和笔记，自动构建类型化知识图谱。该项目目前支撑着Garry Tan实际代理系统的146,646页内容、24,585人、5,339公司和66个自主cron任务。在BrainBench基准测试中，GBrain达到P@5 49.1%和R@5 97.9%，比禁用图谱层高出31.4点。项目通过MCP服务器向Claude Code、Cursor等工具暴露74个工具。

HuggingFace 上线 Common Crawl 2026 年 4 月数据索引

#10

HuggingFace推出重磅数据工具！现在可以直接SQL查询21.9亿网页，无需下载任何数据。配合DuckDB约35秒即可完成全量统计，为AI模型训练和数据分析提供极大便利。

正文

HuggingFace宣布用户现在可以通过SQL直接查询21.9亿网页数据，无需下载。Common Crawl 2026年4月的抓取数据及URL索引已上线HuggingFace Storage Buckets，配合DuckDB可直接通过hf://协议读取数据。开发者在大约35秒内完成了全量21.9亿网页的统计，也可以基于此构建自己的AI代理。

HuggingFace 上线 Common Crawl 2026 年 4 月数据索引素材

llama.cpp 发布 WebGPU 后端：浏览器可运行本地 AI 模型

#11

开源大模型推理框架llama.cpp发布WebGPU后端，用户可在浏览器中本地运行AI模型，享受GPU加速且数据不离开计算机。该工作历时约一年半，由Reese Levine团队主导开发。

正文

llama.cpp正式发布WebGPU后端支持，该工作历时约一年半，由Reese Levine团队在SCS主导开发。用户可以在浏览器中运行本地AI模型，享受GPU加速，且数据不会离开计算机。这是开源大模型推理框架的重要技术突破。

AI 成本危机显现：科技巨头 AI 预算告急

#12

AI行业正经历成本危机。Microsoft取消内部Claude Code许可，Uber的AI预算四个月就花光，美国AI软件价格普遍上涨20%到37%。这标志着AI补贴时代正在终结，企业用户面临更高的AI使用成本，AI公司需要重新审视其定价策略和商业模式

正文

Microsoft本周取消内部Claude Code许可证，因token计费模式使成本变得不可承受，即使用于拥有几乎无限云资源的大公司也是如此。Uber CTO发送内部备忘录警告，公司2026年AI预算在仅四个月内就全部耗尽。美国AI软件价格过去六个月上涨20%至37%，GitHub正取消固定费率计划转向使用量计费。分析师指出AI补贴时代正在终结，各大AI公司过去六个月都提高了有效价格

OpenAI在新加坡设立首个海外应用AI实验室

#13

OpenAI在新加坡开设首个美国以外的应用AI实验室，投资超3亿新元，将创造200多个技术岗位。同时新加坡更新Agentic AI治理框架，新增多Agent系统和自动化偏差等风险指导。

正文

OpenAI在新加坡开设首个美国以外的应用AI实验室，计划投资超3亿新元，将创造200多个技术岗位。实验室将配合新加坡AI Mission优先领域，包括公共服务、金融和数字基础设施。同时IMDA更新Agentic AI治理框架，新增多Agent系统、第三方Agent、自动化偏差等风险指导。

Meta大规模调动7000名员工进入AI工作组

#14

Meta在最新一轮裁员中，将7000名员工重新分配到AI工作组。这些员工将被调入Applied AI团队和多个AI代理相关团队，直接向CTO汇报，反映公司加速AI布局的战略。

正文

Meta在本周裁员8000人的同时，7000名员工收到邮件被选中加入新的AI initiative。这些员工将被调入Applied AI团队，由工程副总裁Maher Saba领导，向首席技术官Andrew Bosworth汇报。另有一些员工被分配到Agent Transformation Accelerator和Agent Data and Optimization团队。内部邮件称这是基于员工的技术能力和表现。

宁德时代计划投资DeepSeek首轮融资

#15

宁德时代计划投资DeepSeek首轮融资，这是中国最大EV电池制造商首次投资AI公司。交易凸显AI竞争已从模型和芯片扩展到电力基础设施领域，反映AI算力对能源的依赖

正文

全球最大动力电池制造商宁德时代（CATL）计划投资DeepSeek首轮融资。DeepSeek是中国增长最快的AI公司之一。该交易凸显AI竞争已从模型和芯片扩展到电力基础设施领域，反映了AI算力需求对能源的依赖

DeepSeek V4 Pro价格永久下调75%

#16

DeepSeek再次掀起价格战，V4 Pro模型永久降价75%。调整后的输入token价格仅为约0.44美元每百万tokens，缓存更是低至约0.0036美元。这一举措将大幅降低开发者使用先进AI模型的成本，可能对整个行业的价格格局产生深远影响。

正文

DeepSeek宣布将V4 Pro的折扣永久化，降价幅度达75%。新的定价结构为：带缓存的输入token约0.0036美元/百万，不带缓存的输入token约0.435美元/百万，输出token约0.87美元/百万。缓存价格几乎免费。

特朗普废除AI行政令马斯克扎克伯格游说成功

#17

特朗普废除AI行政令，马斯克、扎克伯格等科技巨头游说成功。

正文

特朗普废除已准备好的AI行政令，该命令本将建立AI开发者与联邦机构自愿合作机制。马斯克、扎克伯格和David Sacks直接与特朗普沟通后，该命令被推迟并最终废除。

新型域伪装注入攻击威胁多代理LLM系统安全

#18

来自arXiv的重要安全研究指出：针对多代理LLM系统的新型攻击方式——域名伪装注入攻击已经被发现。这种攻击能够绑过现有安全检测机制，研究团队呼吁业界加强相应防护措施。

正文

.arXiv最新发表的论文揭示了一种名为Domain-Camouflaged Injection的新型攻击方法。该攻击通过伪装域名来注入恶意指令，能够成功规避当前多代理LLM系统的安全检测。研究提醒业界需加强对此类威胁的防护。