2026/5/26

MAY 2026三体AI日报

25周一

三体AI日报 2026-05-25

视频版play_arrow哔哩哔哩 smart_displayYouTube

今日概览

模型技术7

#1华为高端芯片五年剑指1.4nm工艺密度
#2NuExtract3：4B参数视觉语言模型文档理解专用
#3微软研究院Webwright框架：让AI代理编写Playwright代码
#4NVIDIA Gated DeltaNet-2：解耦擦写的线性注意力层
#5LLM代理代码生成存在约束衰减问题
#6LongCat开源说话头像模型达SOTA水平
#7xAI发布Grok V9-Medium：1.5T参数模型将公开

产品应用3

#8StepAudio 2.5 Realtime实现端到端实时语音
#9DeepSeek发布Reasonix原生编码代理，主打高缓存低成本
#10Waymo自动驾驶出租车因暴雨洪水暂停多城服务

开发生态2

#11xAI发布Grok Build v0.1.220-alpha.1，更新频率惊人
#12Notecast开源笔记引擎利用LLM自动构建知识图谱

行业商业6

#13内存成本占AI芯片总成本近七成
#14OpenAI联合创始人Greg Brockman深度访谈
#15Uber质疑AI投入产出比 Claude Code预算年内耗尽
#16皮查伊斯坦福演讲回应反AI情绪：毕业生将塑造AI未来
#17OpenAI Q1周活9.05亿，低于10亿目标
#18SpaceX、OpenAI、Anthropic竞相上市估值或超万亿美元

安全伦理1

#19Google Cloud COO：企业AI战略必须同步制定安全策略

Lead Story

华为高端芯片五年剑指1.4nm工艺密度

华为技术近日宣布，其高端芯片将在五年内实现相当于1.4纳米工艺的晶体管密度。这一技术突破是在美国持续制裁背景下发布的，显示中国在先进芯片领域的自主发展决心。该公司未透露具体采用何种技术路径来实现这一晶体管密度目标。

正文

华为技术有限公司周一表示，其高端芯片将在五年内实现相当于1.4纳米工艺的晶体管密度。这一声明凸显了中国为抵消美国制裁影响所做的努力，这些制裁使中国难以生产先进芯片。华为此前因其芯片制造能力受到美国出口管制限制而面临挑战，此次技术路线图展示其寻求突破制裁封锁的决心。

NuExtract3：4B参数视觉语言模型文档理解专用

魔搭社区近日发布NuExtract3，这是一款4B参数的视觉语言模型，专门针对文档理解任务优化。该模型支持从扫描件、收据、发票、合同等多种文档中提取结构化JSON，也可将文档图像转换为干净的Markdown格式。NuExtract3在结构化提取基准测试中超越了Gemma-4和Qwen3.5等模型，具有更低的失败率和推理token消耗。

正文

魔搭社区发布NuExtract3，这是一款4B参数的视觉语言模型，专门针对文档理解任务优化。该模型支持从扫描件、收据、表格、发票、合同等文档中提取结构化JSON，也可将文档图像转换为干净的Markdown格式（表格转为HTML，数学公式转为LaTeX）。NuExtract3在结构化提取基准测试中超越了gemma-4-E4B-it、Qwen3.5-9B和GLM-4.6V-Flash模型，具有更少的失败率和更低的推理token消耗。模型提供思考和非思考两种模式，支持自然语言自动生成提取模板，兼容vLLM和Transformers。

微软研究院Webwright框架：让AI代理编写Playwright代码

微软研究院发布了Webwright框架，这是一个终端原生的Web代理框架。与传统逐个动作操作浏览器不同，它让AI代理编写代码来控制浏览器。在Odysseys测试中，该框架将性能从33.5%提升到60.1%。

正文

微软研究院AI Frontiers实验室发布了开源框架Webwright，区别于传统Web代理逐个动作操作浏览器的方式，Webwright为代理提供终端，让其编写Playwright代码控制浏览器、运行bash命令、检查日志并迭代优化脚本。该框架在Odysseys测试中得分60.1%，相比GPT-5.4基础版的33.5%有显著提升。

NVIDIA Gated DeltaNet-2：解耦擦写的线性注意力层

NVIDIA发布Gated DeltaNet-2，这是一种创新的线性注意力层。该模型将Delta规则中的擦写操作解耦为两个独立的通道门，解决了传统标量门控的建模限制。在1.3B参数、100B tokens训练数据下，该模型在多个基准测试中超越了Mamba-2等同类模型。

正文

NVIDIA发布Gated DeltaNet-2，这是一种线性注意力层，目标是解决线性注意力中的内存编辑瓶颈。该模型将主动内存编辑解耦为两个通道门，分别控制擦写和写入操作。模型在1.3B参数、100B FineWeb-Edu tokens上训练，在研究基准测试中超越Mamba-2、Gated DeltaNet、KDA和Mamba-3。

LLM代理代码生成存在约束衰减问题

学术研究揭示了LLM代理在后端代码生成中的约束衰减问题，指出AI编程工具在保持约束条件方面存在技术脆弱性，这一发现对提升AI代码生成质量具有重要参考价值。

正文

最新学术论文深入研究了LLM代理在后端代码生成中的约束衰减问题，揭示了AI代理在编程任务中面临的技术挑战。该研究分析了当前大语言模型代理在代码生成场景下的局限性与脆弱性，为改进AI编程工具提供重要参考。

LongCat开源说话头像模型达SOTA水平

LongCat发布了一款开源说话头像模型，可能达到业界领先水平。该模型采用MIT许可证，已在Hugging Face上提供免费演示。开发者可以利用它构建AI导师、配音管道、对话编程代理等多种创新产品。

正文

LongCat发布了一款出色的开源说话头像模型，可能达到SOTA水平，并采用MIT许可证。该模型已在Hugging Face上创建了免费演示空间，效果令人印象深刻。可构建的应用场景包括：带面孔的AI导师、配音管道、带面孔的对话编程代理（如Claude Code）、NPC对话等。

xAI发布Grok V9-Medium：1.5T参数模型将公开

xAI即将发布新一代Grok模型。创始人马斯克透露，V9-Medium基础模型拥有1.5万亿参数，目前评估表现良好。Cursor编程数据被用于补充训练，微调正在进行中，预计两到三周后公开发布。

正文

xAI创始人Elon Musk宣布Grok基础模型V9-Medium（1.5T参数）已训练完成，评估结果良好。Cursor数据被用于补充训练，后续还会有更多数据加入。目前正在进行微调，强化学习将于几天内开始，预计2-3周后公开向公众发布。

StepAudio 2.5 Realtime实现端到端实时语音

上海AI Lab StepFun发布StepAudio 2.5 Realtime，这是一款端到端实时语音模型，支持自定义人格，核心技术亮点包括百万级人格数据扩展和专门针对角色扮演的RLHF训练。

正文

StepFun发布StepAudio 2.5 Realtime，这是端到端实时语音大模型，与分离式pipeline不同，它实现音频进音频出的统一架构。支持中文和英文，通过WebSocket API连接。三大技术创新：百万规模人格数据增强、角色扮演专用RLHF对齐、副语言理解能力。

DeepSeek发布Reasonix原生编码代理，主打高缓存低成本

DeepSeek推出了新的编码代理产品Reasonix，主打高缓存和低成本特性。这是DeepSeek在AI编程工具领域的最新尝试，专注于为开发者提供高效的代码生成服务。

正文

DeepSeek发布了Reasonix，这是一款原生AI编码代理工具。该产品主打高缓存与低成本特性，旨在为开发者提供更高效的编程辅助服务。具体功能与定价信息需进一步关注官方发布。

Waymo自动驾驶出租车因暴雨洪水暂停多城服务

#10

Waymo机器人出租车因无法应对暴雨和洪水，在多个城市暂停运营。这是自动驾驶技术面临的典型边缘案例挑战，凸显商业化并非易事。

正文

Waymo机器人出租车已在旧金山规模化运营，但因暴雨和洪水问题暂停亚特兰大、达拉斯、休斯顿和圣安东尼奥服务，并扩展至奥斯汀和纳什维尔。Waymo还暂停了旧金山、洛杉矶、凤凰城和迈阿密的高速公路运营，以改善施工区域性能。公司上周因此发布了召回通知。

xAI发布Grok Build v0.1.220-alpha.1，更新频率惊人

#11

xAI的Grok Build工具发布v0.1.220-alpha.1版本。目前开发团队每天多次推送更新，持续修复问题、优化性能并添加新功能，开发速度非常快。

正文

xAI宣布Grok Build最新版本v0.1.220-alpha.1发布。目前开发团队每天多次推送更新，持续进行问题修复、性能优化和功能改进。开发速度堪称惊人，体现了xAI在Grok产品上的高强度投入。

xAI发布Grok Build v0.1.220-alpha.1，更新频率惊人素材

Notecast开源笔记引擎利用LLM自动构建知识图谱

#12

开发者开源了一款名为Notecast的本地笔记引擎，它利用LLM自动整理笔记并构建知识图谱。系统通过分类、整理和整合三阶段管道处理笔记，用户可以设置Obsidian vault路径来集成使用。

正文

Notecast是一个本地笔记引擎，通过三阶段LLM管道（分类→整理→整合）自动从笔记中构建和维护知识图谱。随着笔记积累，主题层次结构自然涌现。任何更改都会生成提案，用户可以编辑和提交。早期阶段但核心功能已可用，支持Obsidian vault集成。

内存成本占AI芯片总成本近七成

#13

最新研究显示，内存已占据AI芯片组件成本的近三分之二。这一趋势反映了AI硬件设计中内存带宽的重要性，也揭示了AI芯片成本结构正在发生根本性变化。

正文

根据Epoch AI的数据分析，内存成本在AI芯片组件中的占比已接近三分之二。这一数据反映了AI硬件成本结构的重大变化，内存带宽成为制约AI模型训练和推理的关键因素。该分析基于对主流AI芯片的拆解和成本核算。

OpenAI联合创始人Greg Brockman深度访谈

#14

OpenAI联合创始人Greg Brockman接受播客访谈，作为公司核心人物分享AI技术发展见解。该访谈在Hacker News获得196点评分和大量关注，反映出业界对其观点的高度期待。

正文

The Knowledge Project Podcast播出了对OpenAI联合创始人Greg Brockman的深度访谈。作为OpenAI的核心人物，Brockman分享了对AI技术发展、公司战略、行业竞争等方面的见解。该访谈在Hacker News上获得196点评分和204条评论。

Uber质疑AI投入产出比 Claude Code预算年内耗尽

#15

Uber高管近日公开质疑AI投资回报率。COO表示，公司AI token消耗巨大，但并未带来相应的生产力提升。CTO透露，Claude Code的年度预算已经提前烧光。这一现象引发业界讨论：AI投入是否真的能转化为等比例的商业价值？

正文

Uber COO Andrew Macdonald在近日采访中表示，公司越来越难以为AI投入辩护。他指出，与工程负责人沟通后发现，更高的token使用量并未转化为等比例的消费者功能产出。Uber CTO Praveen Neppalli Naga在4月曾透露，公司已用完2026年全年的Claude Code预算，这一"爆炸性"言论引发内部对AI token消耗与实际产出的讨论。

皮查伊斯坦福演讲回应反AI情绪：毕业生将塑造AI未来

#16

谷歌CEO皮查伊将在斯坦福毕业典礼演讲，谈毕业生对AI的反对。他承认人们有理由焦虑，但强调年轻人将塑造AI未来并承担其后果。这反映科技行业面临的日益增长的社

正文

皮查伊将在斯坦福大学毕业典礼发表演讲。今年毕业生多次在CEO演讲时发出嘘声，反对AI相关内容。皮查伊承认人们有理由对AI感到焦虑，但他认为毕业生将塑造AI的未来并与之共存。

OpenAI Q1周活9.05亿，低于10亿目标

#17

据媒体报道，OpenAI今年第一季度周活跃用户约9.05亿，未能实现去年底达到10亿用户的目标，用户增长面临挑战。

正文

The Information独家报道，OpenAI今年第一季度平均周活跃用户约为9.05亿，低于其此前设定的去年底达到10亿用户的目标。这一数据反映出OpenAI在用户增长方面面临挑战。

SpaceX、OpenAI、Anthropic竞相上市估值或超万亿美元

#18

AI行业迎来重大里程碑，SpaceX、OpenAI和Anthropic三大科技巨头竞相上市，估值可能同时突破万亿美元。

正文

SpaceX、OpenAI和Anthropic都在竞相上市，可能使每家公司估值接近或超过1万亿美元。上市时机可能迫使华尔街决定同时向这三家资本密集型科技巨头投入多少资金。这是本周Dealmaker通讯的深度报道。

Google Cloud COO：企业AI战略必须同步制定安全策略

#19

Google Cloud高管警告企业，不能将AI安全视为事后考虑。他强调安全必须从一开始就被纳入平台，企业需要警惕员工私下使用消费级AI工具的影子AI风险。

正文

Google Cloud COO Francis de Souza在采访中表示，企业开展AI旅程需要采用平台化方法，安全不能事后补救，也不能留给员工自行处理。他特别警告了影子AI的风险——员工在缺乏组织监督的情况下使用消费级工具。de Souza强调，没有数据战略和安全战略的AI战略是不存在的，这些必须齐头并进。他指出威胁环境已发生根本性变化，旧的防御模式太慢。