2026/5/26

MAY 2026三体AI日报

21周四

三体AI日报 2026-05-21

视频版play_arrow哔哩哔哩 smart_displayYouTube

今日概览

模型技术9

#1通用模型解决数学重大开放问题
#2字节跳动发布Lance模型：统一图像视频理解生成与编辑
#3NVIDIA发布Nemotron-Labs-Diffusion：三模语言模型支持三种解码
#4阿里发布Zhenwu M890芯片：针对AI代理优化
#5Gemini 3.5 Flash性能超越Opus 4.7
#6DeepMind CEO预测AGI 2030年到来
#7Cerebras运行Kimi K2达史上最快推理
#8腾讯发布Hy-MT2支持33种语言
#9腾讯发布HY-World 2.0多模态世界模型

产品应用3

#10Google Gemini CLI将停用
#11Google推出AI搜索新型广告格式
#12Google AI Mode月活用户突破10亿

开发生态2

#13NVIDIA发布AI代理定制技术指南
#14GitHub Copilot支持自动模型选择

行业商业7

#15xAI 2025年亏损64亿美元
#16Anthropic每月向xAI采购12.5亿美元算力
#17Meta承认裁员为AI投资让路，年资本支出剑指1350亿美元
#18英伟达Q1营收创历史新高，AI芯片需求持续强劲
#19AMD掷超100亿美元布局台湾AI生态
#20OpenAI即将秘密提交美国IPO
#21AI收入格局：双寡头占据89%市场

政策监管1

#22白宫推自愿性AI模型审查机制

安全伦理1

#23SpaceX在S-1文件中警示Grok风险

Lead Story

通用模型解决数学重大开放问题

OpenAI CEO Sam Altman宣布，一个通用AI模型解决了数学领域的重大开放问题。Altman称这确实是一个重大里程碑，未来几年我们将频繁听到这类AI突破数学难题的消息。他同时表示心情复杂，但对AI扩展人类知识边界充满期待。

正文

OpenAI CEO Sam Altman宣布，一个通用模型解决了数学领域的重大开放问题。Altman表示，未来几年我们将频繁听到这类消息，但这确实是一个重大里程碑。他同时表示对AI将大大扩展我们对世界的理解感到兴奋，但今天心情复杂。数学家Timothy Gowers此前曾暗示有重大消息要公布。这一突破标志着AI在数学推理领域取得实质性进展。

字节跳动发布Lance模型：统一图像视频理解生成与编辑

字节跳动发布全新多模态AI模型Lance，首次实现图像和视频的理解、生成、编辑三种能力的统一。与传统分离架构不同，Lance从训练开始就联合学习，兼顾语义理解与纹理细节保留，代表多模态模型的重要技术突破。

正文

字节跳动研究团队发布Lance模型，突破性地将图像和视频的理解、生成、编辑三种能力统一到单一架构中。传统方法通常将理解与生成分离为不同架构再后处理，而Lance从训练开始就联合学习，兼顾高层语义特征与低层连续表示。该模型解决了理解任务需要高层语义特征与生成任务需要低层连续表示之间的张力问题，代表多模态AI的重要技术进展。

NVIDIA发布Nemotron-Labs-Diffusion：三模语言模型支持三种解码

NVIDIA发布了Nemotron-Labs-Diffusion系列语言模型。这个系列创新性地在一个架构中支持三种解码模式：自回归、扩散并行和自推测解码。相比Qwen3-8B，吞吐量提升6倍。

正文

NVIDIA发布Nemotron-Labs-Diffusion语言模型系列，在一个架构中统一三种解码模式：自回归解码、扩散并行解码、自推测解码。该系列提供3B、8B、14B参数规模，包含base、instruct和vision-language变体。相比Qwen3-8B，吞吐量提升6倍。扩散模型可并行去噪多个token，但此前准确率落后于自回归模型。

NVIDIA发布Nemotron-Labs-Diffusion：三模语言模型支持三种解码素材

阿里发布Zhenwu M890芯片：针对AI代理优化

阿里发布Zhenwu M890芯片，专为AI代理设计，性能较前代提升3倍。该芯片针对长上下文、多模型协调等Agent场景优化。阿里同时公布至2028年的芯片路线图，展现自主可控的长期规划。

正文

阿里半导体子公司T-Head发布Zhenwu M890 AI处理器，专为AI代理场景设计。该芯片针对长上下文保持、多模型实时协调和复杂多步骤任务执行进行架构优化，这些需求与标准推理芯片的优化方向显著不同。阿里同时公布路线图：2027年Q3发布V900（预计再提升3倍性能），2028年Q3发布J900。

Gemini 3.5 Flash性能超越Opus 4.7

谷歌的Gemini 3.5 Flash在多项关键基准测试中超越了Anthropic的Opus 4.7，关键是成本只是一小部分。

正文

Gemini 3.5 Flash实际上在多个基准测试中击败了Opus 4.7，包括Terminal-bench 2.1、MCP Atlas、OSWorld-verified、Finance Agent v2、CharXiv Reasoning、MMMU-Pro、Blueprint-Bench 2、MRCR v2等，而成本仅为很小一部分。

DeepMind CEO预测AGI 2030年到来

Google DeepMind CEO预测AI奇点即将到来，认为智能体系统让人们现在开始感受到AI的变革力量，AGI或在2030年实现。

正文

Google DeepMind CEO Demis Hassabis在I/O大会上表示，人类正处于奇点的山麓。他指出，强大的AI智能体能够代替人构建事物，这让他相信奇点临近。作为例证，他提到使用AI在深夜构建迷你视频游戏，这些任务过去需要数月完成。他预测AGI将在2030年实现，并认为AI的影响将被低估，实际影响将是工业革命的100倍。

Cerebras运行Kimi K2达史上最快推理

AI领域传来重磅消息，Cerebras成功运行Kimi K2.6万亿参数模型，企业试用中推理速度达到约1000 tokens/s，刷新了前沿模型性能纪录。

正文

Cerebras宣布其硬件平台正在运行Kimi K2.6万亿参数模型，目前处于企业试用阶段。该模型推理速度达到约1000 tokens/s，根据Artificial Analysis的测量，这是有史以来最快的前沿模型性能表现。

腾讯发布Hy-MT2支持33种语言

腾讯发布全新Hy-MT2多语言翻译模型系列，包含1.8B、7B和30B-A3B三个版本，支持33种语言翻译。该系列采用AngelSlim极端量化技术，1.8B模型仅需440MB存储空间，推理速度提升1.5倍。

正文

腾讯正式发布Hy-MT2多语言翻译模型系列，包含1.8B、7B、30B-A3B（MoE）三个版本，均支持33种语言翻译并能有效遵循多语言翻译指令。1.8B模型经AngelSlim 1.25-bit极端量化后，存储需求降至440MB，推理速度提升1.5倍。该模型系列在通用翻译、实际业务、领域特定及指令遵循翻译任务上均表现出色。

腾讯发布HY-World 2.0多模态世界模型

腾讯发布HY-World 2.0多模态世界模型，能够重建、生成和模拟3D世界。该模型已上线Hugging Face，支持从图像生成3D内容。

正文

腾讯发布HY-World 2.0多模态世界模型，这是一个用于重建、生成和模拟3D世界的大型模型。该模型已上线Hugging Face和ModelScope，pipeline tag为image-to-3D，支持从图像生成3D内容。

Google Gemini CLI将停用

#10

Google宣布重要产品变更，Gemini CLI将于6月18日停用，用户需迁移至新的Antigravity CLI。新应用支持多代理团队和原生语音集成，提供更强大的开发体验。

正文

Google宣布其Gemini CLI工具将于2026年6月18日停止服务，用户需要迁移到新推出的Antigravity CLI。Antigravity是Google新推出的桌面应用，专为代理优化体验设计，支持多代理团队、计划任务和原生语音集成等功能。该应用从头重建，提供更强大的AI开发体验。

Google推出AI搜索新型广告格式

#11

Google宣布推出基于Gemini的新广告格式，为AI搜索时代打造全新广告体验。同时扩展Direct Offers试点，为用户提供更多直接优惠选择。

正文

Google正在为AI搜索时代引入新的广告格式，这些格式基于Gemini构建。同时Google还扩展了Direct Offers试点，为购物者提供更多直接优惠。新广告格式将更好地融入AI搜索体验。

Google AI Mode月活用户突破10亿

#12

Google宣布AI Mode月活用户突破10亿，查询量每季度翻倍，成为搜索业务的重要增长引擎。

正文

Google在I/O大会上宣布其AI Mode已突破10亿月活跃用户里程碑。自去年推出以来，AI Mode的查询量每季度翻倍增长。由于搜索功能更加智能和强大，用户提出了更多问题，上季度搜索查询量创历史新高。AI Mode代表了Google在AI搜索领域的重大进展。

NVIDIA发布AI代理定制技术指南

#13

NVIDIA发布AI代理定制技术指南，详细介绍自主AI代理在企业场景中的应用，包括物流、客服、代码生成等领域。

正文

NVIDIA开发者博客发布关于AI代理定制技术的深度指南。内容涵盖自主AI代理在企业中的应用场景，包括物流车队路线规划、支持工单分类、代码生成以及任务编排等。博客详细介绍了代理技术的设计原则和实现方法，为开发者提供实践指导。

GitHub Copilot支持自动模型选择

#14

GitHub Copilot重大更新：新增自动模型选择功能。它会综合考虑任务复杂度、模型可用性和健康状况，自动为你挑选最合适的模型。这意味着开发者无需再手动对比选择，Copilot会更智能地完成编程辅助工作。

正文

GitHub Copilot引入自动模型选择功能，现在会根据用户的任务类型自动路由到最佳模型。该功能利用实时模型可用性和可靠性信号，从推理能力、代码生成复杂度、bug诊断难度等多个维度评估任务，选择最优模型。用户可通过悬停查看使用的模型，也可随时切换手动选择。Auto尊重 admins 设置的模型策略，付费订阅用户使用auto可获得10%折扣。

xAI 2025年亏损64亿美元

#15

SpaceX IPO文件首次公开xAI的财务数据，2025年亏损高达64亿美元。这一数字揭示了AI大模型训练和基础设施建设的巨额投入，xAI正在推进Grok的大规模扩张计划。

正文

SpaceX IPO文件首次披露xAI 2025年财务数据，全年亏损64亿美元，为外界提供了解Elon Musk AI业务的首个公开财务窗口。文件还揭示了xAI的Grok模型大规模扩张计划，反映AI基础设施投资的巨额成本。

Anthropic每月向xAI采购12.5亿美元算力

#16

Anthropic宣布将每月向xAI支付12.5亿美元购买算力，这是AI行业首个如此大规模的算力采购协议，反映出当前AI算力市场的激烈竞争。

正文

Anthropic宣布将每月向xAI支付12.5亿美元购买计算资源，这是AI行业首个如此大规模的算力采购协议。该交易反映出当前AI算力市场的激烈竞争，各大公司都在争抢有限的GPU资源。

Meta承认裁员为AI投资让路，年资本支出剑指1350亿美元

#17

MetaCEO扎克伯格明确表示，裁员是为了省钱投资AI。公司今年资本支出高达1350亿美元，显示科技巨头AI竞赛加剧。

正文

Meta周三向受影响员工发送裁员邮件，直接将裁员与公司投资优先级挂钩。邮件写道："我们决定减少员工数量，作为持续提高公司运营效率努力的一部分，以允许我们抵消其他投资。"这是罕见的企业直接承认AI投资影响就业。Meta年初宣布2026年资本支出范围为1150亿至1350亿美元，主要用于AI基础设施和模型训练。

英伟达Q1营收创历史新高，AI芯片需求持续强劲

#18

英伟达Q1营收583亿美元创历史新高，AI芯片需求持续爆发，数据中心业务强劲增长。

正文

英伟达Q1营收达583亿美元创纪录，净利润583亿美元。AI芯片需求强劲，数据中心业务大幅增长。尽管业绩超预期，但股价有所下跌。

AMD掷超100亿美元布局台湾AI生态

#19

AMD宣布投资超100亿美元建设台湾AI生态系统，提升AI芯片制造和组装能力。

正文

AMD宣布将在台湾AI领域投资超100亿美元，以深化战略合作伙伴关系，提升先进AI芯片的制造和组装能力。此举旨在加强AMD在AI芯片领域的竞争力。

OpenAI即将秘密提交美国IPO

#20

AI行业迎来重大商业里程碑。OpenAI准备秘密提交美国IPO，预计将在未来几周完成文件提交。这将是近年来最受关注的科技公司上市事件之一。

正文

OpenAI正在准备在未来几周秘密提交美国IPO，这是AI行业重大商业进展。消息人士称此举将加剧科技行业IPO热潮。OpenAI自成立以来已获得超140亿美元融资，估值超过1500亿美元，是当前最具价值的AI公司之一。

AI收入格局：双寡头占据89%市场

#21

AI行业迎来重大商业里程碑。OpenAI准备秘密提交美国IPO，预计将在未来几周完成文件提交。这将是近年来最受关注的科技公司上市事件之一。

正文

根据The Information的追踪数据，在34家领先的AI初创公司中，Anthropic和OpenAI合计占据了89%的收入。这一压倒性的市场主导地位引发了业界对基于这些模型构建应用的初创公司还能创造多少价值的质疑。头部AI模型供应商的收入集中度远超预期。

白宫推自愿性AI模型审查机制

#22

白宫正在制定自愿性AI模型审查计划，允许情报和网络安全机构在模型发布前进行检查，AI实验室争取比90天更短的审查窗口。

正文

据报道，白宫正在准备一项自愿性AI模型审查计划，该计划将允许情报和网络安全机构在前沿模型发布前进行检查。AI实验室正在推动比原定90天更短的审查窗口期。这一计划反映了政府对AI安全的关注。

SpaceX在S-1文件中警示Grok风险

#23

SpaceX在上市文件中将Grok AI的NSFW功能列为风险因素，警告可能生成不当内容，包括涉及儿童的性化图像，引发AI安全和伦理担忧。

正文

SpaceX在IPO S-1文件中将xAI的Grok NSFW功能列为风险因素。文件警告Grok的"辛辣"模式比标准产品更加无礼和苛刻，可能产生潜在明确内容、非自愿或剥削性图像、侵犯知识产权的内容，以及被视为有害、骚扰、滥用或歧视的内容。文件还提及对Grok生成儿童性化内容图像的调查。