通用模型解决数学重大开放问题
#1正文
OpenAI CEO Sam Altman宣布,一个通用模型解决了数学领域的重大开放问题。Altman表示,未来几年我们将频繁听到这类消息,但这确实是一个重大里程碑。他同时表示对AI将大大扩展我们对世界的理解感到兴奋,但今天心情复杂。数学家Timothy Gowers此前曾暗示有重大消息要公布。这一突破标志着AI在数学推理领域取得实质性进展。
三体AI日报 2026-05-21
正文
OpenAI CEO Sam Altman宣布,一个通用模型解决了数学领域的重大开放问题。Altman表示,未来几年我们将频繁听到这类消息,但这确实是一个重大里程碑。他同时表示对AI将大大扩展我们对世界的理解感到兴奋,但今天心情复杂。数学家Timothy Gowers此前曾暗示有重大消息要公布。这一突破标志着AI在数学推理领域取得实质性进展。
正文
字节跳动研究团队发布Lance模型,突破性地将图像和视频的理解、生成、编辑三种能力统一到单一架构中。传统方法通常将理解与生成分离为不同架构再后处理,而Lance从训练开始就联合学习,兼顾高层语义特征与低层连续表示。该模型解决了理解任务需要高层语义特征与生成任务需要低层连续表示之间的张力问题,代表多模态AI的重要技术进展。
正文
NVIDIA发布Nemotron-Labs-Diffusion语言模型系列,在一个架构中统一三种解码模式:自回归解码、扩散并行解码、自推测解码。该系列提供3B、8B、14B参数规模,包含base、instruct和vision-language变体。相比Qwen3-8B,吞吐量提升6倍。扩散模型可并行去噪多个token,但此前准确率落后于自回归模型。
正文
阿里半导体子公司T-Head发布Zhenwu M890 AI处理器,专为AI代理场景设计。该芯片针对长上下文保持、多模型实时协调和复杂多步骤任务执行进行架构优化,这些需求与标准推理芯片的优化方向显著不同。阿里同时公布路线图:2027年Q3发布V900(预计再提升3倍性能),2028年Q3发布J900。
正文
Gemini 3.5 Flash实际上在多个基准测试中击败了Opus 4.7,包括Terminal-bench 2.1、MCP Atlas、OSWorld-verified、Finance Agent v2、CharXiv Reasoning、MMMU-Pro、Blueprint-Bench 2、MRCR v2等,而成本仅为很小一部分。
正文
Google DeepMind CEO Demis Hassabis在I/O大会上表示,人类正处于奇点的山麓。他指出,强大的AI智能体能够代替人构建事物,这让他相信奇点临近。作为例证,他提到使用AI在深夜构建迷你视频游戏,这些任务过去需要数月完成。他预测AGI将在2030年实现,并认为AI的影响将被低估,实际影响将是工业革命的100倍。
正文
Cerebras宣布其硬件平台正在运行Kimi K2.6万亿参数模型,目前处于企业试用阶段。该模型推理速度达到约1000 tokens/s,根据Artificial Analysis的测量,这是有史以来最快的前沿模型性能表现。
正文
腾讯正式发布Hy-MT2多语言翻译模型系列,包含1.8B、7B、30B-A3B(MoE)三个版本,均支持33种语言翻译并能有效遵循多语言翻译指令。1.8B模型经AngelSlim 1.25-bit极端量化后,存储需求降至440MB,推理速度提升1.5倍。该模型系列在通用翻译、实际业务、领域特定及指令遵循翻译任务上均表现出色。
正文
腾讯发布HY-World 2.0多模态世界模型,这是一个用于重建、生成和模拟3D世界的大型模型。该模型已上线Hugging Face和ModelScope,pipeline tag为image-to-3D,支持从图像生成3D内容。
正文
Google宣布其Gemini CLI工具将于2026年6月18日停止服务,用户需要迁移到新推出的Antigravity CLI。Antigravity是Google新推出的桌面应用,专为代理优化体验设计,支持多代理团队、计划任务和原生语音集成等功能。该应用从头重建,提供更强大的AI开发体验。
正文
Google正在为AI搜索时代引入新的广告格式,这些格式基于Gemini构建。同时Google还扩展了Direct Offers试点,为购物者提供更多直接优惠。新广告格式将更好地融入AI搜索体验。
正文
Google在I/O大会上宣布其AI Mode已突破10亿月活跃用户里程碑。自去年推出以来,AI Mode的查询量每季度翻倍增长。由于搜索功能更加智能和强大,用户提出了更多问题,上季度搜索查询量创历史新高。AI Mode代表了Google在AI搜索领域的重大进展。
正文
NVIDIA开发者博客发布关于AI代理定制技术的深度指南。内容涵盖自主AI代理在企业中的应用场景,包括物流车队路线规划、支持工单分类、代码生成以及任务编排等。博客详细介绍了代理技术的设计原则和实现方法,为开发者提供实践指导。
正文
GitHub Copilot引入自动模型选择功能,现在会根据用户的任务类型自动路由到最佳模型。该功能利用实时模型可用性和可靠性信号,从推理能力、代码生成复杂度、bug诊断难度等多个维度评估任务,选择最优模型。用户可通过悬停查看使用的模型,也可随时切换手动选择。Auto尊重 admins 设置的模型策略,付费订阅用户使用auto可获得10%折扣。
正文
SpaceX IPO文件首次披露xAI 2025年财务数据,全年亏损64亿美元,为外界提供了解Elon Musk AI业务的首个公开财务窗口。文件还揭示了xAI的Grok模型大规模扩张计划,反映AI基础设施投资的巨额成本。
正文
Anthropic宣布将每月向xAI支付12.5亿美元购买计算资源,这是AI行业首个如此大规模的算力采购协议。该交易反映出当前AI算力市场的激烈竞争,各大公司都在争抢有限的GPU资源。
正文
Meta周三向受影响员工发送裁员邮件,直接将裁员与公司投资优先级挂钩。邮件写道:"我们决定减少员工数量,作为持续提高公司运营效率努力的一部分,以允许我们抵消其他投资。"这是罕见的企业直接承认AI投资影响就业。Meta年初宣布2026年资本支出范围为1150亿至1350亿美元,主要用于AI基础设施和模型训练。
正文
英伟达Q1营收达583亿美元创纪录,净利润583亿美元。AI芯片需求强劲,数据中心业务大幅增长。尽管业绩超预期,但股价有所下跌。
正文
AMD宣布将在台湾AI领域投资超100亿美元,以深化战略合作伙伴关系,提升先进AI芯片的制造和组装能力。此举旨在加强AMD在AI芯片领域的竞争力。
正文
OpenAI正在准备在未来几周秘密提交美国IPO,这是AI行业重大商业进展。消息人士称此举将加剧科技行业IPO热潮。OpenAI自成立以来已获得超140亿美元融资,估值超过1500亿美元,是当前最具价值的AI公司之一。
正文
根据The Information的追踪数据,在34家领先的AI初创公司中,Anthropic和OpenAI合计占据了89%的收入。这一压倒性的市场主导地位引发了业界对基于这些模型构建应用的初创公司还能创造多少价值的质疑。头部AI模型供应商的收入集中度远超预期。
正文
据报道,白宫正在准备一项自愿性AI模型审查计划,该计划将允许情报和网络安全机构在前沿模型发布前进行检查。AI实验室正在推动比原定90天更短的审查窗口期。这一计划反映了政府对AI安全的关注。
正文
SpaceX在IPO S-1文件中将xAI的Grok NSFW功能列为风险因素。文件警告Grok的"辛辣"模式比标准产品更加无礼和苛刻,可能产生潜在明确内容、非自愿或剥削性图像、侵犯知识产权的内容,以及被视为有害、骚扰、滥用或歧视的内容。文件还提及对Grok生成儿童性化内容图像的调查。