NVIDIA发布Nemotron-Labs扩散语言模型,支持三种生成模式
#1正文
NVIDIA发布Nemotron-Labs扩散语言模型,这是一种新型扩散语言模型(Diffusion Language Model),支持三种生成模式:自回归、扩散和混合模式。该模型旨在实现更快的文本生成速度,向光速文本生成目标迈进。模型可通过Hugging Face和SGLang部署推理。
三体AI日报 2026-05-23
正文
NVIDIA发布Nemotron-Labs扩散语言模型,这是一种新型扩散语言模型(Diffusion Language Model),支持三种生成模式:自回归、扩散和混合模式。该模型旨在实现更快的文本生成速度,向光速文本生成目标迈进。模型可通过Hugging Face和SGLang部署推理。
正文
atomic.chat测试显示,Qwen3.7-Max在一个真实Agent任务中击败了Opus 4.7和GPT-5.5。该任务要求模型编写一个能自我训练俄罗斯方块机器人,模型需读取自己代码、运行基准测试并重写,经过10轮迭代后比较最终机器人表现。
正文
Anthropic发布Project Glasswing初始更新。这是Anthropic的重要AI研究项目,旨在推进AI系统的能力和安全性。该更新将分享项目的研究进展和技术细节。
正文
Runway发布Aleph 2.0视频编辑工具,这是目前最佳的视频编辑器。该工具支持单帧编辑并自动贯穿应用到整个视频,用户可以在Edit Studio中预览修改效果后,AI会自动将修改应用到视频的其余部分。
正文
阿里巴巴将Qwen应用嵌入淘宝商业栈,AI客服不仅回答问题还能完成交易。数千亿token驱动智能店小蜜,取代传统脚本聊天机器人,处理复杂对话并完成销售。
正文
北京大学和阿里DAMO Academy研究团队首次完整绘制中国全国可再生能源基础设施地图。使用深度学习模型处理亚米级卫星图像,识别出319,972个太阳能设施和91,609个风电设施。研究显示风光互补可显著减少发电波动性,地理覆盖范围越大效果越好。
正文
Anthropic旗下AI编程工具Cursor正在开发可替代GitHub核心功能的软件,包括代码仓库、安全审查和自动化测试工具。此举正值GitHub面临宕机问题,同时来自AI原生编程竞争对手的压力日益增大。这一动向预示着AI编程工具正在从辅助角色向平台核心功能替代者演进。
正文
GitHub宣布在2026年Gartner企业AI编码代理魔力象限中连续第三年被评为领导者。GitHub Copilot目前服务140,000家组织,年增长率超过100%。大多数用户使用多个AI模型。GitHub Copilot CLI使用量环比增长近一倍。Gartner预测到2028年异步AI编码代理工作流将提升软件工程团队生产力30%至50%。
正文
GBrain是Y Combinator总裁Garry Tan为AI代理构建的开源记忆层项目,采用markdown优先、Postgres支持的设计,可摄入会议、邮件、推文和笔记,自动构建类型化知识图谱。该项目目前支撑着Garry Tan实际代理系统的146,646页内容、24,585人、5,339公司和66个自主cron任务。在BrainBench基准测试中,GBrain达到P@5 49.1%和R@5 97.9%,比禁用图谱层高出31.4点。项目通过MCP服务器向Claude Code、Cursor等工具暴露74个工具。
正文
HuggingFace宣布用户现在可以通过SQL直接查询21.9亿网页数据,无需下载。Common Crawl 2026年4月的抓取数据及URL索引已上线HuggingFace Storage Buckets,配合DuckDB可直接通过hf://协议读取数据。开发者在大约35秒内完成了全量21.9亿网页的统计,也可以基于此构建自己的AI代理。
正文
llama.cpp正式发布WebGPU后端支持,该工作历时约一年半,由Reese Levine团队在SCS主导开发。用户可以在浏览器中运行本地AI模型,享受GPU加速,且数据不会离开计算机。这是开源大模型推理框架的重要技术突破。
正文
Microsoft本周取消内部Claude Code许可证,因token计费模式使成本变得不可承受,即使用于拥有几乎无限云资源的大公司也是如此。Uber CTO发送内部备忘录警告,公司2026年AI预算在仅四个月内就全部耗尽。美国AI软件价格过去六个月上涨20%至37%,GitHub正取消固定费率计划转向使用量计费。分析师指出AI补贴时代正在终结,各大AI公司过去六个月都提高了有效价格
正文
OpenAI在新加坡开设首个美国以外的应用AI实验室,计划投资超3亿新元,将创造200多个技术岗位。实验室将配合新加坡AI Mission优先领域,包括公共服务、金融和数字基础设施。同时IMDA更新Agentic AI治理框架,新增多Agent系统、第三方Agent、自动化偏差等风险指导。
正文
Meta在本周裁员8000人的同时,7000名员工收到邮件被选中加入新的AI initiative。这些员工将被调入Applied AI团队,由工程副总裁Maher Saba领导,向首席技术官Andrew Bosworth汇报。另有一些员工被分配到Agent Transformation Accelerator和Agent Data and Optimization团队。内部邮件称这是基于员工的技术能力和表现。
正文
全球最大动力电池制造商宁德时代(CATL)计划投资DeepSeek首轮融资。DeepSeek是中国增长最快的AI公司之一。该交易凸显AI竞争已从模型和芯片扩展到电力基础设施领域,反映了AI算力需求对能源的依赖
正文
DeepSeek宣布将V4 Pro的折扣永久化,降价幅度达75%。新的定价结构为:带缓存的输入token约0.0036美元/百万,不带缓存的输入token约0.435美元/百万,输出token约0.87美元/百万。缓存价格几乎免费。
正文
特朗普废除已准备好的AI行政令,该命令本将建立AI开发者与联邦机构自愿合作机制。马斯克、扎克伯格和David Sacks直接与特朗普沟通后,该命令被推迟并最终废除。
正文
.arXiv最新发表的论文揭示了一种名为Domain-Camouflaged Injection的新型攻击方法。该攻击通过伪装域名来注入恶意指令,能够成功规避当前多代理LLM系统的安全检测。研究提醒业界需加强对此类威胁的防护。