AI Agent 日报

🤖 AI Agent 研究

阿里巴巴发布 Tstars-Tryon 1.0 商用虚拟试穿系统，在极端姿态、光照变化、运动模糊等挑战性场景下保持高成功率，生成照片级真实效果并支持近实时推理。该系统已部署于淘宝 App，服务数百万用户、处理数千万请求，涵盖 8 种时尚品类最多 6 张参考图，完整保留服装纹理和材质属性。

查看原文虚拟试穿图像生成阿里巴巴

CoInteract: 人-物交互视频扩散合成框架

阿里巴巴提出 CoInteract 端到端框架，基于 Diffusion Transformer 解决人-物交互视频合成中手部/面部结构稳定性和物理接触合理性问题。核心设计包括人类感知 MoE 专家路由和空域结构协同生成双流训练范式，在保持交互几何先验的同时生成逼真交互视频，已在 HOIVG-Bench 基准上验证。

查看原文视频生成 Diffusion 人机交互

AgentSPEX: 智能体工作流规范与执行语言

UIUC 研究团队推出 AgentSPEX——用于构建结构化、可解释 LLM 智能体工作流的领域特定语言。核心特性：YAML 声明式工作流（支持 task/for_each/while/if/parallel/call）、沙箱执行环境、带检查点/恢复/追踪回放的可验证执行机制，以及图与 YAML 双向同步的可视化编辑器。在 7 个基准测试上验证，Deep Research 智能体 ~15 分钟 <$1 即可完成深度研究。

查看原文 Agent 工作流 DSL 可解释AI

AnyRecon: 任意视角稀疏输入 3D 重建

研究团队提出 AnyRecon 框架，实现从任意数量无序稀疏输入的可扩展 3D 重建。核心创新包括持久全局场景记忆、去除时间压缩以保持大视角变化下的帧级对应、以及结合扩散蒸馏和块稀疏注意力的高效架构设计。在不规则输入、大视角间隔和长轨迹场景下均表现出色，GitHub 已有 80 星。

查看原文 3D重建 Diffusion 视频扩散

⭐ GitHub 热门项目

TOP Qwen3.6-27B: 旗舰级编程能力的 27B 稠密模型

阿里通义千问发布 Qwen3.6-27B 稠密模型，在 27B 参数规模下达旗舰级编程能力。已在 Hacker News 引发热议（682 点），引发关于小模型能否匹敌超大模型的社区讨论。该模型支持多语言编程、复杂代码生成和调试能力，代表开源模型在代码智能领域的重要突破。

查看原文 Qwen 代码模型开源LLM

Google 第八代 Trillium TPU: 专为 Agent 时代设计

Google 发布两款第八代 TPU——一款专用于训练，一款专用于推理，首次将前沿训练和 Agent 推理作为独立问题处理。Trillium TPU 采用第三代 SparseCore，支持更深度和更宽的矩阵乘法单元，内存带宽提升 1.1 倍。Google 明确表示不依赖 NVIDIA 生态，自研芯片战略持续深化。

查看原文 Google TPU 硬件 Agent

Anthropic 获亚马逊 50 亿美元追加投资

亚马逊向 Anthropic 追加 50 亿美元投资，使总投资达 130 亿美元。Anthropic 将获得亚马逊 5 吉瓦自定义硅芯片算力用于训练 Claude 模型。该交易包含 Anthropic 承诺未来十年在 AWS 技术上投入超 1000 亿美元，是 AI 热潮中规模最大的循环融资案例，用于应对 Claude 订阅激增带来的基础设施压力。

查看原文 Anthropic 亚马逊融资 Claude

OpenAI 发布 Workspace Agents: 企业版自定义 GPT 继任者

OpenAI 推出 Workspace Agents，可直接嵌入 Slack、Salesforce 等第三方应用，为企业用户提供多渠道 AI 工作流自动化。用户可在 ChatGPT 内创建和访问 Agent，也可在第三方应用中与其通信、跨渠道使用工具并调用企业数据。这是 OpenAI 挑战 Anthropic Claude Code 企业市场份额的关键产品。

查看原文 OpenAI Agent 企业工作流

Google Deep Research Max: 融合网络与企业私有数据的深度研究代理

Google 基于 Gemini 3.1 Pro 发布 Deep Research 和 Deep Research Max 自主研究代理，首次支持通过单一 API 调用融合网络数据与企业私有数据，可生成原生图表和信息图。Max 版本采用扩展测试时计算，专为金融、生命科学和市场情报领域的深度研究设计，标志着 Google 在企业 AI 研究工作流基础设施上的最清晰布局。

查看原文 Google 研究代理 Gemini 企业AI

🚀 模型与行业动态

TOP Google 内部代码 75% 由 AI 生成，去年秋天才 50%

Google CEO Sundar Pichai 透露，Google 内部新增代码中 75% 由 AI 生成（去年秋天为 50%）。Google 近期成立「strike team」以提升 AI 编程能力，追赶 Anthropic——后者截至今年 2 月已有 70-90% 的代码由 Claude Code 编写。这表明 AI 编程代理已进入科技巨头核心工程流程，代码生成正在从辅助工具转向主要生产力。

查看原文 Google AI编程 Claude Code 行业趋势

Google Gemini 登陆气隙服务器: 断网运行的机密计算方案

Google 发布可运行于单机气隙服务器的 Gemini 方案，配备 8 块 NVIDIA GPU 和机密计算保护，由 Dell 制造。企业和政府机构可部署在 Cirrascale 数据中心或自有设施中，完全断开互联网和 Google 云基础设施连接。Google Cloud CEO Thomas Kurian 在 Next 2026 主题演讲中强调该产品为 Gemini 的最大新客户。

查看原文 Google Gemini 机密计算气隙部署

Anthropic 测试将 Claude Code 从 Pro 计划中移除

Anthropic 正在测试将 Claude Code 从 Pro 订阅计划中移除，以应对 Claude Code 带来的不可持续需求。作为替代方案，Anthropic 正在探索新的 Claude Code 访问模式。该测试反映了 AI 编程工具的爆炸性需求与模型推理成本之间的矛盾，Claude Code 已成为 Anthropic 最受欢迎的功能之一。

查看原文 Anthropic Claude Code Pro计划产品策略

Google vs AWS: AI Agent 技术栈控制权与执行权的分化

Google 和 AWS 展示了对 AI Agent 管理的不同思路，代表 AI 技术栈控制权与执行权正在分化。Google 强调模型的云端控制和多 Agent 协调能力，AWS 则侧重于本地化推理和边缘部署。两家公司的路线差异反映了企业 AI 基础设施竞争的核心分歧：平台依赖 vs 自主可控。

查看原文 Google AWS Agent 基础设施

🔥 社区热议

TOP Spotify 推出 AI 生成音乐标签: 自愿机制能否遏制虚假内容

Spotify 与行业组织 DDEX 合作推出 AI 音乐标签标准，DistroKid 为首个合作伙伴。自愿标签面临严峻挑战——AI 音乐上传量已威胁到真人艺术家生存空间，Spotify 数据显示 AI 上传正在超过真人上传速度。即使整个行业参与，自愿机制仍难以根本解决问题，监管介入的呼声日益增高。

查看原文 Spotify AI音乐内容标签版权

Mozilla + Anthropic Mythos 在 Firefox 150 中发现 271 个零日漏洞

Anthropic 的 Mythos AI 模型与 Mozilla 合作，在 Firefox 150 中发现 271 个零日漏洞，CTO 称其安全研究能力与世界顶级安全研究人员相当。Mythos 能够系统性发现复杂软件中的未知漏洞，代表 AI 网络安全应用的重大突破，但也引发对 AI 驱动攻击的担忧——防御性 AI 部署速度可能跟不上攻击性 AI 的进化。

查看原文安全 Anthropic 零日漏洞 Mozilla

Meta 计划用员工追踪数据训练 AI 代理: 隐私与数据获取的博弈

Meta 将追踪美国员工的鼠标移动、点击和击键以生成 AI 代理训练数据，软件运行在特定工作应用和网站上并辅以定期截图。该项目旨在解决 AI 代理处理日常计算机任务（鼠标移动、点击按钮等）时训练数据不足的问题，但面临欧洲监管限制的风险，突显了高质量交互训练数据的获取困境与隐私法规之间的深层矛盾。

查看原文 Meta 训练数据员工监控隐私

AI 治理幻象: 72% 企业对自身 AI 安全控制存在盲区

VentureBeat 调查显示 72% 企业拥有两个或更多主要 AI 平台，导致安全攻击面持续扩展。Mass General Brigham 医院案例显示企业被迫围绕 Microsoft Copilot 等工具构建安全外壳以防健康信息泄露。56% 受访者自信能检测 AI 异常，但近三分之一缺乏系统化检测机制——AI 治理的 Reality Gap 正在扩大。

查看原文 AI治理企业AI 安全合规

单 Agent 为何常胜多 Agent 集群: 斯坦福研究挑战 Agent 数量至上假设

斯坦福新研究挑战「Agent 越多 AI 越强」的假设，提出计算预算修复方案可改变这一竞争格局。Agent 集群虽然并行度高，但协调开销（swarm tax）往往抵消并行收益，单一 Agent 在固定预算下反而更高效。该研究对企业 Agent 系统设计具有重要启示：不是堆数量，而是合理分配计算资源。

查看原文 Agent 研究斯坦福效率

🤖 AI Agent 研究

⭐ GitHub 热门项目

🚀 模型与行业动态

🔥 社区热议

📱 微信扫码分享