反击Claude Code!ChatGPT手机端终于支持远程接管Codex,400万开发者告别工位值守
据动察 Beating 监测,在竞品 Claude Code 率先实现移动端接管功能后,OpenAI 今日也正式将代码代理工具 Codex 整合进 ChatGPT 移动端,补齐了这项社区呼吁已久的能力。用户现在可以通过手机,远程监控和指挥运行在电脑或云端的 Codex 任务。官方同时披露,Codex 的周活跃用户已突破 400 万。手机端并非只能简单下发指令,而是同步开发机的实时运行状态。无论 Codex 运行在本地设备还是远程服务器上,手机端都能实时查看终端输出、截图、测试结果和代码差异。随着 AI 代理承担的开发任务耗时变长,用户可以利用碎片时间进行路径决策或权限审批,避免开发进度因等待人工确认而停滞。底层的跨设备连接由安全中继层(secure relay layer)驱动,开发机无需暴露在公网即可与手机端保持状态同步。针对企业环境,允许直连内部服务器的 Remote SSH 功能,以及用于定制代理行为、拦截敏感信息的 Hooks 机制均正式可用;企业版还新增了本地运行 Codex 的 HIPAA 医疗合规支持。随着大模型足以独立执行长程自动化任务,人机协作的瓶颈已从「敲代码」转向「审批纠偏」。无论是 Claude Code 还是 Codex,将控制台装进手机、抢占开发者的碎片时间,已成为 AI 代理工具的标准工作流。
消息称特朗普将撤销对美国国税局百亿美元诉讼
5月15日,据消息人士透露,美国总统特朗普预计将撤销其针对美国国税局的100亿美元诉讼,以换取设立一个17亿美元的基金,用于补偿那些声称自己被拜登政府错误针对的盟友。(东新社)
Anthropic警告中美大模型差距仅剩数月,呼吁立法封杀「蒸馏攻击」
据动察 Beating 监测,Anthropic 发布了一份关于中美 AI 竞争的政策文件,首次将中国大模型的蒸馏行为定性为系统性的工业间谍活动,呼吁美国国会立法将其非法化,并要求彻底堵死海外数据中心等算力漏洞。Anthropic 评估认为,虽然美国目前保持着 12 到 24 个月的总体优势,但中国顶尖模型在智力上仅落后几个月。文件指出,中国实验室能紧跟前沿全靠两大漏洞。一是获取受限的美国芯片,Anthropic 直接点名阿里和字节跳动利用东南亚数据中心规避禁令,并提及 DeepSeek 使用违禁芯片训练最新模型。二是通过大量虚假账号蒸馏美国前沿模型,以极低成本窃取创新成果。为此,Anthropic 呼吁明确立法规定蒸馏攻击非法,要求增加针对芯片走私的执法预算,并在美国实验室与政府间建立威胁情报共享机制。为了强调技术代差的实战杀伤力,文件披露其 4 月发布的 Mythos Preview 模型在单月内帮助 Firefox 修复的安全漏洞数量超过去年全年总和。这种能力被中国网络安全分析师形容为对手突然架起了全自动加特林。在行业对大模型蒸馏的道德边界仍有争议时,Anthropic 直接将其上升到国家安全高度,试图通过法律手段强行切断竞争对手的低成本追赶捷径。
美国达特茅斯学院披露持有 770 万美元比特币 ETF 以及 340 万美元 SOL ETF
5月15日消息,据 MacroScope 监测,美国达特茅斯学院在提交的 13F 文件中披露,截至 3 月 31 日其持有贝莱德比特币 ETF “IBIT” 约 201,531 股,价值 770 万美元,持仓较上季度不变。 该学院还报告了一个新头寸,即持有价值 340 万美元的 Bitwise Solana 质押 ETF(304,803 份)。
日本10年期国债收益率达约29年来高位
5月15日,据央视,15日,日本国内债券市场上,作为长期利率指标的新发10年期国债收益率一度升至2.665%,达到约29年来的高位。由于油价上涨带来的通胀压力,以及市场对日本国内经济对策导致财政恶化的担忧,债券面临抛售压力。(东新社)
美联储铁杆鸽派理事米兰宣布辞职
5 月 15 日,美联储理事斯蒂芬·米兰于周四正式递交辞呈,他表示自己将在新任主席凯文·沃什(Kevin Warsh)就职之时或之前,腾出其在美联储理事会中的席位。自 2025 年 8 月阿德里安娜·库格勒(Adriana Kugler)突然辞职后,米兰接替了她的理事位置。米兰在负责制定利率的联邦公开市场委员会(FOMC)中一直扮演着持不同意见的角色。在他出席的六次 FOMC 会议中,每一次都投了「反对」票。他表示,他认为个人消费支出(PCE)通胀,尤其是住房方面的通胀,将逐渐回落至正常水平,并再次强调,鉴于货币政策的滞后性,他认为有必要降息。米兰一直主张降低利率,他反对 FOMC 在 2025 年批准的三次各 25 个基点的降息,因他支持更大幅度的降息。今年,他三次投票反对维持利率不变的决定,转而支持降息 25 个基点。此外,他表示自己一直在推动采用更具前瞻性的货币政策方法,并认为美联储「需要更妥善地考虑非货币性因素及其对货币政策的影响」。他特别指出,人口增长放缓和移民减少对就业的影响,以及放松监管所带来的通缩压力。
OpenAI聘外部律所准备告苹果违约,高管称合作彻底失败
据动察 Beating 监测,OpenAI 正就与苹果长达两年的 ChatGPT 整合合作酝酿法律行动。据彭博社报道,OpenAI 律师近日已联合外部律所拟定多种法律方案,可能近期向苹果发出违约通知。矛盾的核心是 OpenAI 认为苹果从未兑现深度整合承诺。2024 年 6 月双方签约时,苹果曾将这笔合作比作与 Google 的 Safari 搜索协议,后者每年为双方贡献数百亿美元收入。OpenAI 据此预期 ChatGPT 整合每年能带来数十亿美元订阅收入,实际远未达标。一位 OpenAI 高管直言合作是一场失败,称苹果在产品层面没有做出真诚努力。问题出在苹果对整合的设计上。用户必须在 Siri 中主动说出 ChatGPT 才能触发 OpenAI 的服务,回复被限制在一个小窗口内,信息量远不如 ChatGPT 独立 App。OpenAI 内部用户研究显示,苹果用户压倒性地更倾向直接打开 ChatGPT App,而非通过 Siri 调用。OpenAI 还认为这种半吊子整合反而损害了自身品牌。雪上加霜的是,苹果正在多线摆脱对 OpenAI 的依赖。底层 AI 模型方面,苹果去年底已与 Google Gemini 团队另签合作,年付约 10 亿美元。iOS 27 将在 6 月 8 日 WWDC 上发布,届时 Siri 将开放接入 Claude、Gemini 等多家竞争对手。OpenAI 称开放竞争本身并非法律行动的触发点,问题在于苹果连最初的整合承诺都没有履行。另一个摩擦源来自硬件。OpenAI 去年收购了苹果前设计总监 Jony Ive 联合创立的设备公司,正在开发 iPhone 替代品,并持续高价从苹果硬件团队挖人,进一步激化了双方关系。消息传出后,苹果股价盘中一度下跌 1.2% 至 295.38 美元。OpenAI 尚未做出最终决定,仍希望庭外解决,法律行动预计不会在 Musk 案审结前启动。
Anthropic推出面向小型企业的Claude
5月14日,市场消息:Anthropic推出面向小型企业的Claude。
贝森特:(就美联储人事变动表示)认为沃什将持开放态度
5月14日,美国财长贝森特:(就美联储人事变动表示)认为沃什将持开放态度。
数据中心巨擘DayOne考虑将C轮融资规模扩大至40亿美元
据动察 Beating 监测,彭博社报道称,知情人士透露,在人工智能热潮带动相关基础设施资产需求激增之际,DayOne Data Centers 正考虑将其 C 轮融资规模扩大至超过 40 亿美元。知情人士称,新一轮融资规模约为今年 1 月上一轮融资结束时的两倍,且资金主要来自现有投资者。由于讨论仍属私密阶段,相关人士要求匿名。
年化收入翻5倍达3亿美元,算力平台Modal拟以45亿美元估值融资
其目标估值约为 45 亿美元,较几个月前的上一轮融资溢价 80%,预计筹集 1.5 亿至 2.5 亿美元,现有投资者 Accel 和 Redpoint Ventures 正在参与谈判。高估值的直接支撑是营收暴涨。Modal 的年化收入已达到约 3 亿美元,是去年秋季的 5 倍。这波增长主要由 AI Agent 的沙盒需求推动。沙盒为开发者提供了一个隔离的软件环境,允许 Agent 在其中安全执行代码而不会破坏主系统。随着 Ramp、Lovable 等企业大量使用沙盒开发 Agent 并进行强化学习,Modal 直接吃到了应用层爆发的红利。但在高增长背后,由于 OpenAI 等头部公司对算力的巨大需求推高了 GPU 现货价格,Modal 这类向大型云厂商租借 GPU 再转租给开发者的平台,未来利润空间可能会受到严重挤压。
Binance合约将上线多个U本位TradFi永续合约
5 月 14 日,据官方公告,Binance 合约平台将于以下时间上线永续合约:2026 年 05 月 15 日 22:00(东八区时间):SOXLUSDT 永续合约,最高杠杆可达 20 倍;2026 年 05 月 15 日 22:05(东八区时间):MRVLUSDT 永续合约,最高杠杆可达 10 倍;2026 年 05 月 18 日 21:30(东八区时间):CRWVUSDT 永续合约,最高杠杆可达 10 倍;2026 年 05 月 18 日 21:35(东八区时间):WMTUSDT 永续合约,最高杠杆可达 10 倍;2026 年 05 月 18 日 21:40(东八区时间):JPMUSDT 永续合约,最高杠杆可达 10 倍;2026 年 05 月 18 日 21:45(东八区时间):VUSDT 永续合约,最高杠杆可达 10 倍;2026 年 05 月 18 日 21:50(东八区时间):BRKBUSDT 永续合约,最高杠杆可达 10 倍。
Binance将上市Gensyn(AIGENSYN)并为其添加种子标签
5 月 14 日,据官方公告,Binance 将上市 Gensyn(AIGENSYN)并为其添加种子标签。
AI能取代金融分析师?Vals AI新版测试全军覆没,GPT 5.5准确率勉强过半
据动察 Beating 监测,AI 评测机构 Vals AI 发布了第二代金融智能体基准测试(Finance Agent v2)。这是一个模拟初级金融分析师工作流的端到端测试,包含 927 道专家审核问题。新版测试的难度大幅飙升,GPT 5.5 仅以 51.76% 的准确率登顶,与 Claude Opus 4.7(51.51%)和 Claude Sonnet 4.6(51.03%)的比分极度胶着。与单轮问答不同,该测试要求模型在数百页的 10-K 和 10-Q 财报中自主寻找相关段落,处理跨年份财务报表调整,并带着精确的中间数字完成多步计算。Vals AI 透露,如果采用「必须完全答对」的严格评分标准,所有前沿模型的准确率全部跌破 40%;在最难的「财务建模」和「先例分析」类别中,最高分仅有 23%。在其他模型方面,Kimi K2.6 以 44.87% 排在第五,是得分最高的国产模型;紧随其后的是 GLM 5.1(44.79%)和 DeepSeek V4(44.08%)。此外,官方将「最快速度」标签授予了 Claude Opus 4.7(单次耗时 360 秒),GLM 5.1 则拿下了「最省预算」标签(单次成本 0.62 美元)。这次测试得分的集体下挫(上一代测试中 Opus 4.7 得分为 64.4%)证明了一点:目前的 AI 已经可以搞定简单的检索,但在需要遵守特定行业惯例、且对数字精准度要求极高的金融深水区,还远远无法取代人类分析师。
吊销凭证反而触发物理清盘?TanStack窃密蠕虫被开源,内藏不可逆死手开关
据动察 Beating 监测,制造 npm 供应链投毒案的黑客组织 TeamPCP 在 GitHub 上以 MIT 协议开源了涉事蠕虫 Mini Shai-Hulud 的完整源码。安全人员从代码中发现,该恶意软件自带「死手开关」,如果中招的开发者在没有彻底清杀残留文件的情况下,直接吊销被盗的 GitHub 或云服务凭证,恶意程序会立刻把电脑主目录完全清空。研究人员证实,该蠕虫会在 macOS 或 Linux 后台安装一个守护进程,每分钟检测一次窃取到的凭证是否依然有效。一旦发现凭证被服务器拒绝(意味着受害者已执行凭证轮换),蠕虫会立刻调用系统底层的 shred 命令,把当前用户主目录(Home directory)下的所有可写文件进行不可逆转地粉碎覆盖。这直接颠覆了常规的安全响应流程:企业遭遇凭据泄露时的第一反应通常是立刻挂失密钥,但这在这场攻击中反而会直接触发本地数据的毁灭。目前该蠕虫已确认感染包含 TanStack、UiPath 和 Mistral AI 在内的 170 多个包库的近 400 个版本。黑客通过名为 PedroTortoriello 的账号公开代码并嘲讽「开源这场杀戮」后,甚至有第三方提交 PR 为其添加 FreeBSD 支持。目前,微软已火速封禁该账号并清除了全部 GitHub 仓库及 Fork 分支,但已泄露的源码仍在其他渠道流传。
LangChain发布全自动查Bug神器:自动定位故障,修复代码直接推给用户
据动察 Beating 监测,LangChain 在其 Interrupt 大会上宣布了两项旨在解决 Agent 调试难题的核心升级:全新底层数据库 SmithDB 与自动化排错工具 LangSmith Engine。旧的底层架构已难以承载日益增长的 trace(执行轨迹)数据。新发布的 SmithDB 放弃了传统的本地磁盘方案,改用基于对象存储构建。这一变动将核心工作负载的查询性能最高提升了 15 倍。在更快的底座之上,LangSmith Engine 直接把「改 Bug」的过程自动化了。它会在后台持续监控生产环境,自动把失败的调用归类,并定位出是哪段代码出了问题。不仅如此,它还会直接为开发者草拟好修复漏洞的 PR,以及对应的测试集(evals)。对于复杂的 Agent 而言,人工翻阅海量 trace 找规律已经成为最大的效率瓶颈。LangChain 此次更新,实质上是将「发现报错 - 定位代码 - 自动修复 - 补充测试」的排错闭环做成了一条全自动流水线。
摩根大通:将思科目标价从96美元上调至120美元
5 月 14 日,摩根大通表示,将思科 (CSCO.O) 目标价从 96 美元上调至 120 美元。(金十)
币安上线SOXL、MRVL等7个U本位永续合约,最高20倍杠杆
5月14日,据官方公告,币安将于 2026 年 5 月 15 日 14:00(UTC)上线 SOXL USDT 永续合约(最高 20 倍杠杆)及 MRVL USDT 永续合约(最高 10 倍杠杆),并于 2026 年 5 月 18 日 13:30(UTC)起陆续上线 CRWV USDT、WMT USDT、JPM USDT、V USDT、BRK BUSDT 永续合约(最高 10 倍杠杆)。
Binance将推出持有USD1瓜分1300万美元等值WLFI空投活动
5 月 14 日,据官方消息,Binance 宣布自 2026 年 5 月 15 日 08:00(东八区时间)起,Binance 将为在平台持有 World Liberty Financial USD(USD1)的合格用户推出空投活动。符合条件的用户将瓜分 1300 万美元等值 World Liberty Financial(WLFI)总奖池。活动期间,WLFI 奖励将于每周六 02:00(东八区时间)前发放给持有 USD1 的合格用户。活动时间为 2026 年 5 月 15 日 08:00 至 2026 年 6 月 12 日 08:00(东八区时间)。
马斯克承诺每两周出一版新Grok,但造模型的三个核心人员一周内全离职
据动察 Beating 监测,过去一周,xAI 有三位直接操刀 Grok 模型构建的技术核心先后宣布离职。与此前联合创始人和高管层面的离开不同,这三人分别是搜索后训练、预训练和语音三条核心产品线的实际负责人,他们的集体出走将直接冲击 Grok 下一代模型的迭代能力。Tianyi Zhang 今日在 X 确认离开。他是搜索与事实性后训练团队负责人,此前在苹果担任了五年机器学习工程经理。他带队将 Grok 实时模式的事实错误率压降了 70% 至 80%,助推 Grok 4.20 上线即登顶 Search Arena 盲测榜首。该搜索能力目前也已接入特斯拉车机。庄钧堂(Juntang Zhuang)5 月 9 日宣布已于今年早些时候离开。他从 Grok 2 起深度参与预训练,后来成长为预训练团队负责人,主导了 Grok 4 系列全线模型的训练基础设施与核心配方。加入 xAI 之前,他在 OpenAI 工作两年,是 GPT-4o 核心贡献者和 GPT-4 Turbo 128k 长上下文算法发明人。David Haxton 5 月 10 日确认离职,此前从零搭建了 Grok 的语音 Agent、实时思考语音和声音克隆功能。在 Sierra AI 的 τ-Voice 语音 Agent 基准测试中,他带队的 Grok Voice 目前排名第一,领先 OpenAI 和 Google。这波离职的时间点格外扎眼。目前对外开放的 Grok 4.3 仍只是一个 0.5T 参数的训练中间版。马斯克 4 月 18 日说真正的 1T 旗舰「离初训完成还剩约 5 天」,次日又明确 Grok 4.4 = 1T、预计 5 月初发布,Grok 4.5 = 1.5T、争取 5 月底交付,并宣称模型工厂已跑通,此后每两周下线一版新基础模型。如今已是 5 月中旬,Grok 4.4 仍未露面,而实际造这些模型的核心人手却在加速流失。xAI 正经历一场从联合创始人到模型核心层的系统性人才塌方。
  • 下一页