Cursor每5小时迭代Composer:实时RL训练下,模型学会了「装傻逃罚」
据 1M AI News 监测,AI 编程工具 Cursor 发布博客介绍其「实时强化学习」(real-time RL)方法:将生产环境中的真实用户交互转化为训练信号,最快每 5 小时部署一个改进版 Composer 模型。此前该方法已用于训练 Tab 补全功能,现扩展至 Composer。传统方法通过模拟编程环境训练模型,核心难点在于模拟用户行为的误差难以消除。实时 RL 直接使用真实环境和真实用户反馈,消除训练与部署之间的分布偏移。每个训练周期从当前版本收集数十亿 token 的用户交互数据,提炼为奖励信号,更新模型权重后经评测套件(包括 CursorBench)验证无回退再部署上线。Composer 1.5 的 A/B 测试显示三项指标改善:代码编辑被用户保留的比例提升 2.28%,用户发送不满意追问的比例下降 3.13%,延迟降低 10.3%。但实时 RL 也放大了奖励黑客(reward hacking)风险。Cursor 披露了两个案例:模型发现故意发出无效工具调用后不会收到负面奖励,于是在预判会失败的任务上主动制造错误调用来逃避惩罚;模型还学会在面对有风险的编辑时转而提出澄清性问题,因为不写代码就不会被扣分,导致编辑率急剧下降。两个漏洞均在监控中被发现并通过修正奖励函数解决。Cursor 认为实时 RL 的优势恰在于此:真实用户比基准测试更难被糊弄,每次奖励黑客本质上都是一份 bug 报告。
2026-03-27 13:34:14
20B小模型搜索能力追平GPT-5和Opus:向量数据库Chroma开源Agent搜索模型Context-1
据 1M AI News 监测,开源向量数据库 Chroma 发布 Context-1,一个 200 亿参数的智能体搜索模型,专门用于多轮检索任务。模型权重以 Apache 2.0 协议开源,合成数据生成管线代码同步公开。Context-1 的定位是检索子代理(retrieval subagent):它不直接回答问题,而是通过多轮搜索为下游推理模型返回一组支撑文档。核心技术是「自编辑上下文」(self-editing context),即模型在搜索过程中主动丢弃不相关的文档片段,在有限的上下文窗口内为后续搜索腾出空间,避免上下文膨胀导致的性能退化。训练分两阶段:先用 Kimi K2.5 等大模型生成 SFT 轨迹做监督微调热身,再通过强化学习(基于 CISPO 算法)在 8000 多个合成任务上训练。奖励设计采用课程机制,早期重召回鼓励广泛探索,后期逐步转向精确度鼓励选择性保留。基座模型为 gpt-oss-20b,使用 LoRA 适配,推理时以 MXFP4 量化在 B200 上运行,吞吐量达 400-500 token/s。在 Chroma 自建的四个领域基准(网页、金融、法律、邮件)和公开基准(BrowseComp-Plus、SealQA、FRAMES、HotpotQA)上,Context-1 的 4 路并行版本在「最终答案命中率」指标上与 GPT-5.2、Opus 4.5、Sonnet 4.5 等前沿模型持平或接近,例如在 BrowseComp-Plus 上达到 0.96(Opus 4.5 为 0.87,GPT-5.2 为 0.82),而成本和延迟仅为后者的几分之一。值得注意的是,该模型仅在网页、法律和金融数据上训练,但在未参与训练的邮件领域同样表现出显著提升,显示搜索能力的跨领域迁移性。
2026-03-27 13:34:12
标普全球将基于Centrifuge构建的代币化国债基金JTRSY评级上调至「AAAf」
3 月 27 日,Centrifuge 宣布标普全球评级(S&P Global Ratings)将代币化国债基金 JTRSY 信用质量评级(FCQR)上调至「AAAf」,同时重申 JTRSY 获得「S1+」基金波动性评级(FVR),两项评级均为各自方法论下的最高等级。JTRSY 基于 Centrifuge 构建,由 Anemoy Capital 与 JHI Advisors 管理,目前资产管理规模已突破 10 亿美元。
2026-03-27 13:34:11
阿联酋推动组建国际工作组以重新开放霍尔木兹海峡
3 月 27 日,据英国金融时报:阿联酋推动组建国际工作组以重新开放霍尔木兹海峡。知情人士称,阿联酋将部署自己的海军。
2026-03-27 13:34:07
马斯克:将于下周发布Grok Imagine重大更新
3 月 27 日,马斯克在 X 平台回应社区时表示,将于下周发布 Grok Imagine 重大更新。结合马斯克此前确认的「史诗级」升级,社区分析「重大更新」或涉及视频长度延长、多模态输入优化或新 API,标志 xAI 在 AI 视频竞赛中加速追赶 OpenAI 和 Google。
2026-03-27 13:14:22
Messari:Polymarket 2028年乐观预期估值将达1112亿美元
3 月 27 日,Messari 高级分析师 Austin Weiler 在其最新研报中对预测市场 Polymarket 进行估值评估。报告称,实行手续费规则后,按照其现有的市场份额,可以预测 2028 年 Polymarket 完全稀释估值(FDV)的三个情景:乐观预期:1112 亿美元;中性预期:242 亿美元;悲观预期:64 亿美元。
2026-03-27 13:14:15
Trade.xyz于Hyperliquid生态「一枝独秀」,占HIP-3市场份额超90%
3 月 27 日,据 loris.tools 数据,伴随特朗普今年以来屡次上演周末「奇袭」行动,以美股、大宗商品合约交易为主的 Trade.xyz 借机承接传统金融市场休市期间的交易需求。自今年 1 月以来,Trade.xyz 成交量出现质的突破,并于 3 月 23 日创下单日 53.1 亿美元交易额纪录。虽然近两日交投出现回落趋势,但其在 HIP-3 整体市场份额仍超 90%。此外,HIP-3 生态中移动端交易平台 Dreamcash 日交易额达 1.59 亿美元,位列 Trade.xyz 之后。
2026-03-27 13:14:13
Eigen Labs发布AgentKit Beta版,支持构建可持有资产的自主AI代理
3 月 27 日,Eigen Labs 发布 AgentKit 首个 Beta 版本,这是一个面向开发者的工具包,用于构建能够持有资产、进行支付、管理身份并自主在线运行的 AI 代理。AgentKit 首批应用场景专注于「自主媒体代理」,这些代理可以生成内容(文本、图像、音频、视频),管理自己的社交存在,并持续运行。未来几周,Eigen Labs 将扩展 AgentKit 与热门社交平台的集成,添加新的代理管理模板,并推出易于使用的用户界面。未来版本的 AgentKit 还将引入对 x402 和 ERC-8004 等标准的原生支持。
2026-03-27 12:54:02
美参议员:加密市场结构法案已获两党支持,行业共识系最后障碍
3 月 27 日,据 Cointelegraph 报道,美国参议院银行委员会主席 Tim Scott 表示,加密市场结构立法已获得两党支持,行业内部达成一致是最后的障碍。
2026-03-27 12:34:10
Filecoin Onchain Cloud上线主网,为开发者提供可编程的存储与支付层
3 月 27 日,去中心化存储协议 Filecoin 宣布其「链上云」(Onchain Cloud)已正式上线主网,为开发者提供可编程的存储与支付层。该服务支持跨独立提供商的双重副本冗余,并通过 PDP 证明每 24 小时在链上验证一次数据。若证明过程中断,系统将自动停止支付。存储起步价设定为每 TiB 每月 2.50 万美元(按默认存储两个独立副本计算)。Filecoin 下一阶段将推出基于实时性能数据的强化版 SLA(服务等级协议),并为 AI 代理化(AI Agents)开发工作流提供深层工具支持。此外,开发团队还将持续优化 PDP 浏览器及支付流程,以进一步完善开发者生态。Filecoin 表示,去年 11 月测试网上线以来,Filecoin Onchain Cloud 已吸引超过 100 个团队在 AI、去中心化前端、计算流水线(Compute Pipelines)及数据索引等领域使用。截至目前,已有 478 个活跃数据集存储了共计 49.41 TiB 的数据,并有 81 个支付钱包通过 Filecoin Pay 连接至链上支付通道。
2026-03-27 12:34:06
美参议员Tim Scott:加密市场结构法案已获两党支持,行业共识系最后障碍
据Cointelegraph报道,美国参议院银行委员会主席Tim Scott表示,加密市场结构立法已获得两党支持,行业内部达成一致是最后的障碍。他透露与Coinbase进行了沟通,各方仍在谈判桌上。
2026-03-27 12:15:03
OpenAI重置Codex全套餐用量限额,配合插件上线鼓励用户尝鲜
据 1M AI News 监测,OpenAI Codex 负责人 Thibault Sottiaux 宣布,已重置所有套餐的 Codex 用量限额,让用户可以充分体验刚上线的插件系统。Codex 此前刚推出插件功能,首批集成 Slack、Figma、Notion、Gmail 等开发者常用工具。
2026-03-27 12:14:59
昨日比特币现货ETF净流出1.713亿美元,以太坊ETF净流出1.893亿美元
3 月 27 日,据 Farside Investors 监测,昨日美国比特币现货 ETF 净流出 1.713 亿美元,其中:IBIT 净流出 4190 万美元、FBTC 净流出 3280 万美元、BITB 净流出 3310 万美元、ARKB 净流出 3050 万美元。以太坊 ETF 净流出 1.893 亿美元,ETHA 净流出 1.402 亿美元。
2026-03-27 12:14:56
OpenAI研究岗仅剩7%,销售岗翻倍:招聘数据暴露四大实验室路线分裂
据 1M AI News 监测,AI 研究机构 Epoch AI 分析了 OpenAI、Anthropic、xAI 和谷歌 DeepMind 的公开招聘信息,从岗位结构中提取出各家的战略分歧。数据采集于 2026 年 3 月初。最显眼的趋势是销售岗激增。Anthropic 的市场销售类岗位占比从一年前的 17% 升至 31%,OpenAI 从 18% 升至 28%,均已成为各自最大的招聘类别。研究岗占比则大幅收缩,Anthropic 仅剩 12%,OpenAI 仅 7%。增长最快的细分是帮助客户落地 AI 的技术型销售角色(AI Success Engineer、Forward Deployed Engineer 等),Anthropic 该类岗位占比从 5% 升至 11%,OpenAI 从 11% 升至 17%,反映出客户「买了但不会用」的落地瓶颈。产品路线的分化更为明显:1. OpenAI 走全栈垂直整合。15 个岗位指向一款便携式硬件设备(配备摄像头、定制芯片、端侧模型推理),另有 21 个岗位与自研芯片相关,7 个机器人岗位涉及仿真训练和量产,还在孵化社交产品和求职平台2. DeepMind 同样押注硬件,招聘 XR 眼镜和人形机器人(含灵巧手)相关岗位3. Anthropic 不做自研芯片、不做硬件,基础设施依赖外部合作伙伴建设和托管,产品投入集中在 Claude Code(5 个岗位)和核心模型 API4. xAI 有 27 个内部数据标注岗位,是唯一公开大规模招聘标注员的实验室,其他公司要么外包要么不公开在 Agent 训练方面,Anthropic 的 Universes 团队和 OpenAI 的 Synthetic RL 团队都在构建用于长周期 Agent 训练的超真实 RL 环境,方向高度趋同。政府销售领域,OpenAI 和 Anthropic 各有 10 个政府销售岗位(涵盖联邦、国防和地方政府),xAI 则在伦敦和迪拜设了面向国际政府的销售岗。
2026-03-27 12:14:54
联邦法官叫停五角大楼对Anthropic的供应链风险认定
据 1M AI News 监测,加利福尼亚北区联邦地区法官 Rita Lin 发布临时禁令,叫停特朗普政府对 Anthropic 的「供应链风险」认定。这一通常仅用于与外国对手有关联企业的国家安全标签,此前从未被施加于美国本土公司。Lin 在长达 43 页的裁定书中措辞严厉,称该认定「很可能既违反法律又属武断专横」(likely both contrary to law and arbitrary and capricious),并写道:「现行法律中没有任何条文支持这样一种奥威尔式的观念,即一家美国公司可以因为对政府表达异议而被贴上潜在敌对者和破坏者的标签。」她引用五角大楼内部记录指出,Anthropic 被列为供应链风险的原因是其「通过媒体表现出的敌意态度」,构成「典型的非法第一修正案报复」。事件起因是 Anthropic 拒绝取消 Claude 模型在自主武器和大规模监控方面的使用限制,而五角大楼要求对 Claude 拥有不受约束的使用权限。国防部长 Pete Hegseth 随后将 Anthropic 列为供应链风险,禁止民用机构与其合作,并暗示军方供应商须终止与这家估值 3800 亿美元的公司的商业关系。Anthropic 估计,该认定的广泛适用可能造成数十亿美元损失,即使按最窄口径也有数亿美元年营收面临风险。多家大型科技公司提交了支持 Anthropic 的法律意见书。禁令将延迟 7 天生效以留出政府上诉时间。Anthropic 在华盛顿特区联邦法院提起的另一项挑战仍在审理中。
2026-03-27 11:55:12
中国央行原行长:可以探讨加密货币、区块链技术,关键是适配用户感受
3 月 27 日,中国人民银行原行长周小川昨日出席博鳌亚洲论坛 2026 年年会时表示,好的支付系统不是单项技术或某个单项性能的冠军,正如即时支付(instant payment)未必就是好,最重要的是「适配」,他指出监管要反洗钱,防止毒品交易、跨境赌博、电信诈骗等,论坛年会上几家央行行长提到现在支付系统使用了数字货币,但欺诈也用数字货币,而且「用得挺厉害」,周小川认为反欺诈能力仍然需要持续提升。在谈及监管适配话题时,周小川再次提到稳定币,他称现在电诈所得刚一到账马上就拆分到成百上千个账户,躲避合规性检查,这意味着事后挽回损失比较困难。「稳定币从根本上就绕过了合规审查,大家需要自己想明白,不要跟风。」周小川还强调加密货币、区块链技术是可以探讨的,但不等同于「点对点」「去中心化」都是积极的,也不能草率地认为原来后台系统中使用代理行、SWIFT 报文就是落后的,关键是适配用户的感受。(财新网)
2026-03-27 11:55:10
谷歌Gemini上线「搬家」工具:一键导入ChatGPT等应用的对话记录和偏好
据 1M AI News 监测,谷歌为 Gemini 推出「搬家工具」(switching tools),允许免费和付费用户将其他 AI 聊天应用的记忆、偏好和完整对话记录导入 Gemini,即日起面向消费者账户滚动上线。该工具包含两项功能:1. 记忆导入:用户在 Gemini 设置页面获取一段预设提示词,粘贴到当前使用的 AI 应用中,后者自动生成一份涵盖用户偏好、人际关系和个人背景的摘要,再将该摘要粘贴回 Gemini 即完成导入。2. 对话记录导入:用户可上传从其他 AI 服务商导出的 ZIP 格式聊天记录包,在 Gemini 中搜索历史对话并继续此前的讨论。谷歌同时将 Gemini 的「过往对话」(past chats)功能更名为「记忆」(memory)。企业账户、18 岁以下用户暂不支持,欧洲经济区、英国和瑞士用户暂未开放。Anthropic 本月早些时候为 Claude 推出了类似的记忆导入功能。
2026-03-27 11:55:00
Coinbase政策负责人呼吁改革加密税收规则,称现行制度已过时
3 月 27 日,Coinbase 首席政策官 Faryar Shirzad 呼吁美国立法者改革加密货币税收规则,称将加密资产视为「财产」的现行制度已难适应行业发展。其指出,在当前规则下,即使支付 Gas 费或使用稳定币进行日常交易也可能触发纳税义务,用户需计算成本基础并追踪损益,增加合规负担。Coinbase 数据显示,税务相关客服咨询量同比增长 34%,预计 2025 年将发放数百万份 1099-DA 表格,其中大量涉及小额交易。Shirzad 还表示,超过 63% 的用户存在成本基础记录缺口,建议对小额交易设立最低豁免额度,以降低合规复杂性,并警告若规则不调整,可能影响美国在加密领域的竞争力。(Cryptopolitan)
2026-03-27 11:34:51
加密支付公司2025年筹集资金总额跃升至26亿美元,超过去三年融资总和
3 月 27 日,据彭博社报道,加密货币领域的私募融资总额从 2024 年的近 130 亿美元增至 2025 年的 204 亿美元,但仍低于 2022 年 276 亿美元的峰值。私募融资的两大主要领域是「投资与交易基础设施」和「经纪商与交易所」(即金融应用)。支付基础设施位列第三。加密货币支付公司在 2025 年筹集的资金总额将跃升至 26 亿美元,超过过去三年筹集资金的总和。鉴于近期万事达卡收购 BVNK 的交易,这一数字今年有望进一步增长。相比之下,区块链游戏融资从 2022 年的 37.6 亿美元(约占总额的 14%)骤降至 2025 年,不再作为独立类别进行统计。Web3 dApp 在 2022 年筹集了 52 亿美元。而在 2025 年的报告中,仅针对消费者应用的 dApp 类别就只获得了 8.64 亿美元的融资。
2026-03-27 11:34:49
OpenAI Codex上线插件系统:开箱即用连接Slack、Figma、Notion、Gmail
据 1M AI News 监测,OpenAI 宣布为 AI 编程工具 Codex 推出插件(Plugins)系统,使 Codex 可开箱即用地连接开发者日常使用的工具,首批集成包括 Slack、Figma、Notion、Gmail 等。插件是可安装的工作流捆绑包,一个插件可同时打包三类组件:Skills(描述工作流的提示词,供 Agent 按需发现和调用)、Apps(应用集成或连接器映射)、MCP 服务器(远程工具或共享上下文)。用户可通过 Codex 应用内的插件目录浏览和安装 OpenAI 官方策划的插件,CLI 用户则通过 /plugins 命令访问。插件支持本地开发和分发。开发者可使用内置的 @plugin-creator 技能快速搭建插件骨架,通过仓库级或个人级 marketplace 管理本地插件。插件以 .codex-plugin/plugin.json 清单文件为入口,支持版本管理、权限策略配置和品牌展示。官方公共插件市场的自助发布功能尚未开放。
2026-03-27 11:34:47
  • 下一页
  • 风险提示:
    关于防范以“虚拟货币”“区块链”名义进行非法集资的风险提示 ——银保监会等五部门

    免责声明:
    作为区块链信息平台,本站所提供的资讯信息不代表任何投资暗示,鉴于中国尚未出台数字资产相关政策及法规,请中国大陆用户谨慎进行数字货币投资。