~/ai-daily-insights
返回 AI Daily 首页 cd ~/news
2026-06-25 · #OpenAI · #Anthropic · #美光 · #字节跳动 · status: parsed

❯ OpenAI 联手博通发布首款推理芯片 Jalapeño,9 个月走完设计到流片

[首颗自研芯片] OpenAI 与博通联合发布首款定制推理芯片 Jalapeño,从设计到流片只用 9 个月,号称是高性能先进半导体史上最快的 ASIC 开发周期,计划 2026 年底开始部署。这是 OpenAI 从模型、产品一路向下,第一次把手伸进自家硅片。芯片专为大语言模型推理优化,早期测试显示每瓦性能显著优于现有最高水平。

[全栈闭环] 这颗芯片由 OpenAI 设计加速器、博通负责硅实现与网络互连,制造伙伴还包括 Celestica,是双方共建的多代计算平台中的第一代。关键细节是 OpenAI 用自家模型参与了部分设计与优化,把”AI 设计 AI 芯片”从口号落到流片表上——这也是 9 个月极速周期的来源之一。架构上它通过减少数据搬运、平衡算力内存与网络资源,让实际利用率逼近理论峰值,针对的正是 ChatGPT、Codex 与 API 上真实跑的推理负载。早期样片已在实验室以目标频率和功耗运行,包括 GPT-5.3-Codex-Spark。

[算力账重写] 真正被改写的是 OpenAI 对英伟达的依赖结构。过去它每一份推理算力都要向外采购 GPU,自研芯片让它在采购、功耗与单位推理成本上第一次握有自己的杠杆,并把模型、产品、收入、基础设施串成一个内部飞轮。对英伟达而言,最大的几家客户正一个接一个从”买芯片”转向”设计芯片”;对博通来说,定制 ASIC 业务又添一个超级订单。后续要盯的是详细基准测试——OpenAI 称稍后公布,那才是这颗芯片成色的真考题。

signal: 当模型公司开始自己设计推理芯片,算力护城河就从”谁买得起 GPU”挪到”谁控制得了单位推理成本”。

❯ Anthropic 致信美方指控阿里大规模蒸馏 Claude,称三个月调用 2880 万次

[指控升级] Anthropic 向美国参议员与白宫官员致信,指控阿里巴巴在 4 月至 6 月间通过近 2.5 万个欺诈账号绕过地域限制,对 Claude 发起 2880 万次调用,称这是迄今针对其技术、由中国主体发起的最大规模数据窃取行动(据彭博独家报道)。消息当日,阿里美股一度下跌约 3%

[对抗性蒸馏] Anthropic 把这套手法称为”对抗性蒸馏”——外部主体反复诱导一个先进模型,批量收割其推理模式与数据结构,再用来低成本训练竞品。信中点名与阿里旗下 Qwen 实验室相关的操作者,称其重点定向软件工程与 agentic 推理这两类高价值能力。这并非孤例,而是 Anthropic 口中”中国实验室系统性抓取美国前沿模型输出”的一环;此前业内已多次流传类似指控,但这是头一回有头部实验室拿出账号数与调用量这种硬数字,并直接递到立法者与白宫桌上。

[从商业到地缘] 这封信把一桩平台滥用问题抬成了中美 AI 博弈的筹码。对监管者,它递上了收紧前沿模型对外访问的现成理由;对阿里与一众中国大模型厂商,则等于把”调用海外 API 做蒸馏”这条捷径公开标价并施压。压力会先落到云厂商的账号风控与 API 准入策略上——前沿实验室接下来要权衡的,是把模型能力卖给尽可能多的用户,还是为防蒸馏主动收窄外部可达性。

signal: 真正被定价的不是 2880 万次调用,而是”开放 API”与”防止竞品白嫖能力”之间那道越来越贵的取舍。

❯ 美光 Q3 营收同比涨 346% 至 414.6 亿美元,Q4 指引上看 500 亿

[爆发式财报] 美光第三财季营收 414.6 亿美元,同比暴涨 346%、环比增 74%,远超分析师约 358 亿美元的预期;调整后毛利率 84.9%,同比翻倍有余;公司给出第四财季约 500 亿美元的营收指引,同样高于市场预期。财报后股价盘后跳涨超 14%,创历史新高。这已是美光连续第五个季度刷新营收纪录。

[供给吃紧] 撑起这份财报的是 AI 内存的结构性短缺。美光数据中心业务营收同比增长超过七倍,高带宽内存 HBM 是英伟达等 AI 加速器的标配,而它正处在严重供不应求的状态。管理层在电话会上明确表示,AI 内存的供应紧张会持续到 2027 年之后——这把市场原本担心的”内存周期见顶”叙事直接推后,也解释了为何 84.9% 的毛利率能盖过英伟达、Meta 等一众科技龙头。换句话说,这一轮 AI 资本开支的红利,正实打实地流进上游存储厂商的利润表。

[定价权易主] 对采购方而言,被改写的是议价天平。AI 算力的瓶颈正从 GPU 算力本身,向 HBM 这类配套内存蔓延,谁能锁定供给谁就握住产能。下游云厂商和模型公司接下来要看的,不再只是加速器交期,而是内存能不能按时按量配齐;对三星、SK 海力士这两家 HBM 对手,美光的指引等于把整个内存超级周期又往上抬了一格。风险在于估值已被拉得很满,一旦供给缺口提前缓解,回调同样会来得很快。

signal: AI 这轮最确定的赚钱生意,眼下不在模型层,而在卖给所有人内存的那张产能表上。

❯ SK 海力士申请纳斯达克上市拟募 294 亿美元,超越三星成韩国市值第一

[历史级募资] SK 海力士提交文件,拟通过纳斯达克美国存托凭证 ADR 募集约 294 亿美元,发行 1779 万股新股,预计 7 月 10 日起交易,所得资金全部用于扩建先进 AI 内存产线与 EUV 设备采购。若按指导区间上限定价,这将是史上最大规模的 ADR 发行,超过阿里巴巴 2014 年纽约上市时 218 亿美元的纪录。

[14 年押注兑现] 这场上市是 SK 海力士长达十余年押注 HBM 的收官时刻。靠着在高带宽内存上的领先卡位,它如今握有约 60% 的 HBM 市场份额,2026 年以来股价飙升超过 300%,并一举超越三星电子,结束后者长达二十余年的韩国市值霸主地位。这家曾经在内存价格战里苦苦追赶的二线厂商,因为赌对了 AI 加速器对 HBM 的刚需,被推到了整条 AI 硬件供应链最稀缺的位置上。把募资全砸向产能而非补血,说明它要的是趁周期高点把领先优势浇筑成产能壁垒。

[资本与产能竞速] 这笔钱真正要解的是产能竞速。HBM 现在是卖方市场,谁先建起先进制程产线,谁就在未来几年的供给分配里占住身位。对三星和美光,SK 海力士拿 294 亿美元去扩产,等于把军备竞赛的门槛又抬高一截;对下游买家,则要重新掂量是绑定单一龙头还是分散下单。后续看点是这笔巨额募资能否顺利在 7 月按上限定价——它本身就是 AI 资本市场热度的一次实弹检验。

signal: 把全部募资投向产能而非偿债,SK 海力士赌的是 HBM 短缺还会持续够久,久到产能壁垒能落地。

❯ 高通把 2029 年非手机芯片营收目标上调至 400 亿美元,盘后涨 15%

[目标翻倍] 高通将 2029 财年非手机芯片营收目标从 220 亿美元几乎翻倍上调至 400 亿美元,其中新公布的数据中心 AI 基础设施业务目标超过 150 亿美元;消息一出,高通盘后股价大涨约 15%。同日它还发布了面向数据中心的 CPU 产品 Dragonfly C1000,并宣布 Meta 将在该芯片 2028 年投产后采用。

[摆脱手机依赖] 这是高通系统性”去手机化”的一次集中亮牌。除数据中心外,它把汽车业务的设计中标管线提升到 650 亿美元、2029 财年营收目标 100 亿美元,物联网营收目标定在 140 亿美元以上。更受关注的是另一条线:据路透报道,高通正与字节跳动洽谈提供定制芯片设计服务,方案可能部分基于其 2025 年 6 月收购的高速连接公司 Alphawave Semi 的技术,涉及视频处理单元 VPU,目标年底量产。若谈成,字节将成为高通新设芯片设计业务的首批客户之一。

[从卖芯片到卖设计] 对高通而言,被重塑的是商业模式本身——从卖标准化手机 SoC,转向给大客户做定制硅与数据中心 CPU。这把它直接推到与英伟达、博通同一张牌桌。下游超大规模厂商接下来要算的是:在英伟达 GPU 之外,是否值得为高通的 CPU 与定制方案分配一部分预算。不确定性在于,与字节的洽谈仍在早期、未必落地,而数据中心市场早已挤满对手,400 亿这个目标要靠未来几年的真实中标来兑现。

signal: 高通这次卖的不再是手机里那颗芯片,而是”帮你设计芯片”这门生意——它想坐到博通的位置上去。

❯ 智谱市值突破 1280 亿美元,考虑赴港增发募资数十亿美元

[暴涨后融资] 中国大模型公司智谱(Zhipu)正考虑在香港增发股票、募资数十亿美元,时间可能最早落在下月。此前其股价自 1 月上市以来累计上涨约 2000%,市值一度突破 1 万亿港元(约 1280 亿美元),年内涨幅高达约 2467%,成为中国市值最高的 AI 公司(据彭博报道)。

[旗舰点火] 这轮疯涨的直接导火索,是智谱此前在 6 月 17 日正式发布并开源的新旗舰模型 GLM-5.2,主打 100 万无损上下文与增强的编码能力,发布当日股价一度暴涨 42%。一家年初才登陆港股的公司,凭一款开源模型在半年内把市值送进万亿港元俱乐部,本身就说明港股投资者正把中国头部大模型当成稀缺的 AI 资产抢筹。趁股价高位增发,是把账面热度兑换成真金白银的研发与算力弹药——对烧钱的大模型生意,这步几乎是必选项。

[高位兑现的考验] 真正要被检验的是这份估值的含金量。股价半年涨 20 倍,把智谱的市值锚点从基本面推向了情绪与稀缺性,增发既能补血也是一次压力测试:市场愿不愿意在万亿港元的水位上继续接盘。对其他中国大模型厂商,智谱的资本路径提供了一个模板——用开源旗舰打出声量、再借资本市场高位融资。后续看点是增发的规模与定价,以及 GLM 系列能否用持续的模型迭代撑住这份估值。

signal: 半年 20 倍之后,智谱要回答的不再是模型好不好,而是市场愿不愿在万亿港元的高位上替它的下一步买单。

❯ 字节跳动寻求 200 亿美元境外贷款,规模为公司历来最大

[最大借贷] 字节跳动正与多家银行初步洽谈一笔约 200 亿美元的境外贷款,期限三年、可延长至最多五年,将是这家 TikTok 母公司历来最大规模的境外融资(据彭博报道)。资金主要投向两个方向:人工智能投入与数据中心扩建。这笔贷款几乎是其上一次境外借贷纪录的两倍。

[AI 军备开支] 此前据彭博报道,字节上一次大举进入全球贷款市场还是在 2024 年,当时通过 20 多家国际与中国银行筹得 108 亿美元。背景是时隔不到两年就把规模翻倍,反映出它在 AI 基础设施上的开支正陡峭抬升——从大模型训练、推理算力到自建数据中心,每一项都是以百亿美元计的资本黑洞。对一家并未上市、现金流主要来自广告与电商的公司,选择用境外贷款而非股权融资来填这个洞,既是对自身造血能力的信心,也是在 AI 这场不能缺席的竞赛里抢时间窗。

[非上市巨头的杠杆] 被推到台前的是字节的融资方式本身。在同行多靠 IPO 或股权融资补充弹药时,它选择加杠杆,把扩张的成本压在债务而非稀释股权上。对放贷银行,这是一笔难得的大单,也是一次对字节偿债能力的押注;对竞争对手,200 亿美元的算力与数据中心投入会把 AI 基建的门槛又抬高一截。接下来要看的是这笔贷款的最终规模与定价,以及这些资本究竟砸向训练集群还是出海算力。

signal: 一家不上市的公司用历史最大一笔借贷去填 AI 基建的坑,赌的是债务利息会比错过这轮算力竞赛更便宜。

❯ 孙正义称软银旗下 Arm 将自造芯片,估值还有 10 倍以上空间

[十倍豪言] 软银创始人孙正义公开表示,旗下 Arm 的估值有望从当前约 3910 亿美元市值再涨 10 倍以上,对应市值将逼近 4 万亿美元。他把这份信心部分归于 Arm 已开始自造芯片的转向,并称 AI 计算需求正向以 CPU 为中心的架构倾斜。据公开数据,Arm 股价 2026 年至今已上涨约 231%,但孙正义认为”这才刚刚开始”。

[从授权到制造] 这番表态背后是 Arm 商业模式的一次根本位移。此前长期以来 Arm 只做芯片架构授权、收取专利费,自己不碰制造;如今要亲自下场造芯片,等于从产业链上游的”卖图纸”走向”卖成品”,直接切入更高价值、也更重资产的环节。孙正义把这一步和软银更宏大的超级智能赌注绑在一起——据报道,他为软银定下了未来十年净资产达 1000 万亿日元(约 6.19 万亿美元)的目标,并借机为软银投资英特尔辩护,称初始 20 亿美元的持股已大幅增值。

[愿景与兑现之间] 真正悬而未决的是这些数字能否落地。4 万亿美元的市值会让 Arm 跻身全球最有价值的公司之列,而支撑它的”自造芯片”战略仍在早期,重资产制造对一家轻资产授权公司是全新的能力考验。对投资者,孙正义的喊话既是路标也是风险提示:要不要为一个尚未兑现的制造转型,给 Arm 付出 10 倍溢价。后续看点是 Arm 自造芯片的真实进度,以及 AI 是否真如他所言把算力重心拉回 CPU。

signal: 孙正义给 Arm 标出 10 倍空间的同时,也把一道考题摆上桌:一家卖图纸的公司,能不能真学会卖成品。

❯ 马斯克宣布 SpaceX 太空算力星座 Starmind,规划百万颗卫星入轨

[太空数据中心] 马斯克在社交平台确认,SpaceX 规划中的太空 AI 算力卫星星座定名 Starmind,目标是把多达 100 万颗卫星送入轨道,让 AI 推理直接在天上完成、再把结果传回地面。SpaceX 已于今年 1 月向美国联邦通信委员会 FCC 提交申请,每颗卫星峰值发电能力约 150 千瓦,搭载成排的算力机架。

[绕开地面瓶颈] 据公开信息,Starmind 与此前提供上网服务的星链不同,它要做的是把数据中心整体搬上天。卫星在轨用机载处理器跑推理负载,靠星间激光链路互联,再将输出在毫秒级延迟内打到地球任意位置,全程不经地面数据中心。SpaceX 押注的逻辑很直接:地面 AI 数据中心正撞上土地、电力、水和社区反对的多重天花板,而太空有近乎无限的太阳能、天然真空散热、且无需分区审批。按规划,两颗 AI1 原型卫星将于 2027 年初发射,首代设计高 20 米、展开翼展达 70 米,比波音 747-8 还宽。

[从设想到工程] 被重新定义的是”算力放在哪”这个问题。如果在轨推理真能跑通,AI 基础设施的选址逻辑就从”哪里有电有水”转向”哪里能发火箭”,而这恰好是 SpaceX 独有的能力。质疑同样巨大:百万颗卫星的轨道资源、散热、辐射与发射成本,每一项都是尚未验证的工程难题。对地面数据中心运营商和电力供应商,这是一个遥远但不能忽视的长期变量;对监管者,FCC 如何处理百万级卫星申请将是第一道门槛。

signal: 把数据中心搬上天目前还是张工程草图,但它点破了地面 AI 算力最硬的约束——不是芯片,是电和地。

❯ Meta 据文件将推 AI 预测市场 App,由模型生成问题并裁决结果

[AI 全程操盘] 据 NPR 看到的文件,Meta 计划推出一款独立于 Facebook 和 Instagram 的 AI 预测市场 App,内部代号 AntwerpFBForecast,用自家大模型 Llama 从热门话题自动生成可下注的问题、做个性化推荐,并由 AI 近乎实时地裁决事件结果。用户用”虚拟货币”对真实世界事件下注,对标 Kalshi、Polymarket 等热门平台。

[重建旧品] 值得一提的是,这其实是一次”重建”。Meta 此前曾因”人工出题的运营成本过高”关停过一款类似的预测市场产品,如今把当初最重的环节——出题、推荐、裁决——全部交给 AI,正是要用模型的边际成本去解决人力规模化的难题。这也是 Meta 给 Llama 找的一个具体落地场景:让模型不只是聊天助手,而是直接驱动一款消费级产品的核心循环。把”判定某件事是否发生”的最终裁量权交给 AI,则是这款产品最激进、也最容易引发争议的设计。

[裁决权的争议] 最敏感的不是下注,而是裁决。让 AI 对”某事是否发生”拥有最终话语权,一旦模型判错或被诱导,影响的就不只是一次聊天输出,而是真实的输赢结果。对 Meta,这是 Llama 商业化的一次大胆试验;对监管者和用户,则要重新评估”AI 当裁判”的可靠性与可申诉性。即便用的是虚拟货币,预测市场本身在多个司法辖区都踩在监管灰色地带,Meta 这一步会把”AI 裁决”的可信度问题第一次推到大众消费场景里。

signal: 这款 App 真正的实验品不是下注玩法,而是”让模型对现实做最终判定”——AI 当裁判的可靠性,第一次要在真金白银的赌局里被检验。

❯ Wired 称 Anthropic 改派联创 Tom Brown 出面,白宫态度随之转暖

[换人破局] 据 Wired 报道,特朗普政府近来对与 Anthropic 的沟通明显更满意,原因是在关于重新发布 Fable 5 模型的白宫会谈中,CEO Dario Amodei 已被联合创始人 Tom Brown 替换出面。Amodei 并未被解职、仍是 CEO,但在可能左右 AI 监管走向的关键对话里,他被”按下了暂停键”。

[技术派对政治派] 这次换人本身就是一种信号。Tom Brown 是 Anthropic 负责算力运营的联合创始人,外界把他出面解读为:Anthropic 选择把这场僵局当作”可以技术性谈拢的分歧”,而非价值观对抗。一名白宫内部人士的说法很直白——“Tom Brown 不像 Dario 那样别扭,是真能聊得下去的”。背景是 Amodei 一向以对 AI 风险直言、对监管态度强硬著称,这与特朗普政府的立场屡有摩擦;6 月 19 日,特朗普曾公开称 Anthropic”不再是国家安全威胁”,并赞其”表现得非常负责任”,措辞的转暖与这次人事调整时间线吻合。

[沟通风格定生死] 被摆上台面的是创始人个人风格对政企关系的重量。在 AI 监管尚无定规的当下,谁去白宫、用什么姿态谈,可能比公司实际立场更能左右结果。对 Anthropic,这是一次务实的姿态调整——把最能”聊得下去”的人推到前台;对其他前沿实验室,它示范了一件事:与政府打交道,选对谈判代表本身就是策略。后续要看的是 Fable 5 的解禁进展,以及 Amodei 的”隐身”是临时战术还是长期安排。

signal: 决定 Anthropic 与白宫关系走向的,眼下不是公司立场变了多少,而是换上了一个”聊得下去”的人。

❯ 阿里在 Qoder 平台下调 Qwen 调用价格,抢占美国工作时段需求

[降价抢量] 阿里巴巴在其编程平台 Qoder 上下调了 Qwen 模型的调用价格,目标直指美国工作时段的开发者需求。这是中国大模型厂商把价格战从国内打到海外开发者市场的又一步,瞄准的正是 Claude、GPT 系列编程工具所主导的高价值 coding 场景。

[编码场景争夺] 把降价精准锚定”美国工作日”,意图相当明确——在欧美开发者最活跃的时段,用更低的单位 token 价格去撬动那些对成本敏感、又高频调用模型写代码的用户。编码是当前大模型变现最扎实的场景之一,也是 Anthropic 在指控信里点名”被定向蒸馏”的能力方向;阿里一边被指控大规模调用 Claude,一边在自家平台用低价 Qwen 抢同一批开发者,两条线放在一起看格外耐人寻味。对国内厂商,这延续了”开源旗舰打声量、低价抢调用量”的一贯打法。需要说明的是,具体降价幅度与计价口径仍以阿里官方公布为准。

[价格战出海] 真正被压低的是海外开发者的迁移成本。当 Qwen 在编码质量上逼近第一梯队、价格又显著更低时,部分成本敏感的团队就有了试用乃至切换的理由。对 Anthropic、OpenAI,这把竞争**从”模型能力”拉到”每千次调用多少钱”**的近身肉搏;对开发者,则多了一个用脚投票的低价选项。后续看点是 Qwen 在真实编码任务上的口碑能否撑住这波低价获客,以及海外用户对中国模型的数据与合规顾虑会不会成为拦路石。

signal: 中国大模型的价格战正式打到美国开发者的工作日时段,编码场景的较量从”谁更聪明”滑向”谁更便宜”。

❯ 传言称 Fable 5 本周回归或永久并入订阅,官方尚未证实

[未证实传言] 社区近日热传 Fable 5 本周回归,且有可能被永久并入订阅计划。该说法主要来自高人气资讯账号 kimmonismus 的连续两条推文(合计逾 27 万次浏览)及账号 iruletheworldmo 的多次喊话,依据是 Claude Code 近期更新里被解读出的若干”暗示”。Anthropic 官方至今没有任何确认,本条仅作传言记录。

[线索与口径] 把这条传言的成色摊开看:它的”证据”是社区对 Claude Code 更新内容的解读,而非官方公告或可核实的发布说明,属于典型的”线索级”信号。结合本期另两条已被主流媒体证实的新闻——Anthropic 改派 Tom Brown 与白宫沟通 Fable 5 解禁、特朗普 6 月 19 日称其”不再是国安威胁”——Fable 5 重新可用确有现实推力,但”本周回归""永久并入订阅”这两个具体说法仍只是社区推测。多账号在传不等于已证实,热度高也不改变其口径未经官方背书的事实。

[怎么对待传言] 对读者,正确的姿态是把它当成一个待验证的预期而非既成事实:如果属实,Fable 5 并入订阅会直接改变 Anthropic 订阅用户的可用模型清单与性价比;如果只是社区一厢情愿,则不必据此调整任何决策。要等的锚点很清楚——Anthropic 的官方发布说明或订阅页变更。在那之前,把它放在”留意但不下注”的格子里最稳妥。

signal: 政策面转暖给了 Fable 5 回归现实推力,但”本周上线、并入订阅”目前仍只有社区解读,官方公告才是唯一可信的发令枪。