OpenAI 联手博通发布首款推理芯片 Jalapeño，9 个月走完设计到流片

❯ OpenAI 联手博通发布首款推理芯片 Jalapeño，9 个月走完设计到流片

[首颗自研芯片] OpenAI 与博通联合发布首款定制推理芯片 Jalapeño，从设计到流片只用 9 个月，号称是高性能先进半导体史上最快的 ASIC 开发周期，计划 2026 年底开始部署。这是 OpenAI 从模型、产品一路向下，第一次把手伸进自家硅片。芯片专为大语言模型推理优化，早期测试显示每瓦性能显著优于现有最高水平。

[全栈闭环] 这颗芯片由 OpenAI 设计加速器、博通负责硅实现与网络互连，制造伙伴还包括 Celestica，是双方共建的多代计算平台中的第一代。关键细节是 OpenAI 用自家模型参与了部分设计与优化，把”AI 设计 AI 芯片”从口号落到流片表上——这也是 9 个月极速周期的来源之一。架构上它通过减少数据搬运、平衡算力内存与网络资源，让实际利用率逼近理论峰值，针对的正是 ChatGPT、Codex 与 API 上真实跑的推理负载。早期样片已在实验室以目标频率和功耗运行，包括 GPT-5.3-Codex-Spark。

[算力账重写] 真正被改写的是 OpenAI 对英伟达的依赖结构。过去它每一份推理算力都要向外采购 GPU，自研芯片让它在采购、功耗与单位推理成本上第一次握有自己的杠杆，并把模型、产品、收入、基础设施串成一个内部飞轮。对英伟达而言，最大的几家客户正一个接一个从”买芯片”转向”设计芯片”；对博通来说，定制 ASIC 业务又添一个超级订单。后续要盯的是详细基准测试——OpenAI 称稍后公布，那才是这颗芯片成色的真考题。

signal: 当模型公司开始自己设计推理芯片，算力护城河就从”谁买得起 GPU”挪到”谁控制得了单位推理成本”。

❯ Anthropic 致信美方指控阿里大规模蒸馏 Claude，称三个月调用 2880 万次

[指控升级] Anthropic 向美国参议员与白宫官员致信，指控阿里巴巴在 4 月至 6 月间通过近 2.5 万个欺诈账号绕过地域限制，对 Claude 发起 2880 万次调用，称这是迄今针对其技术、由中国主体发起的最大规模数据窃取行动（据彭博独家报道）。消息当日，阿里美股一度下跌约 3%。

[对抗性蒸馏] Anthropic 把这套手法称为”对抗性蒸馏”——外部主体反复诱导一个先进模型，批量收割其推理模式与数据结构，再用来低成本训练竞品。信中点名与阿里旗下 Qwen 实验室相关的操作者，称其重点定向软件工程与 agentic 推理这两类高价值能力。这并非孤例，而是 Anthropic 口中”中国实验室系统性抓取美国前沿模型输出”的一环；此前业内已多次流传类似指控，但这是头一回有头部实验室拿出账号数与调用量这种硬数字，并直接递到立法者与白宫桌上。

[从商业到地缘] 这封信把一桩平台滥用问题抬成了中美 AI 博弈的筹码。对监管者，它递上了收紧前沿模型对外访问的现成理由；对阿里与一众中国大模型厂商，则等于把”调用海外 API 做蒸馏”这条捷径公开标价并施压。压力会先落到云厂商的账号风控与 API 准入策略上——前沿实验室接下来要权衡的，是把模型能力卖给尽可能多的用户，还是为防蒸馏主动收窄外部可达性。

signal: 真正被定价的不是 2880 万次调用，而是”开放 API”与”防止竞品白嫖能力”之间那道越来越贵的取舍。

❯ 美光 Q3 营收同比涨 346% 至 414.6 亿美元，Q4 指引上看 500 亿

[爆发式财报] 美光第三财季营收 414.6 亿美元，同比暴涨 346%、环比增 74%，远超分析师约 358 亿美元的预期；调整后毛利率 84.9%，同比翻倍有余；公司给出第四财季约 500 亿美元的营收指引，同样高于市场预期。财报后股价盘后跳涨超 14%，创历史新高。这已是美光连续第五个季度刷新营收纪录。

[供给吃紧] 撑起这份财报的是 AI 内存的结构性短缺。美光数据中心业务营收同比增长超过七倍，高带宽内存 HBM 是英伟达等 AI 加速器的标配，而它正处在严重供不应求的状态。管理层在电话会上明确表示，AI 内存的供应紧张会持续到 2027 年之后——这把市场原本担心的”内存周期见顶”叙事直接推后，也解释了为何 84.9% 的毛利率能盖过英伟达、Meta 等一众科技龙头。换句话说，这一轮 AI 资本开支的红利，正实打实地流进上游存储厂商的利润表。

[定价权易主] 对采购方而言，被改写的是议价天平。AI 算力的瓶颈正从 GPU 算力本身，向 HBM 这类配套内存蔓延，谁能锁定供给谁就握住产能。下游云厂商和模型公司接下来要看的，不再只是加速器交期，而是内存能不能按时按量配齐；对三星、SK 海力士这两家 HBM 对手，美光的指引等于把整个内存超级周期又往上抬了一格。风险在于估值已被拉得很满，一旦供给缺口提前缓解，回调同样会来得很快。

signal: AI 这轮最确定的赚钱生意，眼下不在模型层，而在卖给所有人内存的那张产能表上。

❯ SK 海力士申请纳斯达克上市拟募 294 亿美元，超越三星成韩国市值第一

[历史级募资] SK 海力士提交文件，拟通过纳斯达克美国存托凭证 ADR 募集约 294 亿美元，发行 1779 万股新股，预计 7 月 10 日起交易，所得资金全部用于扩建先进 AI 内存产线与 EUV 设备采购。若按指导区间上限定价，这将是史上最大规模的 ADR 发行，超过阿里巴巴 2014 年纽约上市时 218 亿美元的纪录。

[14 年押注兑现] 这场上市是 SK 海力士长达十余年押注 HBM 的收官时刻。靠着在高带宽内存上的领先卡位，它如今握有约 60% 的 HBM 市场份额，2026 年以来股价飙升超过 300%，并一举超越三星电子，结束后者长达二十余年的韩国市值霸主地位。这家曾经在内存价格战里苦苦追赶的二线厂商，因为赌对了 AI 加速器对 HBM 的刚需，被推到了整条 AI 硬件供应链最稀缺的位置上。把募资全砸向产能而非补血，说明它要的是趁周期高点把领先优势浇筑成产能壁垒。

[资本与产能竞速] 这笔钱真正要解的是产能竞速。HBM 现在是卖方市场，谁先建起先进制程产线，谁就在未来几年的供给分配里占住身位。对三星和美光，SK 海力士拿 294 亿美元去扩产，等于把军备竞赛的门槛又抬高一截；对下游买家，则要重新掂量是绑定单一龙头还是分散下单。后续看点是这笔巨额募资能否顺利在 7 月按上限定价——它本身就是 AI 资本市场热度的一次实弹检验。

signal: 把全部募资投向产能而非偿债，SK 海力士赌的是 HBM 短缺还会持续够久，久到产能壁垒能落地。

❯ 高通把 2029 年非手机芯片营收目标上调至 400 亿美元，盘后涨 15%

[目标翻倍] 高通将 2029 财年非手机芯片营收目标从 220 亿美元几乎翻倍上调至 400 亿美元，其中新公布的数据中心 AI 基础设施业务目标超过 150 亿美元；消息一出，高通盘后股价大涨约 15%。同日它还发布了面向数据中心的 CPU 产品 Dragonfly C1000，并宣布 Meta 将在该芯片 2028 年投产后采用。

[摆脱手机依赖] 这是高通系统性”去手机化”的一次集中亮牌。除数据中心外，它把汽车业务的设计中标管线提升到 650 亿美元、2029 财年营收目标 100 亿美元，物联网营收目标定在 140 亿美元以上。更受关注的是另一条线：据路透报道，高通正与字节跳动洽谈提供定制芯片设计服务，方案可能部分基于其 2025 年 6 月收购的高速连接公司 Alphawave Semi 的技术，涉及视频处理单元 VPU，目标年底量产。若谈成，字节将成为高通新设芯片设计业务的首批客户之一。

[从卖芯片到卖设计] 对高通而言，被重塑的是商业模式本身——从卖标准化手机 SoC，转向给大客户做定制硅与数据中心 CPU。这把它直接推到与英伟达、博通同一张牌桌。下游超大规模厂商接下来要算的是：在英伟达 GPU 之外，是否值得为高通的 CPU 与定制方案分配一部分预算。不确定性在于，与字节的洽谈仍在早期、未必落地，而数据中心市场早已挤满对手，400 亿这个目标要靠未来几年的真实中标来兑现。

signal: 高通这次卖的不再是手机里那颗芯片，而是”帮你设计芯片”这门生意——它想坐到博通的位置上去。

❯ 智谱市值突破 1280 亿美元，考虑赴港增发募资数十亿美元

[暴涨后融资] 中国大模型公司智谱（Zhipu）正考虑在香港增发股票、募资数十亿美元，时间可能最早落在下月。此前其股价自 1 月上市以来累计上涨约 2000%，市值一度突破 1 万亿港元（约 1280 亿美元），年内涨幅高达约 2467%，成为中国市值最高的 AI 公司（据彭博报道）。

[旗舰点火] 这轮疯涨的直接导火索，是智谱此前在 6 月 17 日正式发布并开源的新旗舰模型 GLM-5.2，主打 100 万无损上下文与增强的编码能力，发布当日股价一度暴涨 42%。一家年初才登陆港股的公司，凭一款开源模型在半年内把市值送进万亿港元俱乐部，本身就说明港股投资者正把中国头部大模型当成稀缺的 AI 资产抢筹。趁股价高位增发，是把账面热度兑换成真金白银的研发与算力弹药——对烧钱的大模型生意，这步几乎是必选项。

[高位兑现的考验] 真正要被检验的是这份估值的含金量。股价半年涨 20 倍，把智谱的市值锚点从基本面推向了情绪与稀缺性，增发既能补血也是一次压力测试：市场愿不愿意在万亿港元的水位上继续接盘。对其他中国大模型厂商，智谱的资本路径提供了一个模板——用开源旗舰打出声量、再借资本市场高位融资。后续看点是增发的规模与定价，以及 GLM 系列能否用持续的模型迭代撑住这份估值。

signal: 半年 20 倍之后，智谱要回答的不再是模型好不好，而是市场愿不愿在万亿港元的高位上替它的下一步买单。

❯ 字节跳动寻求 200 亿美元境外贷款，规模为公司历来最大

[最大借贷] 字节跳动正与多家银行初步洽谈一笔约 200 亿美元的境外贷款，期限三年、可延长至最多五年，将是这家 TikTok 母公司历来最大规模的境外融资（据彭博报道）。资金主要投向两个方向：人工智能投入与数据中心扩建。这笔贷款几乎是其上一次境外借贷纪录的两倍。

[AI 军备开支] 此前据彭博报道，字节上一次大举进入全球贷款市场还是在 2024 年，当时通过 20 多家国际与中国银行筹得 108 亿美元。背景是时隔不到两年就把规模翻倍，反映出它在 AI 基础设施上的开支正陡峭抬升——从大模型训练、推理算力到自建数据中心，每一项都是以百亿美元计的资本黑洞。对一家并未上市、现金流主要来自广告与电商的公司，选择用境外贷款而非股权融资来填这个洞，既是对自身造血能力的信心，也是在 AI 这场不能缺席的竞赛里抢时间窗。

[非上市巨头的杠杆] 被推到台前的是字节的融资方式本身。在同行多靠 IPO 或股权融资补充弹药时，它选择加杠杆，把扩张的成本压在债务而非稀释股权上。对放贷银行，这是一笔难得的大单，也是一次对字节偿债能力的押注；对竞争对手，200 亿美元的算力与数据中心投入会把 AI 基建的门槛又抬高一截。接下来要看的是这笔贷款的最终规模与定价，以及这些资本究竟砸向训练集群还是出海算力。

signal: 一家不上市的公司用历史最大一笔借贷去填 AI 基建的坑，赌的是债务利息会比错过这轮算力竞赛更便宜。

❯ 孙正义称软银旗下 Arm 将自造芯片，估值还有 10 倍以上空间

[十倍豪言] 软银创始人孙正义公开表示，旗下 Arm 的估值有望从当前约 3910 亿美元市值再涨 10 倍以上，对应市值将逼近 4 万亿美元。他把这份信心部分归于 Arm 已开始自造芯片的转向，并称 AI 计算需求正向以 CPU 为中心的架构倾斜。据公开数据，Arm 股价 2026 年至今已上涨约 231%，但孙正义认为”这才刚刚开始”。

[从授权到制造] 这番表态背后是 Arm 商业模式的一次根本位移。此前长期以来 Arm 只做芯片架构授权、收取专利费，自己不碰制造；如今要亲自下场造芯片，等于从产业链上游的”卖图纸”走向”卖成品”，直接切入更高价值、也更重资产的环节。孙正义把这一步和软银更宏大的超级智能赌注绑在一起——据报道，他为软银定下了未来十年净资产达 1000 万亿日元（约 6.19 万亿美元）的目标，并借机为软银投资英特尔辩护，称初始 20 亿美元的持股已大幅增值。

[愿景与兑现之间] 真正悬而未决的是这些数字能否落地。4 万亿美元的市值会让 Arm 跻身全球最有价值的公司之列，而支撑它的”自造芯片”战略仍在早期，重资产制造对一家轻资产授权公司是全新的能力考验。对投资者，孙正义的喊话既是路标也是风险提示：要不要为一个尚未兑现的制造转型，给 Arm 付出 10 倍溢价。后续看点是 Arm 自造芯片的真实进度，以及 AI 是否真如他所言把算力重心拉回 CPU。

signal: 孙正义给 Arm 标出 10 倍空间的同时，也把一道考题摆上桌：一家卖图纸的公司，能不能真学会卖成品。

❯ 马斯克宣布 SpaceX 太空算力星座 Starmind，规划百万颗卫星入轨

[太空数据中心] 马斯克在社交平台确认，SpaceX 规划中的太空 AI 算力卫星星座定名 Starmind，目标是把多达 100 万颗卫星送入轨道，让 AI 推理直接在天上完成、再把结果传回地面。SpaceX 已于今年 1 月向美国联邦通信委员会 FCC 提交申请，每颗卫星峰值发电能力约 150 千瓦，搭载成排的算力机架。

[绕开地面瓶颈] 据公开信息，Starmind 与此前提供上网服务的星链不同，它要做的是把数据中心整体搬上天。卫星在轨用机载处理器跑推理负载，靠星间激光链路互联，再将输出在毫秒级延迟内打到地球任意位置，全程不经地面数据中心。SpaceX 押注的逻辑很直接：地面 AI 数据中心正撞上土地、电力、水和社区反对的多重天花板，而太空有近乎无限的太阳能、天然真空散热、且无需分区审批。按规划，两颗 AI1 原型卫星将于 2027 年初发射，首代设计高 20 米、展开翼展达 70 米，比波音 747-8 还宽。

[从设想到工程] 被重新定义的是”算力放在哪”这个问题。如果在轨推理真能跑通，AI 基础设施的选址逻辑就从”哪里有电有水”转向”哪里能发火箭”，而这恰好是 SpaceX 独有的能力。质疑同样巨大：百万颗卫星的轨道资源、散热、辐射与发射成本，每一项都是尚未验证的工程难题。对地面数据中心运营商和电力供应商，这是一个遥远但不能忽视的长期变量；对监管者，FCC 如何处理百万级卫星申请将是第一道门槛。

signal: 把数据中心搬上天目前还是张工程草图，但它点破了地面 AI 算力最硬的约束——不是芯片，是电和地。

❯ Meta 据文件将推 AI 预测市场 App，由模型生成问题并裁决结果

[AI 全程操盘] 据 NPR 看到的文件，Meta 计划推出一款独立于 Facebook 和 Instagram 的 AI 预测市场 App，内部代号 Antwerp 与 FBForecast，用自家大模型 Llama 从热门话题自动生成可下注的问题、做个性化推荐，并由 AI 近乎实时地裁决事件结果。用户用”虚拟货币”对真实世界事件下注，对标 Kalshi、Polymarket 等热门平台。

[重建旧品] 值得一提的是，这其实是一次”重建”。Meta 此前曾因”人工出题的运营成本过高”关停过一款类似的预测市场产品，如今把当初最重的环节——出题、推荐、裁决——全部交给 AI，正是要用模型的边际成本去解决人力规模化的难题。这也是 Meta 给 Llama 找的一个具体落地场景：让模型不只是聊天助手，而是直接驱动一款消费级产品的核心循环。把”判定某件事是否发生”的最终裁量权交给 AI，则是这款产品最激进、也最容易引发争议的设计。

[裁决权的争议] 最敏感的不是下注，而是裁决。让 AI 对”某事是否发生”拥有最终话语权，一旦模型判错或被诱导，影响的就不只是一次聊天输出，而是真实的输赢结果。对 Meta，这是 Llama 商业化的一次大胆试验；对监管者和用户，则要重新评估”AI 当裁判”的可靠性与可申诉性。即便用的是虚拟货币，预测市场本身在多个司法辖区都踩在监管灰色地带，Meta 这一步会把”AI 裁决”的可信度问题第一次推到大众消费场景里。

signal: 这款 App 真正的实验品不是下注玩法，而是”让模型对现实做最终判定”——AI 当裁判的可靠性，第一次要在真金白银的赌局里被检验。

❯ Wired 称 Anthropic 改派联创 Tom Brown 出面，白宫态度随之转暖

[换人破局] 据 Wired 报道，特朗普政府近来对与 Anthropic 的沟通明显更满意，原因是在关于重新发布 Fable 5 模型的白宫会谈中，CEO Dario Amodei 已被联合创始人 Tom Brown 替换出面。Amodei 并未被解职、仍是 CEO，但在可能左右 AI 监管走向的关键对话里，他被”按下了暂停键”。

[技术派对政治派] 这次换人本身就是一种信号。Tom Brown 是 Anthropic 负责算力运营的联合创始人，外界把他出面解读为：Anthropic 选择把这场僵局当作”可以技术性谈拢的分歧”，而非价值观对抗。一名白宫内部人士的说法很直白——“Tom Brown 不像 Dario 那样别扭，是真能聊得下去的”。背景是 Amodei 一向以对 AI 风险直言、对监管态度强硬著称，这与特朗普政府的立场屡有摩擦；6 月 19 日，特朗普曾公开称 Anthropic”不再是国家安全威胁”，并赞其”表现得非常负责任”，措辞的转暖与这次人事调整时间线吻合。

[沟通风格定生死] 被摆上台面的是创始人个人风格对政企关系的重量。在 AI 监管尚无定规的当下，谁去白宫、用什么姿态谈，可能比公司实际立场更能左右结果。对 Anthropic，这是一次务实的姿态调整——把最能”聊得下去”的人推到前台；对其他前沿实验室，它示范了一件事：与政府打交道，选对谈判代表本身就是策略。后续要看的是 Fable 5 的解禁进展，以及 Amodei 的”隐身”是临时战术还是长期安排。

signal: 决定 Anthropic 与白宫关系走向的，眼下不是公司立场变了多少，而是换上了一个”聊得下去”的人。

❯ 阿里在 Qoder 平台下调 Qwen 调用价格，抢占美国工作时段需求

[降价抢量] 阿里巴巴在其编程平台 Qoder 上下调了 Qwen 模型的调用价格，目标直指美国工作时段的开发者需求。这是中国大模型厂商把价格战从国内打到海外开发者市场的又一步，瞄准的正是 Claude、GPT 系列编程工具所主导的高价值 coding 场景。

[编码场景争夺] 把降价精准锚定”美国工作日”，意图相当明确——在欧美开发者最活跃的时段，用更低的单位 token 价格去撬动那些对成本敏感、又高频调用模型写代码的用户。编码是当前大模型变现最扎实的场景之一，也是 Anthropic 在指控信里点名”被定向蒸馏”的能力方向；阿里一边被指控大规模调用 Claude，一边在自家平台用低价 Qwen 抢同一批开发者，两条线放在一起看格外耐人寻味。对国内厂商，这延续了”开源旗舰打声量、低价抢调用量”的一贯打法。需要说明的是，具体降价幅度与计价口径仍以阿里官方公布为准。

[价格战出海] 真正被压低的是海外开发者的迁移成本。当 Qwen 在编码质量上逼近第一梯队、价格又显著更低时，部分成本敏感的团队就有了试用乃至切换的理由。对 Anthropic、OpenAI，这把竞争**从”模型能力”拉到”每千次调用多少钱”**的近身肉搏；对开发者，则多了一个用脚投票的低价选项。后续看点是 Qwen 在真实编码任务上的口碑能否撑住这波低价获客，以及海外用户对中国模型的数据与合规顾虑会不会成为拦路石。

signal: 中国大模型的价格战正式打到美国开发者的工作日时段，编码场景的较量从”谁更聪明”滑向”谁更便宜”。

❯ 传言称 Fable 5 本周回归或永久并入订阅，官方尚未证实

[未证实传言] 社区近日热传 Fable 5 本周回归，且有可能被永久并入订阅计划。该说法主要来自高人气资讯账号 kimmonismus 的连续两条推文（合计逾 27 万次浏览）及账号 iruletheworldmo 的多次喊话，依据是 Claude Code 近期更新里被解读出的若干”暗示”。Anthropic 官方至今没有任何确认，本条仅作传言记录。

[线索与口径] 把这条传言的成色摊开看：它的”证据”是社区对 Claude Code 更新内容的解读，而非官方公告或可核实的发布说明，属于典型的”线索级”信号。结合本期另两条已被主流媒体证实的新闻——Anthropic 改派 Tom Brown 与白宫沟通 Fable 5 解禁、特朗普 6 月 19 日称其”不再是国安威胁”——Fable 5 重新可用确有现实推力，但”本周回归""永久并入订阅”这两个具体说法仍只是社区推测。多账号在传不等于已证实，热度高也不改变其口径未经官方背书的事实。

[怎么对待传言] 对读者，正确的姿态是把它当成一个待验证的预期而非既成事实：如果属实，Fable 5 并入订阅会直接改变 Anthropic 订阅用户的可用模型清单与性价比；如果只是社区一厢情愿，则不必据此调整任何决策。要等的锚点很清楚——Anthropic 的官方发布说明或订阅页变更。在那之前，把它放在”留意但不下注”的格子里最稳妥。

signal: 政策面转暖给了 Fable 5 回归现实推力，但”本周上线、并入订阅”目前仍只有社区解读，官方公告才是唯一可信的发令枪。