Horizon 每日速递 - 2026-06-30
从 93 条内容中筛选出 14 条重要资讯。
- DiScoFormer 统一密度与得分估计 ⭐️ 8.0/10
- Ornith-1.0:面向代理式编程的开源权重模型 ⭐️ 8.0/10
- 韩国内存巨头承诺巨额扩产 ⭐️ 8.0/10
- Dwarkesh 谈下一代 AI 训练范式 ⭐️ 8.0/10
- 源策未来获数亿元种子轮融资 ⭐️ 8.0/10
- 国常会部署人工智能发展 ⭐️ 8.0/10
- Janus 为 AI 编程助手加入记忆与约束 ⭐️ 7.0/10
- 法案拟禁止出售健康和位置数据 ⭐️ 7.0/10
- Arena 成为 1 亿美元 AI 排行榜业务 ⭐️ 7.0/10
- DeepSeek V4 正式版与峰谷定价 ⭐️ 7.0/10
- 世界模型与 Scaling Law 之问 ⭐️ 7.0/10
- 苹果遭遇存储成本冲击 ⭐️ 7.0/10
- 无法死去的独角兽 ⭐️ 7.0/10
- OpenAI Codex 负责人谈 AI 时代产品工作 ⭐️ 7.0/10
DiScoFormer 统一密度与得分估计 ⭐️ 8.0/10
Hugging Face 介绍了 DiScoFormer,这是 AllenAI 提出的一种基于 Transformer 的模型,能够在一次前向传播中同时估计分布的密度和得分。该项目被描述为一种“训练一次,任意推理”的方法,可跨不同分布工作,而无需针对每个新分布重新训练。 这很重要,因为密度估计和得分匹配是生成式建模中的核心工具,而把两者结合到一个模型里,可能会简化流程并减少重复训练的成本。如果这种方法在实践中表现稳定,它可能会让高维或分布外场景下的分布分析和生成建模更灵活。 相关论文将 DiScoFormer 描述为一种等变 Transformer,它可以把独立同分布样本映射为密度值和得分向量,并且声称能跨分布和样本规模泛化。该工作还将自注意力框架解释为一种对归一化核密度估计的、数据自适应的推广。
rss · Hugging Face Blog · 6月29日 18:02
背景: 密度估计是学习数据点在某个分布下有多大可能,而得分(score)则是对数密度的梯度,广泛用于基于得分的生成式建模。传统方法例如核密度估计在高维场景或数据分布变化时往往会遇到困难。Transformer 通过自注意力来建模输入样本之间的关系,因此很适合学习基于集合或样本的表示。
参考链接
标签: #machine learning, #transformers, #generative modeling, #score matching, #research
Ornith-1.0:面向代理式编程的开源权重模型 ⭐️ 8.0/10
DeepReinforce 发布了 Ornith-1.0,这是一个采用 MIT 许可证的开源权重模型家族,面向代理式编程。该系列包含 9B Dense、31B Dense、35B MoE 和 397B MoE 等版本,并被描述为在同规模开源模型的代码基准上达到最先进水平。 这为开发者提供了一个宽松许可的代理式编程选择,因为这类模型需要进行规划、调用工具并在多步流程中反复迭代。对于希望获得强代码能力、同时又不依赖闭源模型或限制性许可的团队来说,这一发布尤其重要。 该模型基于预训练的 Gemma 4 和 Qwen 3.5 构建,两者都被提到采用 Apache 2.0 许可,这也解释了这种发布方式的兼容性。作者表示,他在 LM Studio 中使用了 35B 的 GGUF 量化版本并接入 Pi,结果显示它能够较好地处理多工具代理工作流,甚至以大约每秒 103 个 token 的速度生成了一幅简单图像。
rss · Simon Willison · 6月29日 16:17
背景: 代理式编程是指把 LLM 当作软件代理来使用,它可以检查代码、选择操作,并在多轮交互中使用工具,而不只是回答单个提示。开源权重模型在这一场景中很重要,因为它们可以本地运行,也更容易集成到自定义工具链中,许可限制更少。MoE,也就是专家混合架构,会把任务路由到专门的子网络,从而在不总是激活全部参数的情况下获得更大的容量。GGUF 是一种常见的量化模型格式,常用于 LM Studio 这类本地推理工具。
参考链接
标签: #LLMs, #open-source models, #agentic coding, #machine learning, #AI tooling
韩国内存巨头承诺巨额扩产 ⭐️ 8.0/10
韩国两大存储芯片公司表示,将投入超过 5500 亿美元扩建存储芯片制造产能。此举旨在缓解随着 AI 需求持续上升而加剧的 DRAM 等存储芯片供应紧张。 存储芯片是 AI 基础设施中的关键瓶颈,因此大规模新增投资可能有助于稳定数据中心、服务器和消费设备的供应。由于韩国拥有全球两家最大的存储芯片制造商,这一承诺对全球半导体供应链的影响也会超出韩国本土。 这项公告提到要建设更多存储晶圆厂,也就是生产 DRAM、闪存等芯片的工厂。其背后背景是 AI 驱动的产能紧张,外界常用“RAMageddon”来形容存储需求增长快于现有产能的局面。
rss · TechCrunch AI · 6月29日 18:07
背景: RAM 是计算机和服务器用于临时保存正在使用数据的高速主存,而 DRAM 是现代系统中最常见的易失性存储形式。fab 是 fabrication plant 的缩写,指半导体芯片制造工厂。在 AI 系统中,内存需求往往增长很快,因为训练和运行大模型需要大量高速内存带宽和容量。
参考链接
标签: #semiconductors, #AI infrastructure, #memory chips, #South Korea, #industry investment
Dwarkesh 谈下一代 AI 训练范式 ⭐️ 8.0/10
Dwarkesh Patel 发布了一篇单人音频论文,认为当前的 AI 训练方式,尤其是基于可验证奖励的强化学习(RLVR),不足以实现通用智能。他主张下一代训练范式应更强调来自真实世界部署的持续学习,让模型从稀缺但高信号的交互中不断更新。 如果 Patel 的判断成立,通往 AGI 的主要路径可能会从静态预训练和离线微调,转向部署后仍持续改进的系统。这会影响 AI 实验室如何设计产品、收集反馈和管理安全,因为已部署模型可能不再只是最终产物,而会成为主要学习来源。 Patel 认为,基于强化学习的训练不仅需要“可验证性”,还需要“可打磨性”,也就是任务必须能够被重放并模拟,才能高效学习,而许多真实世界技能并不具备这一点。他还提到“on-policy self-distillation”,并设想未来会出现一种“dreaming”维度,让模型利用自己的内部模拟器进行演练。
rss · BestBlogs.dev · 6月29日 23:00
背景: 机器学习系统通常通过从数据中学习规律,并将其泛化到新案例来提升能力。在现代 AI 中,强化学习常用于模型能够因正确行为获得奖励信号的场景,但这种方法最适合环境或任务能够被清晰定义和评估的情况。Patel 的观点是,创业或政治等许多重要现实领域并不符合这种整齐的设定,因此学习可能需要在部署后继续进行。
参考链接
标签: #AI training, #machine learning, #AGI, #continuous learning, #research analysis
源策未来获数亿元种子轮融资 ⭐️ 8.0/10
由港大教授李弘扬创立的源策未来(Archon Robotics)据报道完成了数亿元种子轮融资。参与投资的包括真格基金、高榕创投、IDG 资本和五源资本等机构,公司聚焦通用全身具身大脑和人形机器人基座模型。 这笔融资代表资本正在押注人形机器人底层能力,而不只是单台硬件本身。若源策未来的全身具身模型路线有效,机器人或许能更好地从单一演示任务泛化到家庭等复杂环境,加速实际落地。 公司认为,现有具身数据多是第一视角视频或末端轨迹,缺少重心变化、躯干借力等全身协调信息,因此难以支撑复杂家庭任务。其方案是采用“大脑-中脑-小脑”三层架构,以 Human Body Learning 为数据理念,训练可跨本体迁移的全身人形基座模型。
rss · BestBlogs.dev · 6月29日 13:30
背景: 具身智能指的是让 AI 通过机器人等物理载体,在真实世界中完成感知、规划和行动。对人形机器人来说,基座模型被认为是一种复用大规模学习能力的方式,可以把不同任务和不同平台上的知识迁移起来,而不必为每项技能单独训练。文章还把当前行业描述为仍处于早期阶段,许多系统仍依赖遥操或高度脚本化演示,距离真正自主还有差距。
标签: #具身智能, #人形机器人, #AI创业, #融资新闻, #基础模型
国常会部署人工智能发展 ⭐️ 8.0/10
国务院常务会议于 2026 年 6 月 29 日听取人工智能发展情况汇报,并对行业发展作出新的部署。会议重点提出加快关键技术攻关、建设超大规模智算集群、强化高质量数据供给、深入实施“人工智能+”行动以及完善安全监管。 这表明中国在人工智能基础设施、商业化落地和治理监管方面的国家级政策重点。它可能影响人工智能企业、算力和云服务提供商、数据供给方以及监管机构,进而塑造投资、应用和合规预期。 会议提出要加力推进前沿技术攻关,支持企业开展创新探索,并加强数据、人才、资金等要素保障。会议还强调建立动态适应、分级分类的安全监管体系,包括科技伦理、测试认证以及国际治理合作。
rss · BestBlogs.dev · 6月29日 12:48
背景: “人工智能+”是指将人工智能应用到各类行业和服务中,以推动模型、工具和智能产品规模化落地。“智算集群”是用于训练和运行大模型的算力资源集合,而“数据供给”强调支撑训练和部署所需的高质量数据。随着人工智能系统在可靠性、滥用和治理方面的风险上升,安全监管也正在成为核心议题。
参考链接
标签: #AI policy, #China, #government regulation, #compute infrastructure, #artificial intelligence
Janus 为 AI 编程助手加入记忆与约束 ⭐️ 7.0/10
Janus 是一个开源、零依赖的 MCP 服务器,旨在为 AI 编程助手提供长期记忆、决策记录和文件修改约束能力。它提供了 janus_recall、janus_remember 和 janus_guard 等工具,并可被 Claude Code、Cursor 等支持 MCP 的工具使用。 它针对编码代理的两个常见问题:跨会话容易丢失项目上下文,以及在修改代码时缺少足够约束。如果实际效果稳定,它可能让 AI 助手在持续开发项目中更可靠,也更容易在多设备之间同步使用。 Janus 将项目数据保存在可被 Git 跟踪的 .janus/ 目录中,因此记忆可以随着仓库通过 push 和 pull 同步。该项目还宣称提供基于 PPR 图遍历和 TF-IDF 搜索的双路召回、四级记忆生命周期、从 git log/package 文件/README 自动引导初始化,以及在文件编辑前拦截的语义 Guard。
rss · V2EX Tech · 6月29日 22:05
背景: MCP(Model Context Protocol)是一种开放标准,允许 AI 助手连接外部工具和数据源。在编程工作流中,记忆层用于在不同会话之间保留项目决策和上下文,而约束系统则用于防止助手修改不该改动的文件。
参考链接
标签: #AI编程助手, #MCP, #开源工具, #长期记忆, #代码辅助
法案拟禁止出售健康和位置数据 ⭐️ 7.0/10
参议员伊丽莎白·沃伦和众议员玛丽·盖·斯坎伦预计将在未来几周重新提出《健康和位置数据保护法》。该提案将禁止把美国人的健康和位置数据出售给数据经纪商,其中也包括人们在 ChatGPT 或 Claude 等 AI 聊天机器人中透露的敏感信息。 如果该法案通过,它可能会明显限制数据经纪商和 AI 公司对敏感用户信息的商业化利用。它也表明,政界正越来越倾向于把 AI 聊天记录和其他高度私密的数据视为隐私敏感记录,而不是普通消费数据。 该提案聚焦健康数据和位置数据,这两类信息都可能暴露个人生活和行为中的私密细节。相关研究和报道显示,数据经纪商已经在交易高度敏感的健康相关信息,而且有时对买家筛选很少,且对后续使用几乎没有限制。
rss · The Verge AI · 6月29日 16:00
背景: 数据经纪商是收集、整理并转售来自多个来源的个人信息的公司。在美国,当健康相关记录被汇总并以去标识化或经纪化形式出售时,它们有时会落入传统医疗隐私保护之外。AI 聊天机器人带来了新的风险,因为用户在对话中可能会分享私密细节,却未必预期这些内容会被再次使用或转售。
参考链接
标签: #AI policy, #data privacy, #health data, #location tracking, #regulation
Arena 成为 1 亿美元 AI 排行榜业务 ⭐️ 7.0/10
Arena 是一家运营广泛使用的免费 AI 排行榜的初创公司,现据报已成长为一项价值 1 亿美元的业务。它的商业服务直到去年 9 月才推出,因此这种变现速度尤其引人注目。 这表明 AI 基准测试和排行榜工具不仅是社区工具,也可以成为真正的商业业务。它还说明 AI 生态仍然需要可信的方式来比较模型的性能、速度和价格。 这家初创公司最出名的是其免费排行榜产品,它属于更广泛的模型对比工具市场,这类工具会按智能水平、延迟和定价来排名 AI 系统。现有信息没有说明其收入结构、客户群体或推动增长的具体技术变化。
rss · TechCrunch AI · 6月29日 17:39
背景: AI 排行榜是一种排名系统,帮助用户在质量、速度和成本等基准上比较大语言模型和其他 AI 系统。在这个领域,一些平台采用众包投票或匿名两两对比,另一些则汇总公开的基准测试和定价数据。Arena 的名字与广为人知的 Chatbot Arena 式评测方法相关,这种方式被广泛用于以更贴近实际用户体验的方式比较模型。
参考链接
标签: #AI, #leaderboards, #startup, #business, #machine learning
DeepSeek V4 正式版与峰谷定价 ⭐️ 7.0/10
据称 DeepSeek 已向开发者发送邮件,宣布 V4 正式版预计于 7 月中旬上线。与此同时,V4 Pro 和 V4 Flash 的 API 将引入峰谷定价,高峰时段价格将变为平时的 2 倍。 这很重要,因为价格调整会直接影响基于 DeepSeek API 开发的团队成本,尤其是白天调用量较大的企业开发者。它也说明前沿模型服务正在走向更精细化的商业化定价。 文中提到的高峰时段为每天 9:00-12:00 和 14:00-18:00,非高峰时段价格保持不变。报道还指出,这发生在 V4 预览版阶段曾永久降价之后,因此对主要在办公时间进行推理调用的用户来说,这是一个值得注意的变化。
rss · BestBlogs.dev · 6月29日 16:04
背景: DeepSeek 是一家 AI 模型提供方,V4 指的是其更新一代的模型系列。API 定价决定了开发者每次向模型发送请求要支付多少费用,因此定价结构变化会影响产品设计、任务调度和云成本。峰谷定价是一种常见做法,目的是把需求从繁忙时段引导到低负载时段,从而更好地平衡基础设施使用。
参考链接
标签: #DeepSeek, #LLM, #API pricing, #AI model release, #Chinese AI
世界模型与 Scaling Law 之问 ⭐️ 7.0/10
这篇分析认为,世界模型正在成为 AI 的新焦点,但它们的规模化路径与大语言模型有本质不同。文章以自动驾驶公司 Momenta 为案例,得出物理世界 AI 的“GPT 时刻”仍然尚未到来。 这篇文章提出了 AI 研究和投资中的一个关键问题:对大语言模型有效的规模化方法,是否也适用于机器人和自动驾驶。它的结论意味着物理世界 AI 可能会更慢地发展,但仍可能成为高价值应用的基础层。 文章指出,世界模型不只是视频生成器,而是要理解并预测物理世界,包括几何、物理、因果关系和规划。它还认为世界模型的规模化是“高摩擦”的,因为真实世界数据获取成本高、信息密度低、验证周期慢,而且受严格安全约束。
rss · BestBlogs.dev · 6月29日 16:00
背景: 在 AI 中,世界模型是对环境运行方式的内部表示,因此系统可以预测未来状态以及动作带来的结果。Scaling law 指的是一种经验规律,即模型规模、数据或算力增加时,性能会按可预测的方式提升。在这篇讨论里,大语言模型被用作对照,因为它们的能力似乎随着规模扩大而较平滑地提升,而物理世界系统面临更多限制。
参考链接
标签: #world models, #AI research, #scaling laws, #autonomous driving, #LLMs
苹果遭遇存储成本冲击 ⭐️ 7.0/10
文章称,受 AI 需求推动存储和内存成本大幅上涨,苹果正在提价。同时,苹果也在考虑从中国的长鑫存储采购,以分散供应链风险。 这表明 AI 需求的影响已经不只局限于云和服务器基础设施,还在重塑消费电子供应链。如果存储短缺持续,苹果这类手机厂商可能面临更高成本、更紧张的供货,以及产品定价和利润率的压力。 文章认为,AI 数据中心扩张正在把产能转向利润更高的 HBM,从而挤压手机和 PC 所需的 DRAM 供应。文章也提到,长鑫存储方案存在美国实体清单风险不确定、以及其产能相对于需求仍然有限等制约。
rss · BestBlogs.dev · 6月29日 14:40
背景: DRAM 是手机和 PC 等设备中常用的主存储器,而 HBM 则是一种更高端、在 AI 服务器中广泛使用的存储类型。 当 AI 基础设施需求上升时,芯片厂商可能会把产能优先转向 HBM 等更赚钱的产品。 长鑫存储(CXMT)是一家位于中国合肥的 DRAM 制造商,成立于 2016 年。
标签: #Apple, #AI hardware, #memory/storage, #supply chain, #semiconductors
无法死去的独角兽 ⭐️ 7.0/10
这篇文章分析了创投市场中“僵尸独角兽”的兴起:这些公司仍顶着独角兽时期的估值,但已经无法融资、上市或出售。文章认为,硅谷的融资条款和国内的回购条款共同让这些公司在账面上继续存活,却阻碍了市场出清。 这件事之所以重要,是因为僵尸独角兽占用了本应用于更健康创业公司的资本、人才和注意力。文章将其视为对创新的结构性拖累,也反映出创投市场可能在拖延必要的损失确认,而不是完成出清。 文章引用了 PitchBook 和斯坦福教授的数据,指出超过一半的活跃独角兽自 2024 年以来没有完成过融资。文中强调了硅谷的清算优先权和反稀释棘轮条款,以及中国的回购条款:一旦公司失败,创始人可能被个人债务绑定。
rss · BestBlogs.dev · 6月29日 14:20
背景: 独角兽通常指估值超过 10 亿美元的未上市创业公司,这种估值一般来自风投融资,而不是公开市场定价。在健康的市场中,无法支撑高估值的公司通常会通过下调估值融资、被并购或退出市场来重新定价。所谓“市场出清”,就是把资本和人才从弱势公司重新分配到更有竞争力的公司。
参考链接
标签: #创业投资, #独角兽, #金融工程, #市场出清, #估值泡沫
OpenAI Codex 负责人谈 AI 时代产品工作 ⭐️ 7.0/10
OpenAI Codex 的产品与工程负责人 Andrew Ambrosino 在播客访谈中表示,AI 正在让实现成本变得更低,产品工作的重点因此从“如何实现”转向“保留什么值得做”。他认为,品味和判断力正在成为产品团队中最稀缺的能力。 这反映了在 AI 降低原型和编码成本后,产品管理正在发生更广泛的变化。如果更多人都能快速生成可用方案,那么竞争优势就会转向选择正确想法、塑造一致的产品,以及做出更好的取舍。 Ambrosino 强调,PRD 仍然有价值,但应根据模糊程度选择合适的表达媒介:文档适合澄清不确定的产品方向,原型更适合测试交互模式。访谈还提到,Codex 正从开发者工具演变为更广泛的工作入口,财务和法务等非工程团队也在使用它。
rss · BestBlogs.dev · 6月29日 13:15
背景: OpenAI Codex 是 OpenAI 的编码代理,旨在帮助处理不同场景下的软件工程任务。在这次讨论中,“品味”并不只是指视觉审美,而是指判断力、系统思维,以及决定产品中该保留什么、不该保留什么的能力。文章把这看作是 AI 时代产品团队运作方式的变化,因为“做出来”这件事正在变得更容易。
参考链接
标签: #AI product management, #OpenAI, #product strategy, #generative AI, #future of work