Hacker News 每日播报:今天我们关注数据泄露、游戏开发、AI 媒体生成、数学难题、深度学习理论、铁路改造、全球人类活动、AI 科研应用以及两个有趣的开源项目。
DDoSecrets 发布从 TeleMessage 窃取的 410 GB 堆内存转储数据
泄密组织 Distributed Denial of Secrets (DDoSecrets) 近日发布了从以色列公司 TeleMessage 的归档服务器中获取的 410 GB 数据。TeleMessage 提供修改版 Signal、WhatsApp 等应用,用于中心化归档加密通讯消息。由于数据包含敏感信息,DDoSecrets 目前仅向记者和研究人员提供访问权限。
文章作者 Micah Lee 详细梳理了事件时间线,包括美国官员使用 TeleMessage 产品 TM SGNL 引发的争议、TM SGNL 源代码的公开,以及 TeleMessage 服务器遭受的攻击。作者的分析证实,尽管 TeleMessage 宣传端到端加密,但其归档服务器上的一个公开可访问的 /management/heapdump
端点泄露了包含明文聊天记录在内的 Java 堆内存转储文件。DDoSecrets 发布的数据正是来自这些文件,作者将这一系列事件描述为“令人震惊的无能传奇”。
社区讨论对这一事件表达了震惊和难以置信,尤其考虑到服务对象是政府部门。大家普遍认为公开 /heapdump
端点是一个严重的配置错误,可能是旧版本 Spring Boot 的默认设置问题,但也批评了开发者为了方便而忽视安全审查。
关于 TeleMessage 公司本身,有人质疑其技术能力是否与其“前摩萨德”、“顶尖”的营销形象相符,认为这可能是营销大于实际。
对于使用 TeleMessage 的美国官员,讨论集中在他们缺乏基本的安全意识和尽职调查。许多人认为官员们使用非官方或安全性存疑的工具,可能是为了规避官方记录和监管,但这次事件恰恰暴露了这种做法的风险,有人将其与希拉里·克林顿使用私人邮件服务器的事件相提并论。
Signal Foundation 在此事件中的沉默也受到关注,引发了关于 Signal 是否存在双重标准的讨论。
DDoSecrets 的数据发布策略也引发了争论。一些人批评只向记者和研究人员披露是“把关人”行为,限制了信息传播;另一些人则支持这种做法,认为数据包含大量敏感的个人身份信息,完全公开可能对无辜个人造成伤害,负责任的披露更为合适。
此外,讨论还涉及软件工程缺乏严格标准和责任追究,以及在当前信息环境下真相传播的挑战。
在 2025 年制作电子游戏(不用引擎)
独立游戏开发者 Noel Berry(曾参与《Celeste》制作)撰文分享了他关于在 2025 年“不用引擎”制作游戏的看法。他认为,对于有特定需求、小团队或单人开发者来说,不使用大型商业游戏引擎(如 Unity, Unreal),而是构建定制的开发堆栈,可能更容易、更有趣且开销更少。他强调“不用引擎”并非从零开始写汇编,而是依赖强大的开源库(如 SDL3)来处理核心系统,并为项目编写定制工具和编辑器。他主要使用现代 C# (.NET) 进行开发,认为其在性能、易用性和工具构建方面取得了巨大进步。
社区讨论非常热烈,一个突出的共识是:游戏引擎的真正复杂性往往不在于运行时核心,而在于围绕它的工具链、资产管线和编辑器。
大家普遍认为,导入资源、构建编辑器、处理资产打包等工具开发工作,构成了游戏开发中“真正的大头”,运行时引擎部分相对较小。
围绕这个主题,讨论展开了多角度探讨:
- 定制工具的优势与风险: 定制工具可以避免通用引擎的臃肿,但意味着要自己承担开发和维护工作,依赖外部库也存在风险。
- 学习曲线与效率: 关于学习大型引擎与构建定制堆栈所需的时间,观点不一。有人认为大型引擎适合快速原型和标准功能,效率高;但也有经验丰富的开发者认为,对于独特想法,克服大型引擎限制可能不亚于构建定制系统。
- 专有引擎的信任问题: 一些人呼应作者对 Unity 商业行为的担忧,认为其不稳定性和不可预测性促使开发者考虑定制或开源替代方案(如 Godot)。
- 核心功能的取舍: 讨论触及物理、动画等功能。自己实现可以带来独特的游戏“手感”,但对于大多数游戏,这些功能已高度标准化,重写可能是“重复造轮子”。
- 替代的工具策略: 除了完全定制编辑器,利用现有 DCC 工具(如 Blender)或专业编辑器(如 Tiled)并通过导入/导出管线集成,也是一种避免从零开始编写复杂视觉工具的策略。
- 规模与目标: 普遍认为,选择哪种方式取决于项目规模、类型、团队和开发者目标。大型引擎适合快速出货和标准功能,定制方法更吸引有独特技术需求、追求完全控制或享受开发过程的独立开发者。
Veo 3 和 Imagen 4,以及一款新的电影制作工具 Flow
Google 近日发布了其在生成式媒体领域的最新进展,包括新的模型和工具。核心发布包括:
- Veo 3: 最新的视频生成模型,首次支持生成带有音频的视频,并在理解提示、物理效果和唇形同步方面有显著提升。已向 Gemini Ultra 订阅用户和企业用户开放。
- Veo 2 更新: 增加了参考驱动视频、摄像机控制、外绘和物体添加/移除等功能,提供更精细的创意控制。
- Flow: 一款专为 Veo 设计的 AI 电影制作工具,整合了 Veo、Imagen、Gemini 模型,允许用户用自然语言描述镜头、管理素材、编织叙事。已向 Google AI Pro/Ultra 订阅用户开放。
- Imagen 4: 图像生成模型,速度和精度提升,支持多种宽高比和高分辨率,文字和排版能力显著增强。已在 Gemini 应用、Whisk、Vertex AI 等产品中可用。
- Lyria 2: 音乐生成模型,通过 Music AI Sandbox 为音乐人提供工具,功能通过 YouTube Shorts 和 Vertex AI 提供。
文章强调了负责任的创作,Google 将继续在生成内容中嵌入 SynthID 水印,并提供检测工具。
社区讨论对这些新功能表现出兴奋,特别是 Veo 3 的音频和 Veo 2 的精细控制,认为它们在原型设计和降低创作门槛方面潜力巨大。Imagen 4 在文字处理上的进步也受到关注。
但也有不少谨慎或批评的声音。大家将其与竞争对手(如 OpenAI 的 Sora、Midjourney、Stable Diffusion)进行比较,想知道 Veo 3 在视频长度和一致性方面是否能匹敌 Sora。
关于可用性和商业模式,一些人担忧高级功能首先通过订阅或企业服务提供会限制独立开发者。对 Google 过去关闭产品的历史也让一些人对长期依赖这些工具感到不安。
伦理和版权问题依然是焦点,讨论涉及对艺术家生计的影响、训练数据来源以及 SynthID 水印的有效性。
总的来说,社区对 Google 的新发布既有期待,也伴随着审视,讨论反映了在快速发展的生成式 AI 面前,技术社区既拥抱创新,又不忘审视其挑战和风险的复杂心态。
表情符号问题 (2022)
这篇文章探讨了一个起源于社交媒体的病毒式“表情符号数学题”,如何被数学爱好者转化为一个需要高等数学才能解决的挑战。作者深入研究了一个由 Sridhar Ramesh 修改后变得异常困难的版本,并详细描述了如何运用椭圆曲线理论来找到这个问题的最小整数解。
文章首先介绍了这类题目的病毒式传播机制,然后引出了更难的版本,以及微调后难度骤增的事实。作者将问题转化为丢番图方程,再进一步转化为椭圆曲线方程。核心数学方法是利用椭圆曲线的“直线技巧”来寻找有理点。作者解释了如何找到一个“无限阶点”,并迭代生成一系列有理点,最终定位到对应原始方程正整数解的特定区域,从而得出了一个位数超过 100 位的巨大最小正整数解。
社区讨论对解决这个问题所需的数学深度表示惊讶,感叹自己无法独立解决,但也理解了文章的思路,并引发了关于数学研究是站在前人肩膀上的讨论。
有人借此表达了对 Quora 平台质量下降和“僵尸互联网理论”的看法。
关于数学符号的可读性也引发了讨论,有人认为数学家有时命名变量过于简洁,不如程序员。
有趣的是,讨论还引申到在编程中使用 Emoji 作为变量名,分享了尝试经历和对现代语言支持的探讨。
有用户尝试将原始图片上传给 ChatGPT,结果模型自信地给出了错误答案,展示了当前 AI 在处理这类需要深入数学推理问题时的局限性。
大家还解释了原始简单表情符号题的“陷阱”在于图片中物品数量的变化。
总的来说,这篇文章和社区讨论从一个简单的网络谜题出发,深入探讨了高等数学、数学研究本质、符号表示、互联网文化、AI 能力和编程语言设计等多个领域。
深度学习是应用拓扑学
这篇文章提出一个观点:从根本上看,深度学习是在高维空间中对数据表面(流形)进行操作,使其变得有意义或可分离。作者用拓扑学(研究表面的学问)类比,认为神经网络通过线性变换和非线性激活函数,能够扭曲和映射数据到高维空间,使得原本纠缠的数据变得可分离。
文章将神经网络视为“拓扑生成器”或“拓扑发现者”,它们学习构建一个高维空间中的表面,相似数据点在这个表面上聚集。作者甚至认为,在足够高的维度空间中,这种基于拓扑/流形的操作与推理可能难以区分。他探讨了这些拓扑是模型“创造”的还是数据本身就“存在”的哲学问题,并倾向于后者。文章还将这个观点扩展到推理本身,认为推理可能也存在于一个流形上,而 LLM 的训练过程就是在“推理流形”上进行导航。最后,作者设想神经网络本身也可以被视为一个流形,并提出是否可以像对图像应用扩散模型一样,对神经网络权重应用扩散模型来生成模型。
社区讨论中,最集中的争议点在于作者对“拓扑学”一词的使用。许多数学背景的评论者指出,严格意义上的拓扑学不关心距离,而文章描述的“距离”、“分离表面”、“光滑流形”等概念更准确地属于微分几何或流形理论。他们认为将深度学习称为“应用拓扑学”可能引起混淆。作者本人也承认可能使用了更宽泛的概念。
另一条讨论线索是关于深度学习的驱动力。一些人认为其成功主要来自经验试错和基础数学应用,流形概念更多是事后解释工具,而非理论基础。有人甚至将当前深度学习比作“炼金术”。
尽管有争议,也有不少人支持将深度学习视为在高维空间操作流形或嵌入空间的观点,认为这是一种强大的概念框架。
讨论还触及了深度学习与统计力学、控制理论等其他科学领域的联系,以及关于推理本质的哲学辩论。
芬兰宣布将其铁路网络迁移到国际轨距
芬兰交通部长宣布,该国计划将其铁路轨距从目前与俄罗斯相同的 1524 毫米调整为欧洲标准的 1435 毫米。这一战略性决策旨在提升芬兰的供应安全和军事机动性,并加强与瑞典和挪威的跨境铁路连接,被视为芬兰与欧洲及北约的联合项目。
该计划受到即将生效的欧盟 TEN-T 法规要求轨距不同国家规划过渡的影响。芬兰政府需要在 2027 年 7 月前做出最终决定,项目规划将持续到本世纪末,实际建设最早可能在 2030 年代开始。这将是一项耗资巨大的工程,芬兰希望欧盟能承担部分规划和建设成本。项目一旦启动,将从芬兰西北部城市奥卢以北开始。值得注意的是,这标志着芬兰立场的转变,此前政府曾认为改变轨距不符合成本效益。
关于这篇文章,社区尚未展开广泛讨论。然而,考虑到这是一个涉及大规模基础设施改造、地缘政治因素和长期规划的项目,潜在的讨论点可能包括工程挑战、巨大的经济成本与效益评估、地缘政治影响(与俄罗斯脱钩、与西方融合)、项目管理难度以及与挪威海铁路连接的关联等。
人们在做什么?基于全球人口动态的实时估算
网站 humans.maxcomperatore.com 提供了一个引人入胜的可视化项目,基于全球人口动态和模拟昼夜周期,实时估算全球约 80 亿人当前正在进行的活动。网站显示全球总人口、每秒出生/死亡/净增长估算,并将总人口细分为睡眠、有偿工作、休闲、饮食、教育、家庭护理、通勤等多种活动类别,动态展示各类别的人数和百分比。
网站作者使用了美国人口普查局和联合国经济和社会事务部等聚合数据源,并采用统计生成波动使数字看起来更动态。项目最初在 AI 协助下探索,并构建为一个单一 HTML 文件。
社区讨论对项目的创意、执行和视觉设计表示赞赏,称其“精彩”、“漂亮的工作”。动态可视化和昼夜地图被认为是特别有效的设计。有人觉得观看模拟的“气泡”活动转移很有趣,注意到它们倾向于批量移动,这被比作“同伴压力”。
关于数据呈现,有人注意到模拟的“脉冲”效应与全球时区和活动开始时间有关,这提供了对同步人类行为的有趣洞察。关于“亲密行为”和“战争”人数的比较引发了各种反应,从悲伤到希望,并引申出“要做爱,不要作战”的思考。
然而,“实时估算”的性质和方法也引发了疑问。出生/死亡计数器的闪烁被批评不够真实,有人建议使用泊松过程可能更准确。大家讨论了估算是否真正考虑了时间和地理位置,或者只是基于简单的昼夜模拟的全球平均值。有人对特定数字的准确性表示怀疑,认为数据可能更像是“费米估算”而非严格数据驱动。
改进建议包括添加当前查看仪表板的人数统计、使用更精确的时间使用研究数据、允许用户放大特定区域或国家,以及改进时间序列图。
除了技术方面,项目还引发了更广泛的哲学讨论。看到出生和死亡计数器跳动,引发了对生命循环的清醒反思。关于人口增长的讨论触及了资源压力与出生率下降对老龄化社会和养老金系统的影响等问题。
总的来说,该项目被认为是一个引人深思且执行良好的可视化,它使抽象的全球统计数据变得有形,并引发了从数据准确性、模拟技术到人类活动本质等多样化讨论。
我在等离子物理研究中被 AI 炒作愚弄了——这是它教会我的
普林斯顿大学等离子物理学博士 Nick McGreivy 分享了他将 AI 应用于物理研究的个人经历,以及为何结果未能达到预期炒作的高度,这促使他质疑 AI 正在彻底改变科学的说法。
Nick 在 2018 年开始博士研究,被 AI 的前景和高薪所吸引,决定利用 AI 加速物理研究,特别是解决偏微分方程 (PDEs)。他尝试了 Physics-Informed Neural Networks (PINNs),但发现它们脆弱、难以调整且不可靠,与论文中声称的惊人结果相去甚远。这让他对 AI 研究的表面呈现产生了怀疑,认为研究人员有很强的动机突出成功而省略失败。他认为 PINNs 可能是一个“引用泡沫”,因为它们通常无法与标准数值方法竞争。
接着,Nick 探索了其他声称能显著加速 PDE 求解的深度学习模型。然而,他对流体力学文献的系统性回顾发现一个普遍问题:近 80% 声称优于标准方法的论文使用了弱或过时的基线,或进行了不公平的比较。他发现声称的加速越惊人,比较就越可能存在缺陷。这进一步强化了他的结论:报告偏差(不发表负面结果)和使用弱基线导致 AI 科研结论过于乐观。
基于经验,Nick 认为 AI 在科学领域的快速普及可能更多是由于对科学家自身的好处(引用增加、工作前景、资金获取),而不是真正广泛加速了科学进步。他将其描述为“拿着锤子找钉子”的问题,研究人员先有了 AI,然后寻找它能解决的问题,有时解决的是已经解决或不具突破性的问题。他指出 DeepMind 声称发现数百万新材料,但材料科学家称“大部分是垃圾”。尽管承认 AI 可以带来突破(如 AlphaFold),但他认为传统 AI 在科学中的整体潜力被夸大了,原因包括幸存者偏差、报告偏差和方法学缺陷。他建议对惊人的 AI 科研结果保持本能的怀疑,并呼吁该领域更关注可靠性、鲁棒性和标准化挑战问题。
社区讨论中,许多人强烈认同 Nick 的观点,特别是关于学术界内部的激励机制。大家普遍认为,发表积极结果和获取资金的压力驱使研究人员追逐 AI 等热门话题,有时牺牲了科学的严谨性。这被视为学术界的一个普遍问题,在当前的 AI 热潮下被放大。
有人将此与过去的加密货币和 NFT 炒作进行比较,指出类似的夸大宣传模式。大家普遍认为 AI 目前更多是一个有用的工具,用于特定任务(如生成代码、总结文本),而不是基础发现的革命性力量。
弱基线和可重复性问题也是一个关键共识点,有人分享了自身经历或引用研究表明,许多声称的 AI 优势在与最先进的传统方法公平比较时就消失了。缺乏发表负面结果被广泛认为是阻碍准确评估的问题。
关于“AI”一词本身的讨论也存在,有人认为它已成为一个模糊的营销术语,而另一些人认为它是涵盖近期机器学习和神经网络进展的必要总称。AlphaFold 被视为 AI 产生显著影响的例子,但也有人将其定位为强大的预测/假设工具,而非基础理论突破。总体而言,讨论反映了一种谨慎的视角,既承认当前 AI 工具的实用性,又反对过度炒作,并呼吁在评估 AI 对研究的真实影响时更加科学严谨和透明。
Show HN: 90s.dev – 运行在网页上的游戏制作器
这篇文章介绍了 90s.dev,一个运行在网页浏览器中的、具有 90 年代复古美学的“操作系统”。但其核心是一个用于构建游戏、游戏引擎以及更重要的是,游戏开发工具的 API。它不是一个开箱即用的游戏引擎或制作器,而是一个让你能够构建这些工具的平台,灵感来源于 Pico-8 等受限环境,但提供了更现代的开发体验(如 TypeScript 支持)和独特的 GUI 构建能力。
90s.dev 提供一个基于 Web 的受限开发环境,固定分辨率 320x180,运行在 Web Workers 中,通过 OffscreenCanvas 提供 WebGL2 访问。作者强调项目的重点在于其提供的 API,特别是用于构建 GUI 应用的部分,并介绍了其独特的自动布局系统、Refs 系统和抽象视图(Composites)。项目支持直接从 GitHub 或 NPM 导入模块和应用,方便社区分享工具和库。作者将其定位为“meta-pico8”或“Love2D with TypeScript”。
社区讨论对 90s.dev 表现出浓厚兴趣。首先,项目的定义和沟通引发了一些困惑,标题与文章描述的差异是讨论点,作者坦诚承认可能没有很好地捕捉到本质,并表示 API 才是重点。
其次,复古美学是亮点,许多人喜爱 90 年代 GUI 风格,但也讨论了分辨率比例与实际 90 年代显示器的差异。
技术实现和可用性方面,有用户尝试并提供了反馈,作者积极回应并实时修复问题。关于“Getting Started”指南和浏览器兼容性也引发了讨论。
关于 320x180 的分辨率约束,有人询问是否可更改。作者解释了坚持约束的理念(受 Pico-8 启发),但也表示可能会保留更改选项作为“彩蛋”。这引出了关于“约束与灵活性”的哲学讨论。
API 设计方面,一些开发者对作者自定义的响应式系统和抽象视图表现出兴趣,认为是潜在的创新点。
最后,许多评论表达了对项目的鼓励和赞赏,特别是对作者的热情和积极互动表示赞赏。尽管项目可能尚不完善,但其独特的理念和技术探索吸引了社区关注。
Kilo: 一个代码行数不到 1000 行、带语法高亮和搜索功能的文本编辑器
知名开发者 antirez(Redis 作者)发布了一个名为 Kilo 的小型项目:一个用 C 语言编写、代码行数不到 1000 行的终端文本编辑器,却包含了语法高亮和搜索等基本功能。Kilo 的亮点在于其极简性,不依赖任何外部库,直接通过发送 VT100 转义序列控制终端行为。antirez 表示 Kilo 是从他之前的项目提取代码构建的,处于 alpha 阶段,鼓励开发者将其作为学习和构建更高级工具的起点。
社区讨论将 Kilo 视为一个极好的学习资源。许多人认为阅读 Kilo 代码或基于它构建编辑器是理解 C 语言、终端工作原理、编辑器内部机制和 VT100 控制码的绝佳途径。有人特别推荐了基于 Kilo 概念的“自己动手写一个文本编辑器”教程。
其次,讨论出现了一个关于终端界面局限性与 GUI/Canvas 绘图的深入辩论。一些开发者认为终端充满历史遗留问题和限制,倾向于直接在像素画布上绘图构建 UI;另一些人则反驳说终端并非不能进化,其最大的优势在于网络透明性,远程使用是 GUI 难以替代的。
第三个重要讨论点是关于文本编辑器核心数据结构的选择。Kilo 使用简单的“行数组”。一些人认为对于常见文件大小,这种简单结构足够高效;但也有人认为对于超大文件或高负载时,更复杂的数据结构(如 Piece Table)可能表现更好。
最后,讨论还提到了基于 Kilo 的衍生项目,如加入了 Lua 支持的 kilua,进一步印证了 Kilo 作为学习起点和定制基础的价值。
总的来说,Kilo 不仅是一个代码简洁的文本编辑器,更是一个引发了关于编程基础、终端技术、UI 设计哲学和数据结构选择等多个层面深刻讨论的催化剂。