在今天的 Hacker News 每日播报中,我们将探索高效学习的新算法、AI 生成动漫的争议、个人知识管理的取舍、神秘手稿的结构分析、隐私服务提供商的困境、法国拥抱开源的姿态、移动网络的隐私漏洞,以及一个有趣的自制智能家居项目。
Spaced repetition systems have gotten better
记忆是学习的基础,尤其对于非全职的学习者来说,如何高效记忆大量信息至关重要。间隔重复系统(Spaced Repetition Systems, SRS)正是解决这一问题的有效工具,它通过智能调整复习间隔,帮助你在即将忘记时进行复习。文章重点介绍了一项名为 FSRS(Free Spaced Repetition Scheduler)的新算法,称其为 SRS 领域的“静悄悄的革命”。
传统的 SRS 算法依赖固定的间隔规则,而 FSRS 将间隔调度视为一个预测问题,预测你在多久后回忆某个知识点的概率会下降到预设值(如 90%)。它使用机器学习模型,基于用户的复习历史个性化调整难度、稳定性和可回忆性函数,从而计算出最佳的下一次复习时间。FSRS 还允许用户设定期望的记忆保留率,并模拟不同保留率下的复习工作量,帮助用户找到平衡点。文章作者分享了使用 FSRS 后,复习负担减轻,挫败感降低,记忆效果更有信心的体验。领先的 SRS 软件 Anki 自 23.10 版本起已集成 FSRS。
社区可能会对 FSRS 背后的机器学习技术细节、参数优化以及与传统算法的对比表现出兴趣。Anki 用户可能会分享他们启用 FSRS 后的实际效果,以及在不同学习内容上的应用经验。关于 Anki 本身的使用技巧、界面改进建议,以及与其他学习工具的比较也可能成为讨论焦点。此外,如何设定“最佳保留率”以平衡工作量和记忆效果,也是一个值得探讨的话题。
AniSora: Open-source anime video generation model
来自 Bilibili 的 Project Index-AniSora 发布了 AniSora,一个开源的动漫视频生成模型。该模型被宣传为目前最强大的开源动画视频生成模型,能够通过“一键式”操作,根据图片和文字提示生成各种风格的动漫视频。该模型基于一篇已被 IJCAI'25 接受的研究论文,专门针对动漫和漫画风格进行了优化训练,并已在 Hugging Face 和 Model Scope 等社区发布。
社区对此项目展开了热烈讨论,主要围绕 AI 生成艺术的训练数据来源、对艺术家职业的影响以及版权问题。
关于训练数据和版权,许多人认为模型很可能使用了大量受版权保护的动漫、漫画和网络艺术作品进行训练,引发了数据合法性担忧。讨论涉及版权的本质、艺术创作中的借鉴与模仿、以及“合理使用”的边界。有人认为当前版权体系对大型机构更有利,而小型艺术家难以保护作品。
关于 AI 对艺术家职业和艺术未来的影响,许多艺术家表达了担忧,认为 AI 可能导致失业或艺术家沦为“AI 训练师”,担心艺术风格同质化。但也有人认为 AI 只是新工具,能帮助艺术家突破界限,真正的艺术家是出于热爱而创作。有人提出艺术家角色可能转变为“主厨”,负责指导和品控 AI 生成内容。
关于 AI 生成内容的本质,讨论涉及 AI 生成的视觉内容是否能被称为“艺术”。有人认为 AI 缺乏意图和创造力,只是衍生性生成;也有人认为艺术定义模糊,AI 已能生成美学上令人愉悦的作品,人类和机器生成艺术的界限将模糊。有人强调“人类意图”的重要性。
更广泛的社会和经济影响也被讨论。有人将 AI 对艺术家的影响与机器翻译类比,认为是自动化趋势。但也有人认为艺术的文化价值不同。关于未来,有人预测媒体将分层:大量廉价 AI 内容面向大众,昂贵人类创作成为小众奢侈品。也有人担忧高度个性化 AI 内容可能减少共享文化体验。讨论还触及普遍基本收入(UBI)等社会策略。
Ditching Obsidian and building my own
文章作者分享了放弃流行个人知识管理系统(PKMS)如 Obsidian,转而构建自己定制系统的经历。作者尝试过 Evernote、Notion、Obsidian 等工具,但对隐私担忧、过度定制化、以及商业服务长期不确定性感到困扰。特别是 Obsidian 的移动同步收费(每月 8 美元)和非开源核心,让作者担心长期使用和供应商锁定。核心问题是:“我能在 20 年后继续使用它吗?”商业应用的答案是否定的。
作为全栈工程师,作者决定自己构建。他使用开源数据平台 Directus 作为数据库的简单封装,存储 Markdown 格式的笔记。自托管在自己的 VPS 上,实现了完全数据隐私、免除订阅费、易于数据导出,并能轻松创建自定义工具。一年多实践证明,这种 DIY 方法结束了应用迁移循环,更有效地捕捉和连接想法。
社区对此展开了讨论,许多开发者对供应商锁定、隐私和成本问题表示共鸣,认同构建自己的工具以重获控制权的吸引力。
然而,讨论也涉及 DIY 方法的常见权衡:构建与购买。有人质疑自托管的维护负担(更新、备份、安全)是否真的小于商业服务的成本。当需要复杂功能时,DIY 系统能否跟上?有人对选择 Directus 提出疑问,建议其他开源 PKMS 或更简单的文件系统方案。关于安全性,有人质疑个人能否比专业团队更好地保护 VPS。最后,虽然数据是可移植的 Markdown,但围绕数据的系统(链接约定、数据库查询、自定义工具)可能难以迁移,这是否只是将迁移复杂性转移了?讨论反映了个人知识管理中控制、便利、成本和复杂性之间的权衡。
Show HN: I modeled the Voynich Manuscript with SBERT to test for structure
一个有趣的项目展示了如何使用现代自然语言处理(NLP)技术,特别是 SBERT 模型,来分析神秘的 Voynich Manuscript(伏尼契手稿)的结构。项目的目标不是翻译,而是探究这份无人能懂的手稿文本是否表现出真实语言那样的结构性。
作者对转录后的手稿文本进行预处理(剥离疑似后缀),使用多语言 SBERT 模型将词根转换为向量,然后进行聚类。通过分析词簇的频率、多样性、位置和转移模式,作者发现手稿文本确实表现出结构性,例如存在类似功能词和内容词的区分,以及非随机的词簇转移模式。不同章节的模式也存在差异。作者推测手稿可能编码了一种结构化的、构造的或助记的语言。
社区对此项目表现出极大的兴趣,讨论非常活跃。
技术层面,许多人建议尝试更新、更强大的嵌入模型(如 all-mpnet-base-v2
)和更优的降维可视化方法(如 UMAP, t-SNE),认为这些可能揭示更深层模式。预处理中的后缀剥离被认为是“强假设”,有人建议尝试不剥离或将后缀视为独立 token 分析。
关于 Voynich Manuscript 本身的性质,讨论围绕其是真正的语言/密码还是骗局展开。**“骗局论”**支持者指出文本排版异常、难以理解,可能是模仿语言的“朴素艺术”作品。然而,**反对“随机胡言乱语论”**的声音也很强,指出手稿文本表现出齐夫定律等统计特性和本项目发现的结构性模式,认为在几个世纪前创造出具有这些特性的随机文本非常困难。即使不是自然语言,其内部系统性也很有趣。
讨论还提到了其他可能的理论(如与宗教文本有关)和方法(如暴力破解尝试),以及将类似技术应用于其他未解手稿的可能性。
Proton threatens to quit Switzerland over new surveillance law
隐私服务公司 Proton 发出警告:如果瑞士通过一项新的监控法案,Proton 将考虑撤离瑞士。Proton 以其加密服务和瑞士总部(利用瑞士隐私法)为卖点。新的法案草案据称将迫使服务提供商存储更多用户数据并更容易提供给执法部门。Proton 认为这侵蚀了隐私保护,与其“不保留数据”的理念相悖。尽管修订版本据称已“流产”,Proton 认为政府考虑此类法案本身就设定了危险先例。
围绕这篇文章,社区展开了热烈讨论。
关于**“先例”的争论**,有人认为政府考虑此类法案本身就是负面信号,促使公司考虑转移以规避未来风险。但也有人认为法案在早期阶段被叫停,恰恰证明了瑞士民主制度(如公投)的强大防御能力,使得极端监控法案难以通过。
讨论深入探讨了政府行为的长期趋势,许多人担忧政府会持续推动监控议程,即使一项法案失败,未来可能卷土重来。
关于民主制度的防御机制,讨论比较了不同国家(瑞士、美国等)通过公投、宪法等机制抵御政府过度监控的能力。有人认为瑞士的公投是重要制衡,但也有人指出其可能导致改革缓慢。关于宪法,有人认为越难修改的宪法提供越强保护,但也有人认为最终保障在于知情活跃的民众。
Proton 的立场被讨论,有人认为是“表演性”威胁,但更多人支持其立场,认为对于“不保留数据”的公司,法律环境改变迫使其离开是维护信誉的合理选择。
讨论还触及了隐私与信任的哲学辩辩:如果完全信任政府,是否还需要隐私?反对者认为隐私一旦剥夺难以恢复,且政府信任可能破裂。
France Endorses UN Open Source Principles
法国正式认可了联合国提出的开源原则。这则消息由法国政府数字部门在其 Mastodon 账号上发布,选择 Mastodon 本身也传递了拥抱开放、去中心化技术的信号。这则消息更多是一个象征性姿态,指向法国政府在数字主权和开放技术方面的努力方向。
这则新闻在社区引发了热烈讨论,观点呈现出截然不同的两极,主要围绕“这是真诚的进步还是象征性的姿态”展开。
支持和看到积极进展的观点:有人分享了法国政府或机构中正在进行的开源和开放数据项目(如国家建筑注册局 RNB),认为这是积极尝试。有创业公司表示开放数据集带来了实际价值。一些在法国政府工作的评论者表示,正在缓慢采用政府开发的开源工具。讨论提到法国在开放数据、发布税收代码、审计专有软件等方面正在努力。
质疑和持悲观态度的观点:许多人对此认可持高度怀疑态度,认为“只是作秀”。他们指出,尽管有声明,法国政府大部分公共资金仍流向专有软件,并引用了与微软签订的大额合同案例。一些在政府实体工作的评论者表示,日常工作仍依赖微软产品,政府推广的“主权”开源工具不好用或无人用。有人认为这些倡议是“一厢情愿”,投入少,产出软件质量低。关于开放数据,有人抱怨数据不完整或未维护。
更广泛的讨论:讨论延伸到开源与民主、信任的关系,认为政府软件开放性是建立信任关键。有人担忧“开源”概念被稀释,未关注软件自由核心问题。还有人从地缘政治角度分析,认为法国此举部分出于数字主权考虑,希望减少对美国科技巨头依赖。少数人担忧政府过度介入开源可能导致未来监管。
O2 VoLTE: locating any customer with a phone call
文章作者发现英国移动运营商 O2 的 VoLTE 服务存在一个严重隐私漏洞。在用户进行或接收 VoLTE 通话时,通话发起方可以在自己的设备上看到对方的 IMSI、IMEI 以及当前连接的蜂窝基站信息(Cell ID)。通过将 Cell ID 与公开数据库比对,攻击者可以相对精确地定位通话接收方的位置。获取这些信息不需要特殊设备,任何能查看手机底层网络信令的设备都可以做到。作者对 O2 缺乏明确的负责任披露渠道表示失望。
社区对此事的反应强烈且多角度。一个重要更新是,在文章发布后,O2 已联系作者并确认问题已得到解决。
关于 O2 的处理方式,许多人对其缺乏透明的负责任披露流程表示不满,并与竞争对手进行对比。一些前 O2 员工或用户分享了对 O2 内部系统混乱、响应迟缓的负面印象。
在法律和技术层面,讨论涉及这种行为是否构成“黑客攻击”(数据是网络“自愿”发送的),以及这是否构成严重数据泄露事件,应受监管机构调查。技术讨论围绕为何这些信令消息会暴露给用户设备展开。
此外,讨论也涉及漏洞影响范围(如使用 O2 网络的虚拟运营商)以及政府或情报机构是否可能已知晓并利用此漏洞。
总的来说,社区认为这是一个严重的隐私漏洞,暴露了移动运营商在复杂系统部署中的潜在安全风险,并对 O2 在负责任披露和用户隐私保护方面的表现提出了批评,尽管问题最终得到了修复。
$30 Homebrew Automated Blinds Opener (2024)
文章作者分享了如何利用零散部件,花费约 30 美元搭建一个自制自动化百叶窗控制系统。项目的目标是让百叶窗在早上缓慢、静静地开启,以自然光唤醒。装置被设计成“世界上最慢的百叶窗开启器”,可在约 8 分钟内打开。
技术实现使用了直流电机、磁性角度编码器、继电器和 ESP8266 微控制器,机械部分主要依靠 3D 打印件。作者将电机连接到百叶窗调节杆,通过 ESP8266 和继电器控制。系统集成到作者的 Home Automation 系统中。构建中遇到的挑战主要是磁性角度编码器在电机扭动时读数不稳定,但作者发现可以通过扭矩变化来检测关闭位置。最终装置运行几乎无声。
这篇文章在社区引发了热烈的讨论。许多人认为自动化百叶窗,尤其是卧室的,是智能家居中对生活质量影响最大、最值得投资的项目,有助于自然光唤醒和调整睡眠节律。
除了唤醒功能,不少人强调了自动化百叶窗在温度控制方面的作用,通过根据太阳位置自动调整开合来节能。讨论也出现了关于**“完全遮光”与“自然光唤醒”**的不同需求对比。
在技术讨论方面,Home Assistant 成为焦点,许多人推荐其作为集成各种智能设备和 DIY 项目的平台,讨论了不同的自动化编程方式和连接协议。
然而,关于 DIY 智能家居,特别是涉及电力和机械装置的安全性问题,引发了严肃讨论。有人对处理市电的方式提出质疑,强调理解电气工程规范和安全隔离的重要性,警告不当 DIY 可能导致严重后果。关于儿童安全,也提到了百叶窗和自动化装置可能带来的缠绕或夹伤风险。
此外,讨论还探讨了替代的扭矩测量方法以及如何将自动化应用于其他类型的窗户覆盖物。