珀刻机 — 创始笔记

创始笔记：有用的本地智能有功耗预算

发表于 2026 年 5 月

缺口

云端 AI 从一个假设开始：网络、电力、账户和数据中心会持续工作。珀刻机从移除这个假设开始。

问题不是口袋设备能否模仿大型数据中心模型。它不能。问题是当设备必须活在真实包络内时，还剩下什么有用的本地智能：加速器吞吐、持续功耗、电池瓦时、内存、存储、模型大小、热限制与离线语料。

这个下限正在移动。Apple 称 M4 Neural Engine 最高可提供 38 trillion operations per second。来源：Apple M4。Raspberry Pi AI HAT+ product brief 列出 13 和 26 TOPS 的加速器版本。来源：Raspberry Pi AI HAT+ product brief。Qualcomm Snapdragon X Elite 页面称该平台可以在设备端运行超过 13B 参数的生成式 AI 模型。来源：Qualcomm Snapdragon X Elite。

这些数字有用，但不够。TOPS 不说明系统能运行多久、模型可用内存多少、运行时是否成熟、本地知识还能留多少存储，也不说明热降频出现时会发生什么。

珀刻机存在，是为了让这些约束可见。

为什么现在重要

小模型已经拥有正式的端侧路径。Meta 的 Llama 3.2 发布包含面向部分 edge 与 mobile devices 的轻量文本 1B 和 3B 模型，并称 1B 与 3B 模型具备 128K-token context length。来源：Meta Llama 3.2。

这改变了问题。一个本地设备不再只能按是否运行最大模型来判断。它可以按任务适配来判断。它能否总结本地文档？搜索已存语料？辅助现场笔记？解释维修手册？维护私人日志？基于本地参考起草代码？在没有网络时翻译？这些任务比云端通用性更窄，但更窄不等于无用。

功耗边界同样具体。FAA 面向航空旅客与电池的页面将 100 Wh 视为备用锂离子电池与充电宝的标准边界，更大电池在规定限制下需要航空公司批准。来源：FAA batteries。珀刻机把 100 Wh 用作务实参考点，而不是产品主张。在 10 W 持续功耗下，100 Wh 意味着扣除转换损耗、热效应与工作负载变化之前，简单模型续航为 10 小时。这是计算，不是保证。

新的工作不是写生存故事，而是测量设备在去掉云依赖后还能继续做什么。

这种测量必须保持本地。冷却实验室里接墙电跑出的 benchmark 有用，但它不同于一个必须用电池运行、存储自身参考资料，并在断电后干净恢复的小型外壳。一个能快速回答一条 prompt 然后过热的模型，和一个能缓慢工作数小时的工具，是不同对象。珀刻机会把这些情况分开。

珀刻机会研究什么

珀刻机从六个问题开始。

第一：针对具体离线任务，最小有用模型是什么？1B、3B 与 13B 模型不可互换。答案取决于任务、量化、上下文、延迟与内存。

第二：现实的持续功耗是多少？峰值加速器数字不是持续系统数字。设备还包含 CPU、内存、存储、显示、无线电、传感器与热开销。

第三：多少本地知识才够？离线有用性取决于语料。一个能运行模型却不能存放相关手册、笔记、地图或参考资料的设备，并不具备韧性。

第四：哪些运行时可测？珀刻机会优先选择可复现实测，而不是含糊的兼容性主张。一条有用记录应该命名芯片、模型、量化、如有测量则列 tokens per second、持续功耗与运行条件。

第五：什么可以离线更新？“自改进”必须谨慎处理。本地设备也许支持检索更新、笔记整合、工具日志或小型 adapter 实验。这不同于关于自主模型改进的无支持主张。

第六：什么会先失败？在口袋系统中，限制因素可能是电池、热、内存带宽、存储、模型质量，或用户维护语料的能力。

我们的方式

第一个工具是离线算力可行性测算器。v0 要求输入 TOPS、持续功耗、电池 Wh、模型大小、量化、存储与语料大小。它返回模型续航、近似模型内存、剩余存储、存储适配、每 B 参数算力，以及保守假设层级。

这个测算器故意克制。它不保证性能，不认证安全，不声称自主性。它只把假设做得足够可见，让人可以反驳。

第一批研究笔记会比较设备类别：手机级 NPU、笔记本级 NPU、Raspberry Pi 加加速模块，以及小型专用 edge boxes。输出应该是一张活表：什么能本地运行、能运行多久、受哪些约束。

项目也会追踪维护。离线有用性不只是推理。它包括更新本地语料、检查文件完整性、保存私人笔记、导出状态，以及当本地参考集不完整时解释低置信度。这些约束普通，却是 demo 与一个人真能长期保有的设备之间的差异。

珀刻机的运行问题很简单：当网络消失时，仍然有用的最小栈是什么，而这个栈中仍然缺失的是哪一部分？