Pockot珀刻机

Pockot

创始笔记

创始笔记:有用的本地智能有功耗预算

缺口

云端 AI 从一个假设开始:网络、电力、账户和数据中心会持续工作。珀刻机从移除这个假设开始。

问题不是口袋设备能否模仿大型数据中心模型。它不能。问题是当设备必须活在真实包络内时,还剩下什么有用的本地智能:加速器吞吐、持续功耗、电池瓦时、内存、存储、模型大小、热限制与离线语料。

这个下限正在移动。Apple 称 M4 Neural Engine 最高可提供 38 trillion operations per second。来源:Apple M4。Raspberry Pi AI HAT+ product brief 列出 13 和 26 TOPS 的加速器版本。来源:Raspberry Pi AI HAT+ product brief。Qualcomm Snapdragon X Elite 页面称该平台可以在设备端运行超过 13B 参数的生成式 AI 模型。来源:Qualcomm Snapdragon X Elite

这些数字有用,但不够。TOPS 不说明系统能运行多久、模型可用内存多少、运行时是否成熟、本地知识还能留多少存储,也不说明热降频出现时会发生什么。

珀刻机存在,是为了让这些约束可见。

为什么现在重要

小模型已经拥有正式的端侧路径。Meta 的 Llama 3.2 发布包含面向部分 edge 与 mobile devices 的轻量文本 1B 和 3B 模型,并称 1B 与 3B 模型具备 128K-token context length。来源:Meta Llama 3.2

这改变了问题。一个本地设备不再只能按是否运行最大模型来判断。它可以按任务适配来判断。它能否总结本地文档?搜索已存语料?辅助现场笔记?解释维修手册?维护私人日志?基于本地参考起草代码?在没有网络时翻译?这些任务比云端通用性更窄,但更窄不等于无用。

功耗边界同样具体。FAA 面向航空旅客与电池的页面将 100 Wh 视为备用锂离子电池与充电宝的标准边界,更大电池在规定限制下需要航空公司批准。来源:FAA batteries。珀刻机把 100 Wh 用作务实参考点,而不是产品主张。在 10 W 持续功耗下,100 Wh 意味着扣除转换损耗、热效应与工作负载变化之前,简单模型续航为 10 小时。这是计算,不是保证。

新的工作不是写生存故事,而是测量设备在去掉云依赖后还能继续做什么。

这种测量必须保持本地。冷却实验室里接墙电跑出的 benchmark 有用,但它不同于一个必须用电池运行、存储自身参考资料,并在断电后干净恢复的小型外壳。一个能快速回答一条 prompt 然后过热的模型,和一个能缓慢工作数小时的工具,是不同对象。珀刻机会把这些情况分开。

珀刻机会研究什么

珀刻机从六个问题开始。

第一:针对具体离线任务,最小有用模型是什么?1B、3B 与 13B 模型不可互换。答案取决于任务、量化、上下文、延迟与内存。

第二:现实的持续功耗是多少?峰值加速器数字不是持续系统数字。设备还包含 CPU、内存、存储、显示、无线电、传感器与热开销。

第三:多少本地知识才够?离线有用性取决于语料。一个能运行模型却不能存放相关手册、笔记、地图或参考资料的设备,并不具备韧性。

第四:哪些运行时可测?珀刻机会优先选择可复现实测,而不是含糊的兼容性主张。一条有用记录应该命名芯片、模型、量化、如有测量则列 tokens per second、持续功耗与运行条件。

第五:什么可以离线更新?“自改进”必须谨慎处理。本地设备也许支持检索更新、笔记整合、工具日志或小型 adapter 实验。这不同于关于自主模型改进的无支持主张。

第六:什么会先失败?在口袋系统中,限制因素可能是电池、热、内存带宽、存储、模型质量,或用户维护语料的能力。

我们的方式

第一个工具是离线算力可行性测算器。v0 要求输入 TOPS、持续功耗、电池 Wh、模型大小、量化、存储与语料大小。它返回模型续航、近似模型内存、剩余存储、存储适配、每 B 参数算力,以及保守假设层级。

这个测算器故意克制。它不保证性能,不认证安全,不声称自主性。它只把假设做得足够可见,让人可以反驳。

第一批研究笔记会比较设备类别:手机级 NPU、笔记本级 NPU、Raspberry Pi 加加速模块,以及小型专用 edge boxes。输出应该是一张活表:什么能本地运行、能运行多久、受哪些约束。

项目也会追踪维护。离线有用性不只是推理。它包括更新本地语料、检查文件完整性、保存私人笔记、导出状态,以及当本地参考集不完整时解释低置信度。这些约束普通,却是 demo 与一个人真能长期保有的设备之间的差异。

珀刻机的运行问题很简单:当网络消失时,仍然有用的最小栈是什么,而这个栈中仍然缺失的是哪一部分?