1. 新闻
  2. enterprise-ai
  3. MIT衍生公司Liquid AI发布企业级小模型训练蓝图
post-main
AIenterprise aiAI in Finance and Banking

MIT衍生公司Liquid AI发布企业级小模型训练蓝图

MA
Ma Lin
3个月前7 分钟阅读
企业人工智能领域正在经历一场静默而深刻的转变,正从单一依赖云端巨头的模式中脱离。本周,随着源自麻省理工学院的初创公司Liquid AI发布一份详细的技术报告,这一转型获得了一份重要的新蓝图。该文件详尽阐述了其Liquid Foundation Models系列2(LFM2)背后的架构、训练方案和设计理念,实际上为构建可直接在笔记本电脑和智能手机等设备上运行的小型高效模型提供了一份可复现的配方。对于正在应对延迟、成本和数据隐私等实际限制的组织而言,这不仅仅是一次模型发布;它是一份面向新型混合AI架构的基础指南。 LFM2的核心创新在于其有意地背离了主导大量AI研究的GPU实验室范式。Liquid AI团队由麻省理工学院的计算机科学家领导,他们并非孤立地追逐基准测试分数,而是从生产部署的严峻现实出发。他们直接在目标硬件(骁龙移动芯片和锐龙笔记本电脑CPU)上进行架构搜索,以找到在真实的热量和功耗限制下,在能力、延迟和内存之间实现最佳权衡的设计方案。其成果是一个从3. 5亿到26亿参数的混合模型家族,主要由门控短卷积块构成,并辅以分组查询注意力机制。选择这种架构并非为了学术新颖性,而是为了操作的可预测性和可移植性,确保密集型和专家混合变体共享一个结构主干。其含义显而易见:企业现在可以满怀信心地设计AI系统,确信它们将在需要的地方实际运行,而不仅仅是在数据中心。 报告中详述的训练流程同样务实,旨在通过结构上的巧妙设计来弥补参数量较小的不足。一个10-12万亿token的预训练阶段之后,是一个32,000上下文长度的中期训练阶段,以在不付出过高成本的情况下扩展有效窗口。或许更重要的是,训练后流程——监督微调、长度归一化的偏好对齐和模型合并——经过明确调优,以产生可靠的指令遵循和工具使用行为。这解决了许多小型开源模型的一个关键弱点,这些模型在生产中失败往往不是因为缺乏推理能力,而是因为对格式和模式要求的脆弱遵循。Liquid AI已针对操作可靠性优化了这些模型,使它们的行为不像发育不良的大型语言模型,而更像实用、可部署的智能体。 这一理念延伸到了多模态变体LFM2-VL(视觉)和LFM2-Audio(音频)。这里的重点是token效率,这是设备端性能的关键指标。视觉模型使用SigLIP2编码器和一个连接器,该连接器积极减少视觉token数量,而高分辨率输入则触发动态分块以保持处理开销可控。音频模型采用分叉路径来支持在普通CPU上进行实时转录。对于企业架构师而言,这预示着一个未来:文档理解、音频分析和多模态交互可以直接在终端设备上进行,从而保护隐私并消除网络延迟。 此外,LFM2-ColBERT(一个紧凑的后期交互检索模型)的加入,为构建本地检索增强生成(RAG)系统完善了图景。它支持快速的设备端文档搜索,这是数据主权至关重要的智能体工作流的基石。总而言之,这些组件形成了一个模块化系统,而非单一模型,旨在作为分布式AI的“控制平面”运行。 更广泛的背景是企业混合AI堆栈的成熟。多年来,主流叙事认为“真正的AI”需要云端推理,将设备端处理降级为简单的、预定义的任务。LFM2及其所体现的理念正面挑战了这一假设。新兴的架构使用小型、快速的本地模型来处理时间关键的感知、格式化和判断,同时在绝对必要时将较大的云模型留给重量级推理。这种混合方法融合了几个关键的企业趋势:通过避免不可预测的云端推理账单实现可预测的成本控制,通过消除网络抖动实现延迟确定性,为数据驻留和个人身份信息处理简化治理,以及提升整体系统弹性。 对于首席信息官和首席技术官而言,战略要点在于:设备端AI现在是一个可行的设计选择,而非能力上的妥协。虽然LFM2不会在最复杂的推理任务上取代前沿模型,但它为必须在任何地方(从现场设备、车辆到物理隔离的安全设施)运行的智能体系统提供了一个可复现的开放基础。通过发布这份详细蓝图,Liquid AI所做的不仅仅是发布一个模型;它为行业的架构趋同提供了一个路标。企业AI的未来并非云端与边缘的二元选择,而是两者精妙而有意的编排。像LFM2这样的发布提供了构建这一未来的基本构件,推动我们果断地从AI研究演示时代迈向工程化、可部署智能的时代。.
#Liquid AI
#LFM2
#on-device AI
#small language models
#enterprise AI
#edge computing
#generative AI
#featured

保持知情,明智行动。

获取每周精选、重要头条和专家见解 — 然后在我们的实时预测市场中运用您的知识。

评论
科技
科技乐天派101天前
每次看到这种进展都让人感觉未来就在眼前了,设备上直接跑AI,隐私和延迟问题都能解决,这蓝图真挺鼓舞人心的
0
© 2026 Outpoll Service LTD. 保留所有权利。
关注我们: