未来领袖|健康面壁:以小博大的战略,清华大
作者:365bet体育 发布时间:2025-11-15 09:20
注重效率、拥抱末端、以小事办大事,这群AI领域的“面壁人”正在打造能在手机、汽车等终端设备上流畅运行的智能模型。第一个达到GPT-4O水平的大端侧多模态模型、“密度定律”的提出者和实践者、国内第一个“抄袭美国人”的模式——这就是AI领域崛起的成立三年的北京面墙智能院有限公司(以下简称“面墙智能”)。 Face Wall的核心团队来自清华大学。联合创始人兼首席科学家刘志远是国内最早研究自然语言处理的科学家之一。与其他“做大模型”的公司不同,面墙智能选择了独特的端到端AI路线,推出了MinICPM系列端到端模型。由于2.4B的参数能力超过了Mistral 7B型号并获得了好评在此基础上,面墙智能陆续开发出基础型、多模态、全模态的全线minicpm端型号。智能面壁的故事,不仅是一支年轻AI技术团队的成长史,也是中国在大规模模型浪潮中从追随者转变为创新者的例子。就像科幻小说中试图改变未来的“面壁者”一样,这家公司注重效率,试图打破AI模型对计算资源的过度依赖,让智能在终端设备上“飞入寻常百姓家”。智能办公室临墙的墙上写着“走先人一步,以少博多”的字样。 “走先人一步的路,少争多赢。”新京报贝壳财经记者 罗一丹/摄 “走先人一步之路,以少胜多”。当新京报贝壳财经记者走到位于清华科技园的办公室的智能墙前,首先映入眼帘的是墙上的这句话,而这句话也是对面向墙壁的路线的清晰描述。 2020年12月,清华大学计算机系副教授刘志远团队训练了中国第一个开源大型模型“CPM”。这个项目也是中国大模型“五道”奠基的前身。 2022年8月,面墙智能成立。虽然是一家年轻的公司,但其核心团队是基于清华大学实验室十余年自然语言处理研究的深厚积累而成长起来的,而且这个成立比Chatgpt流行之前还要早,完全是“领先一步”。而当2023年,国产大车型相互对峙,市场进入“百款大战”时,智能汽车面对墙壁的情况选择了不同的路径端到端模型。与大型语言模型靠数量取胜、参数往往达到数千亿、万亿不同,客户端模型旨在仅利用手机、PC等终端的算力支持一个完整、可用的模型。刘志远告诉财经财经记者,规模法则有一个重要的悖论:“当模型训练得越来越大时,构建和使用模型的成本与规模成正比,这将导致世界上能够开发和负担得起这样模型的团队越来越少。”刘志远接受了记者采访。新京报贝壳财经记者 吉喆/摄影 基于这一观点,刘志远团队提出了大型模型的致密定律。“就像追求电路密度加倍的摩尔定律一样,对于大型模型,我们必须把更多的知识投入到单位单元中。”刘志远告诉记者。新京报贝壳财经记者表示,G模型的能力密度每100天就可以翻倍,“也就是说每100天,就可以用一半的参数来实现100天前模型的能力,而面向墙的智能发展至今都遵循着这个规律”。 2024年2月,面墙智能推出端侧大模型minicPM,仅用24亿个参数就实现了超过100亿参数的大模型的性能。 2024年6月,“小智能”小铁炮”minicpm-llama3-v 2.5模型甚至被该大学斯坦福大学的团队“抄袭”。抄袭者道歉并下架了该模型,但这也证明了一个事实,国产模型开始崛起,其实力得到业内人士认可。在很小的空间里蚀刻出非常复杂的电路,相当于我们试图在很小的空间里雕刻出复杂的电路。将整个互联网的大数据捕获到一个非常小的模型中,以提高模型能力的密度,需要: 1. 设计一个能够容纳大量知识的高效模型架构; 2、利用管理数据,从PB级数据中找到真正的高信息“教学”; 3. 从数据到模型本身的学习过程也是一个非常复杂的过程。我们提出了“模型风洞”的概念。就像制造飞机之前一样,我们首先需要在风洞中进行模拟实验。我们通过大量的实验掌握了规则,然后推断出真正需要实践的模型政策。另外,底层训练时使用的CHIP参数也与其密切相关,也需要软硬件的配合。 ”刘志远在接受新京报贝壳财经记者采访时表示。技术突破与未来愿景 Voxcpm 和 MinicPM-V 4.5 成为国际开源社区平台Huggingface第一、第二大模型开放财经文本记者模型后表示,目前AI领域还有大量未解决的问题,“比如如何让架构的效率和效率更好——学习,全局数据都学会了之后做什么等等。刘志远认为,明年、后年,将会出现AI领域一个重要的里程碑式的成就——‘自主强化学习’技术的时代。”从去年到今年今年,学习范式从之前的单词到单词的学习扩展到强化学习,这意味着模型可以创建自己的数据来学习。例如,对于一道数学题,模型会探索十几种不同的解题思路,用标准答案来验证对错,然后从中学习。这是非常重要的学习。逐字逐句地遵循教科书,但要具有独立学习的能力。针对未来的“面墙者”,“在打破强化的自主学习之后,模型在任何给定领域都会不断变化和成长。从全球分布来看,最大的算力其实位于用户端。充满科幻色彩的《面墙者》刘志远告诉新京报贝壳财经记者,在选择名字时,他实际上就定下了英文名“ModelBest”,意思是“成为最好的模型”。中文名应该以M和B开头。 “经过一番寻找,我们认为面朝墙壁更符合人工智能的目标。它有一种科幻的态度,也是隐喻人类智力发展到最高境界时应该反思的。”刘志远说,确立最终目标后,一定要看清形势,准确预测,打好每一仗。《持久战》是非常值得创业者参考的,因为奔向AGI本身也是一场“保护战”。在这个过程中,敌人是不确定的,你需要PK自己、PK朋友、PK商人、PK不确定的未来。走到最后的就是胜利者。刘志远告诉新京报贝壳财经记者,北京在人工智能领域拥有全国最强的积累。“清华大学在1978年之后就确立了人工智能方向,几十年来一直在努力。”他特别指出,北京市各级政府高度重视人工智能的发展。“2019年,我被北京致远人工智能研究院授予致远学者称号。当时,大型模型还没有受到广泛的青睐,但北京对人才给予了非常慷慨的支持。”近三年来,北京致远、知浦、国资、海淀区的投资支持。 2025年10月,墙端面墙模型将部署在车辆上。在汽车、手机等终端领域实现规模化落地。刘志远预测,在不久的将来,配备他的毕业模型的设备数量将增加十倍。这位从清华大学走出来的学者、企业家,正在带领团队在AGI的长征路上砥砺前行。中国互联网发展基金会中国正能量网络传播专项资金支持新京报贝壳财经记者陈莉校对刘保庆
电话
020-66888888