大模型迭代迎来新法则,谁将从中受益?
长期以来,大模型的发展遵循依靠模型参数增加、数据集规模扩充以优化模型性能的规模定律。但随着可用于预训练的开源数据挖掘殆尽、模型训练所需的算力资源紧缺,大模型发展遵循的Scaling Law即将失效。在近日举行的清华大学基础模型2025学术年会上,清华大学计算机科学与技术系副教授刘知远表示,“密度法则”将接替Scaling Law成为最新大模型迭代规律。根据这一法则,端侧智能将迎来广阔发展前景。“芯
大模型Scaling Law(规模定律)将失效?
长期以来,大模型的发展遵循依靠模型参数增加、数据集规模扩充以优化模型性能的规模定律。但随着可用于预训练的开源数据挖掘殆尽、模型训练所需的算力资源紧缺,大模型发展遵循的Scaling Law即将失效。在近日举行的清华大学基础模型2025学术年会上,清华大学计算机科学与技术系副教授刘知远表示,“密度法则”将接替Scaling Law成为最新大模型迭代规律。根据这一法则,端侧智能将迎来广阔发展前景。
“密度法则”成为大模型发展新定律?
“芯片电路密度(即芯片计算单元数量与芯片面积的比值)每18个月翻1倍。”这是集成电路行业熟悉的摩尔定律。

刘知远提出的“密度法则”与这一规律类似,指大模型知识密度将每100天翻1倍。
基于这一定律,刘知远认为,模型将朝着参数小型化、成本普惠的方向发展,并提出基于该定律的四条推论:
**推论一:实现特定AI水平的模型参数呈指数下降,实现相同智能水平的模型参数量每3.3个月下降一半,同时模型推理速度提升一倍。**例如,2024年2月发布的2.4B规模的MiniCPM-1,能力与2023年9月发布的7B规模Mistral相当,但参数量仅相当于后者的35%。
**推论二:模型推理开销随时间呈指数级下降。**例如,在过去20个月内,GPT-3.5级模型的API价格下降至原先的1/266.7,约2.5个月下降一半,而更低的价格将会带来更多的应用。
**推论三:模型训练开销随时间迅速下降。**高质量互联网数据规模约为15T,可训练的模型最大参数约为750B,但1年后,仅需58B参数模型便可实现相同能力。
**推论四:大模型能力密度呈加速增强趋势。**ChatGPT发布之前,大模型能力密度约按每4.8个月增加1倍的速度增长;ChatGPT发布后,大模型密度倍增时间缩短至3.2个月。
模型小型化彰显端侧AI能力
在“密度法则”下,模型将沿着这样的路径发展:同等智能水平模型的训练、推理开销等成本降低,模型规模缩小,能力密度持续增强。
与此同时,在摩尔定律仍在发挥作用的情况下,端侧芯片的承载能力仍在增强。
这意味着,随着时间的推演,将出现能力水平非常高的大模型,同时其参数规模能够缩小到一定的程度,使其能够装载到消费级计算设备上。届时,端侧AI能力将得以彰显。
但将运行在云端的PB级的知识规模浓缩到GB级的小模型参数中,是一项具备挑战性的工作。如何进行海量互联网数据的治理、如何利用数据背后的知识实现模型高效学习以实现大模型的科学化制备,将成为未来大模型构建的关键课题。
智能算法创新远未收敛
在过去5年中,一项项技术创新推动着大模型的发展:2018年出现的自监督预训练技术,使大模型具备了掌握人类知识的能力。但这一阶段,模型只是实现了学习,还不能实现模型应用;2021年,有监督的微调技术,使模型具备了理解人类意图的能力,可从用户的负责指令中挖掘出人类的真实意图,并调用自己掌握的知识,完成该指令。2025年,模型借助强化学习技术,具备了深度思考的能力,可以在完成任务之前,像人一样深思熟虑,通过一步一步的思考给出准确的回答。
面向未来,刘知远认为,智能算法创新和演进远远没有收敛,未来人工智能迈向AGI(通用人工智能)过程中还要不断拓展能力树,这也是人工智能迈向的核心任务之一。其需要拓展的能力包括自主学习、合作、创新创造等。如果停止算法创新,则将落后于其他发展AI能力的行业参与者。
就像人类个体具备一定智能水平之后,其彼此之间通过协同实现了群体智能涌现一样,刘知远认为,人工智能在结束个体的智能涌现之后,将通过多智能体群聚,迎来群体智能的第二次涌现。就像互联网把全球信息和人连接在一起,群体智能就有机会通过智能体互联网连接在一起,实现智能的二次涌现。制定智能体接入与沟通协议,有利于异质智能体沟通协作,共同完成任务。且不同专业能力的智能体有机结合,将完成个体所不能胜任的更复杂的任务。
如何学习AI大模型 ?
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。【保证100%免费】🆓
CSDN粉丝独家福利
这份完整版的 AI 大模型学习资料已经上传CSDN,朋友们如果需要可以扫描下方二维码&点击下方CSDN官方认证链接免费领取 【保证100%免费】
读者福利: 👉👉CSDN大礼包:《最新AI大模型学习资源包》免费分享 👈👈
对于0基础小白入门:
如果你是零基础小白,想快速入门大模型是可以考虑的。
一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。
👉1.大模型入门学习思维导图👈
要学习一门新的技术,作为新手一定要先学习成长路线图,方向不对,努力白费。
对于从来没有接触过AI大模型的同学,我们帮你准备了详细的学习成长路线图&学习规划。可以说是最科学最系统的学习路线,大家跟着这个大的方向学习准没问题。(全套教程文末领取哈)
👉2.AGI大模型配套视频👈
很多朋友都不喜欢晦涩的文字,我也为大家准备了视频教程,每个章节都是当前板块的精华浓缩。

👉3.大模型实际应用报告合集👈
这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。(全套教程文末领取哈)

👉4.大模型实战项目&项目源码👈
光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战项目来学习。(全套教程文末领取哈)
👉5.大模型经典学习电子书👈
随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。(全套教程文末领取哈)
👉6.大模型面试题&答案👈
截至目前大模型已经超过200个,在大模型纵横的时代,不仅大模型技术越来越卷,就连大模型相关的岗位和面试也开始越来越卷了。为了让大家更容易上车大模型算法赛道,我总结了大模型常考的面试题。(全套教程文末领取哈)
为什么分享这些资料?
只要你是真心想学AI大模型,我这份资料就可以无偿分享给你学习,我国在这方面的相关人才比较紧缺,大模型行业确实也需要更多的有志之士加入进来,我也真心希望帮助大家学好这门技术,如果日后有什么学习上的问题,欢迎找我交流,有技术上面的问题,我是很愿意去帮助大家的!
这些资料真的有用吗?
这份资料由我和鲁为民博士共同整理,鲁为民博士先后获得了北京清华大学学士和美国加州理工学院博士学位,在包括IEEE Transactions等学术期刊和诸多国际会议上发表了超过50篇学术论文、取得了多项美国和中国发明专利,同时还斩获了吴文俊人工智能科学技术奖。目前我正在和鲁博士共同进行人工智能的研究。
资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。


CSDN粉丝独家福利
这份完整版的 AI 大模型学习资料已经上传CSDN,朋友们如果需要可以扫描下方二维码&点击下方CSDN官方认证链接免费领取 【保证100%免费】
读者福利: 👉👉CSDN大礼包:《最新AI大模型学习资源包》免费分享 👈👈
更多推荐
所有评论(0)