AI的肉体,算力资源

AI 也有 “肉体”吗,其实就是算力!今天 3 分钟说透:算力是啥、有多重要,公司咋规划才不踩坑。首先什么是AI的算力资源,算力资源是驱动人工智能模型进行训练和推理所需要的计算资源,它包含硬件、软件和能源,但通常的算力资源我们一般指技术难度最高的硬件资源

算力有什么用,算力的作用至关重要的,是AI发展的基石。不论是模型训练,还是模型推理都需要消耗大量的算力,比如deepseek的训练需要消耗14.8万亿token的算力,按一台安装了i7cpu的性能良好的家用电脑计算,需要1.74亿年的运算才能完成deepseek的训练。很显然,如此长的时间是不可接受的,我们需要超强的算力来压缩在计算上的时间消耗

计算机的运算主要由两个组件负责,一个是cpu,一个是gpu。CPU(中央处理器)核心数量少(一颗cpu一般几个核心到几十个核心),但每个核心都非常强大,擅长处理复杂的、串行的任务;GPU(图形处理器)核心数量多(一颗gpu有几百个核心到几千个核心),用于同时处理大量简单的、并行的计算任务。比如渲染屏幕上数百万个像素的颜色,每个像素每秒钟需要运算至少60次,如此大的计算量就是通过大量的gpu核心同时计算完成的,否则我们看到的画面会非常卡顿,或者满是马赛克。

神经网络模型的计算主要是大规模的矩阵和张量运算,这些运算可以完美地分解成成千上万个互不依赖的简单计算任务。因此,GPU的“人海”架构正好完美匹配了AI计算的“大规模并行”需求。 在相同的成本和时间下,GPU处理AI训练和推理的速度比CPU要快几个数量级(10倍到100倍以上),所以我们说的AI算力通常指GPU的性能与数量。

普通公司该如何规划算力资源,由于ai正在快速发展阶段,软硬件迭代非常快,硬件容易快速折旧,所以建议优先采购公有云算力,在业务稳定后再考虑自建AI算力,也就是GPU服务器,这样可有效降低成本与风险;就是我们通常说的,不要自己发电,先去国家电网买电,当你的用电量巨大且稳定到一定程度时,再考虑自建电厂。

如果需要采购gpu服务器,如何选择性价比高的显卡呢,我们可以通过3DMark分数来进行评估,因为3DMark分数可以衡量显卡的综合性能,分数越高,显卡运算能力就越强。所以,可以用每元性能比来评估显卡的性价比,它等于3DMark 分数 ÷ 价格,这样可以得到每一块钱可以得到多少算力,显然每块钱得到的算力越多,显卡的性价比就越高。

更多推荐