【避坑指南】8GB 显存也能跑 Karpathy 的 autoresearch?RTX 4060 笔记本实测生存手册!

谁说非要 H100 才能玩自动科研?

Andrej Karpathy 发布的 autoresearch 震撼全网,但项目说明文档里赫然写着:需要 H100 (80GB)。这让广大只有游戏本的大学生和独立开发者直接劝退?
不!只要思路对,4060 也能起飞。 今天带大家手把手在 8GB 显存的 RTX 4060 笔记本上强行“续命”跑通。


核心环境:G 盘、Conda 与南大镜像

为了不让 C 盘爆满,我们把环境和项目全部塞进 G 盘

1. 极简环境配置:

# 指定路径创建环境
conda create --prefix G:\anaconda_envs\auto_search python=3.10
conda activate G:\anaconda_envs\auto_search

# 官方源太慢?直接上南大镜像站(NJU Mirror)
pip install torch --index-url https://mirrors.nju.edu.cn/pytorch/whl/cu128
pip install kernels matplotlib numpy pandas pyarrow requests rustbpe tiktoken -i https://mirrors.nju.edu.cn/pypi/web/simple

2. 显存自检:
当屏幕上出现 CUDA available: True | GPU: RTX 4060 Laptop | VRAM: 8.0 GB 时,你就已经拿到了入场券。


关键改:8GB 显存的“生存代码”

项目原生的 train.py 会直接撑爆 8GB 显存。要在笔记本上跑起来,必须对 train.py 进行降维打击

你需要修改的三个关键参数:

参数项 原始值 (H100) 4060 推荐值 理由
DEPTH 8 4 减少层数是省显存最直接的方法
TOTAL_BATCH_SIZE 2192^{19}219 (524K) 2142^{14}214 (16K) 笔记本扛不住那么大的全局 Batch
WINDOW_PATTERN “SSSL” “L” 降低滑动窗口复杂度

[!TIP]
运行数据准备时,记得加上 --num-shards 2 限制数据分片,否则你的 C 盘缓存文件夹(.cache\autoresearch)可能会瞬间消失几十 GB 空间。


展示

启动命令:

python prepare.py --num-shards 2
python train.py

看着 val_bpb 指标在 AI 的自主修改下一点点下降,这种**“睡后收益”**的爽感,只有亲手跑通的人才懂。哪怕速度比 H100 慢,但 AI 迭代的逻辑是一样的——它在帮你探索代码的边界。

你想看我如何把这套逻辑应用到“自动视觉检测”任务中吗?点赞关注,下期更新!


在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

更多推荐