资讯
python train.py --data_dir data --model_dir checkpoints/400m --cfg baseline_355m --seq_len 1024 --batch_size 2 --grad_accum 16 --lr 3e-4 --warmup_steps 2000 --max_steps 100000 --bf16 data/ # Prepared ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果一些您可能无法访问的结果已被隐去。
显示无法访问的结果