Select Language

AI社区

人工智能论文

CausalLM并不适合于上下文学习

407浏览 Google和UC San Diego Nan Ding、Tomer Levinboim、Jialin Wu、Sebastian Goodman和Radu Soricut 08-15 23:33

SWARM Parallelism: 大型模型训练的去中心化并行算法

424浏览 Max Ryabinin,Tim Dettmers,Michael Diskin,Alexander Borzunov 08-11 10:05