OctoPack:指令调整代码大型语言模型

Niklas Muennighoff、Qian Liu、Armel Zebaze、Qinkai Zheng、Binyuan Hui、Terry Yue Zhuo、Swayam Singh、Xiangru Tang、Leandro von Werra和Shayne Longpre
本文介绍了一种利用代码进行指令调整的方法,以提高大型语言模型(LLMs)在自然语言任务中的性能。作者们利用 Git 提交的自然结构,将代码更改与人类指令配对,使用代码进行指令调整。他们编译了 CommitPack,其中包含 350 种编程语言的 4TB Git 提交。作者们在 16B 参数的 StarCo...

用户分享观点: