Select Language

AI社区

人工智能论文

康奈尔科技大学|用图像和声音对多模态大模型进行间接指令注入

425浏览 康奈尔科技大学 Eugene Bagdasaryan, Tsung-Yin Hsieh, Ben Nassi, Vitaly Shmatikov 07-26 15:26

斯坦福|用大型语言模型改进元数据质量

294浏览 Stanford University Sowmya S. Sundaram, Mark A. Musen 07-26 23:05

Meta AI|Llama 2: 开放基础和微调聊天模型

288浏览 Meta Hugo Touvron, Louis Martin, Kevin Stone, Peter Albert, Amjad Almahairi, Yasmine Babaei, Nikolay Bashlykov, Soumya Batra, Prajjwal Bhargava, Shruti Bhosale, Dan Bikel, Lukas Blecher, Cristian Canton Ferrer, Moya Chen, Guillem Cucurull, David Esiobu, Jude Fernandes, Jeremy Fu, Wenyin Fu, Brian Fuller, Cynthia Gao, Vedanuj Goswami, Naman Goyal, Anthony Hartshorn, Saghar Hosseini, Rui Hou, Hakan Inan, Marcin Kardas, Viktor Kerkez, Madian Khabsa, Isabel Kloumann, Artem Korenev, Punit Singh Koura, Marie-Anne Lachaux, Thibaut Lavril, Jenya Lee, Diana Liskovich, Yinghai Lu, Yuning Mao, Xavier Martinet, Todor Mihaylov, Pushkar Mishra, Igor Molybog, Yixin Nie, Andrew Poulton, Jeremy Reizenstein, Rashi Rungta, Kalyan Saladi, Alan Schelten, Ruan Silva, Eric Michael Smith, Ranjan Subramanian, Xiaoqing Ellen Tan, Binh Tang, Ross Taylor, Adina Williams, Jian Xiang Kuan, Puxin Xu, Zheng Yan, Iliyan Zarov, Yuchen Zhang, Angela Fan, Melanie Kambadur, Sharan Narang, Aurelien Rodriguez, Robert Stojnic, Sergey Edunov, Thomas Scialom 07-29 19:50

DeepMind|Ada开放式任务空间中的人类时间尺度适应

263浏览 DeepMind Adaptive Agent Team, Jakob Bauer, Kate Baumli, Satinder Baveja, Feryal Behbahani, Avishkar Bhoopchand, Nathalie Bradley-Schmieg, Michael Chang, Natalie Clay, Adrian Collister, Vibhavari Dasagi, Lucy Gonzalez, Karol Gregor, Edward Hughes, Sheleem Kashem, Maria Loks-Thompson, Hannah Openshaw, Jack Parker-Holder, Shreya Pathak, Nicolas Perez-Nieves, Nemanja Rakicevic, Tim Rocktäschel, Yannick Schroecker, Jakub Sygnowski, Karl Tuyls, Sarah York, Alexander Zacherl, Lei Zhang 07-29 20:17

具备规划长程上下文理解和程序合成能力的真实世界WebAgent

310浏览 Google DeepMind Izzeddin Gur, Hiroki Furuta, Austin Huang, Mustafa Safdari, Yutaka Matsuo, Douglas Eck, Aleksandra Faust 07-29 22:39

伦敦大学等|大型语言模型的挑战与应用

309浏览 University College London Jean Kaddour, Joshua Harris, Maximilian Mozes, Herbie Bradley, Roberta Raileanu, Robert McHardy 07-29 22:49

使用多集标记和潜在置换的无树组合泛化

281浏览 爱丁堡大学、萨尔大学、阿姆斯特丹大学 Matthias Lindemann, Alexander Koller 以及 Ivan Titov 08-07 21:55

CAME:置信度引导的自适应内存高效优化

304浏览 新加坡国立大学、华为诺亚方舟实验室 罗旸,Xiaozhe REN, 郑奘巍,ZHUO JIANG, Xin Jiang 以及尤洋 08-07 17:11

背包语言模型

254浏览 斯坦福大学 John Hewitt, John Thickstun, Christopher Manning 以及 Percy Liang 08-07 17:13

基于注释的有意义手语机器翻译的思考

257浏览 苏黎世大学、苏黎世联邦理工学院、巴伊兰大学 Mathias Müller, Zifan Jiang, Amit Moryossef, Annette Rios 以及 Sarah Ebling 08-07 21:57

密集ATOMIC:迈向高知识覆盖和大规模多跳路径的密集连接ATOMIC

273浏览 南京理工大学 Xiangqing Shen, Siwei Wu 以及夏睿 08-07 22:04

从约束语言规划的大型语言模型中提取脚本知识

255浏览 复旦大学等 Siyu Yuan, Jiangjie Chen, Ziquan Fu, Xuyang Ge, Soham Shah, Charles Jankowski, Yanghua Xiao 以及 Deqing Yang 08-08 08:52

机器翻译度量的外在评价

368浏览 爱丁堡大学 Nikita Moghe, Tom Sherborne, Mark Steedman 以及 Alexandra Birch 08-08 09:05

用于语音到文本任务的混合转换器和基于注意力的编解码器建模

263浏览 Meta AI,卡内基梅隆大学 Yun Tang , Anna Y. Sun , Hirofumi Inaguma , Xinyue Chen , Ning Dong , Xutai Ma , Paden D. Tomasello 以及 Juan Pino 08-08 09:18

语言模型的可接受性判断并不总是对上下文具有鲁棒性

81浏览 Meta AI ,麻省理工学院,普渡大学,约翰霍普金斯大学 Koustuv Sinha ,Jon Gauthier , Aaron Mueller, Kanishka Misra ,Keren Fuentes ,Roger Levy 以及 Adina Williams 08-08 09:24

线性分类器:一个经常被遗忘的文本分类基线

79浏览 台湾大学、华硕、穆罕默德・本・扎耶德人工智能大学 Yu-Chen Lin, Si-An Chen, Jie-Jyun Liu 以及 Chih-Jen Lin 08-08 09:28

心智语言模型的(缺失)心智理论:一个即插即用的多角色信仰跟踪器

267浏览 华盛顿大学、CMU、艾伦人工智能研究所 Melanie Sclar, Sachin Kumar, Peter West, Alane Suhr, Yejin Choi 以及 Yulia Tsvetkov 08-08 09:39

MultiInstruction:通过指令调整改进多模式零样本学习

73浏览 弗吉尼亚理工大学 Zhiyang Xu, Ying Shen 以及 Lifu Huang 08-08 15:03

多语言LLM是更好的跨语言语境学习者

274浏览 DTU、德里印度理工学院 Eshaan Tanwar, Subhabrata Dutta, Manish Borthakur and Tanmoy Chakraborty 08-08 15:06

NL位置性:描述数据集和模型的设计偏差

265浏览 华盛顿大学、CMU、艾伦人工智能研究所 Sebastin Santy, Jenny Liang, Ronan Le Bras, Katharina Reinecke 以及 Maarten Sap 08-08 15:10