编码临床知识的大型语言模型
Karan Singhal,Shekoofeh Azizi,Tao Tu,S. Sara Mahdavi,Jason Wei,Hyung Won Chung,Nathan Scales,Ajay Tanwani,Heather Cole-Lewis,Stephen Pfohl…Vivek Natarajan
大型语言模型在自然语言理解和生成方面取得了令人印象深刻的性能。然而,医学应用程序的质量标准非常高。为了解决这个问题,我们提出了一种人类评估框架,包括事实性、精度、可能造成的伤害和偏倚。此外,我们还评估了PaLM(一个540亿个参数LLM),并将其指导变体改进了。...