“‘作假,直至成功’,这是硅谷不光彩的文化。”美国斯坦福大学人工智能实验室主任克里斯托弗·曼宁3日就该校某些研究人员抄袭中国清华大学等机构成果的行为这样评论说。他在社交媒体上还指出,该研究团队应该深刻认识自己的错误。
5月29日,斯坦福大学一个研究团队发布名为Llama3-V的大模型,声称只要500美元的预训练成本,就能用它获得比肩GPT-4V等著名大模型的效果。这一消息在社交媒体和人工智能学术界被广泛转发。
但业内人士很快发现,该大模型涉嫌抄袭清华大学等机构发布的MiniCPM-Llama3-V 2.5大模型。它们都是基于开源的Llama3大模型,但清华团队进行了独特的训练,包括利用“清华简”(清华大学收藏的一批战国竹简)训练它识别古代中国文字的能力。测试显示,斯坦福大学这个团队发布的大模型居然也能识别“清华简”。
“已经比较确信,斯坦福这个团队‘套壳’了我们的大模型研究成果。”清华大学计算机系长聘副教授刘知远对新华社记者说。
“我们从‘清华简’逐字扫描并标注的数据集从未公开,而Llama3-V展现出了一模一样的识别‘清华简’能力,连做错的样例都一样。”刘知远是清华这个大模型团队成员。他介绍说,在质疑声发酵后,对方已经在网上删除了此前发布的数据库和宣传文章,“从证据和对方反应来看,抄袭性质已比较确定”。
曼宁发声批评后,斯坦福该团队的两名成员夏尔马和加格也在社交媒体上正式道歉,并表示要完全撤下Llama3-V模型。
在当前的人工智能热潮中,这个事件引发广泛关注。有观点认为美国的人工智能全面领先,但该事件说明,虽然美国科技仍然整体领先,但远非全能,也不应迷信美国单方宣布的“重大成果”。
斯坦福大学所处的硅谷地区被认为是美国科技创新的重镇,既孕育了许多先进技术,也有“作假,直至成功”等被津津乐道的负面文化。
比如,从斯坦福大学退学创业的伊丽莎白·霍姆斯曾吹嘘有颠覆性检测技术可“抽指血查癌症”,一度成为全球闻名的科技创业明星,但后来被发现造假并因欺诈投资者罪名获刑。放眼整个美国科技领域,近年来波音客机事故频发等暴露了更多、更大的问题。
在人工智能领域,前段时间还有个“著名”事件,在用中文问谷歌人工智能模型“双子座”Pro版(Gemini Pro)它是谁时,它会回答自己是“文心一言”,这个问题很快被谷歌消除。业界人士认为,其原因可能是谷歌在训练大模型的中文时“参考”了中国百度公司的大模型“文心一言”相关数据。
可见,中国科技近年来快速发展,一些独特的优势越来越引人注目,被美国同行“参考”甚至抄袭。
“中国人工智能研究的国际影响力越来越大”,刘知远说,“这次抄袭事件也从侧面反映了我们的创新成果正在受到国际关注”。他说,从横向来看,中国研究与国际顶尖成果仍有显著差距,但从纵向来看,中国已快速成长为人工智能科技创新的重要推动者。(记者吴晓凌 黄堃)
新华社旧金山6月3日电