AI圈新闻点评

斯坦福 AI 团队被{曝:bao4}抄袭中国面壁开源模型,目前该项目作者对抄袭中国大模型致歉,如何看待这件事情?大家好,最近有一则科技圈的新闻上了热搜,大家都很关注,那就是国外AI团队抄袭国内产品。让我来帮帮大家捋一捋事情的经过吧!
2024年5月29日,斯坦福大学的一个研究团队推出了Llama3-V,他们声称仅需500美元就能训练出一个超越SOTA水平的多模态大型模型,其性能超越了GPT-4V、Gemini Ultra和Claude Opus。
该模型的三位“创造者”——Aksh Garg、Siddharth和Mustafa,分别拥有名校背景或曾在特斯拉、SpaceX等知名企业工作,这一项目因此引起了业界的广泛关注。他们在X、Hugging Face等社交媒体上大肆宣传这一成果。
并且迅速在Hugging Face趋势榜上升到第五。
随后国内学者Magic Yang在网站发现一些问题,这个团队疑似抄袭中国面壁开源大模型。他质疑Llama3V实际上是面壁智能在5月中旬发布的8B多模态小模型MiniCPM-Llama3-V 2.5的复制品,并且在Llama3V的工作中未对MiniCPM-Llama3-V 2.5表示任何形式的“致敬”或“感谢”。Llama3V团队回应称,他们“仅使用了MiniCPM-Llama3-V 2.5的tokenizer”,并声称“在MiniCPM-Llama3-V 2.5发布之前就已经开始了这项工作”。
6月2日,Magic Yang在Llama3V的Github项目下提出了实质性质疑,但这些质疑很快被Llama3V团队删除。
而他们删除质疑的这一行为激怒了提出质疑的Magic Yang
他前往MiniCPM-V的Github页面还原了事件,并提醒面壁智能团队注意此事。
随后,面壁团队通过测试发现,Llama3V与MiniCPM-Llama3-V 2.5在某些案例上的表现完全一致,甚至是对“清华简”这一特别字体的识别,“不仅正确的地方相同,连错误的地方也完全相同”。
就此,本次抄袭行为被实锤。这一发现引发了X和国内各媒体平台上的舆论发酵,“斯坦福抄袭中国大模型”的消息迅速传播开来。