您好,欢迎您来到国盈网!
官网首页 小额贷款 购房贷款 抵押贷款 银行贷款 贷款平台 贷款知识 区块链

国盈网 > 区块链 > da模型,模型大会

da模型,模型大会

区块链 岑岑 本站原创

大模型遭泄两月后,Meta意外变赢家一份意外泄露的Google内部文件再次将Meta的LLaMA大模型“无意开源”事件推到了聚光灯下。

已知“泄露文件”的作者是谷歌内部的一名研究人员。他大胆指出,开源的力量正在填补OpenAI和Google等模型巨头数年来构建的护城河,最大的受益者是Meta,因为该公司在2月份意外泄露的LLaMA模型正在成为开源社区训练新的AI模型的基础。

几周之内,开发人员和研究人员开始基于羊驼进行微调训练,并相继发布了羊驼、骆马、单峰骆驼等中小型模型。不仅培训费用只花了几百块钱,硬件门槛也降低到了笔记本电脑甚至手机,测试结果也不比GPT-4差。

除了AI模型,FreedomGPT等ChatGPT应用也如雨后春笋般涌现,以羊驼为原型的“羊驼家族”也在不断壮大。该研究员认为,Meta很可能形成生态,成为最大赢家。

事实上,人工智能世界的某些部分确实已经进入了“Android时刻”,这部分就是开源社区。特斯拉前AI总监安德烈·卡帕西(Andrej Karpathy)在开源社区评论AI的进化时说,他看到了“寒武纪大爆发的早期迹象”。

在AI的赛道上,不仅科技巨头在奔跑,开源社区也正从小路涌入大道,成为人工智能发展中不可忽视的力量。

羊驼意外养出“羊驼一族”

“我们没有护城河,OpenAI也没有。”一篇来自谷歌内部的文章在半分析博客上传播。文章作者认为,Meta的美洲驼开源模式正在迅速聚集生态学的雏形,正在缩小与GPT的差距。开源AI最终会打破谷歌和OpenAI之间的护城河。

这篇文章再次引起人们对Meta的美洲驼模型的关注。模型代码泄露后的两个月内,意外成为开源社区训练自然语言模型的基础,也产生了很多中小型模型和应用。

回到今年2月24日,Meta推出了大语言模型LLaMA,根据参数分为7B、13B、33B、65B四个版本。虽然参数远不及GPT-3,但效果在AI圈获得了一些正面评价,尤其是在单个GPU上运行的优势。

Meta曾在官方博客中表示,像LLaMA这样更小更高性能的模型,可以被社区中无法访问大量基础设施的人用来研究这些模型,进一步民主化人工智能大语言模型的开发和访问。

“民主化”来得很快。美洲驼推出一周后,一位名叫llamanon的网友在国外论坛4chan上以种子文件的形式上传了7B和65B的美洲驼模型,下载后的大小只有219GB。从那以后,这个种子链接被发布到了GitHub,一个开源社区,下载量超过了一千次。羊驼就这样被泄露了,但是诞生了很多实验结果。

起初,一位名叫Georgi Gerganov的开发人员打开了一个名为LLaMA.cpp的项目,基于LLaMA模型的简单Python语言的代码示例,他创建了一个用于模型推理的纯C/C++语言版本。改语言最大的好处是研究人员可以不用GPU,只用CPU运行LLaMA模型,大大降低了大型模型的训练硬件门槛。

正如谷歌的研究人员所写,“训练和实验的门槛已经从一个大型研究机构的总产出降低到一个人、一个晚上和一台强大的笔记本电脑。”在开发者的不断测试下,LLaMA已经可以在微机树莓派4和谷歌Pixel 6手机上运行。

开源社区的创新热情也完全被点燃,每隔几天就会有新的进展,几乎形成一个“骆马(羊驼)生态”。

3月15日,斯坦福大学发布了对羊驼进行微调后的羊驼(LLaMA)模型,仅用了52K数据,历时3小时。研究人员声称,测试结果相当于GPT-3.5,培训费用不到600美元。在一些测试中,阿尔佩斯和GPT-3.5分别赢了90次到89次。

随后,加州大学伯克利分校、卡耐基梅隆大学、加州大学圣地亚哥分校的研究人员提出了一种新的模型——Vicuna(羊驼),它也是以骆马为基础制作的,训练成本仅为300美元。

在项目评估中,研究人员请GPT-4担任“考官”。结果显示,在超过90%的问题中,GPT-4更倾向于Vicuna的答案,Vicuna达到了ChatGPT总分的92%。

大模型遭泄两月后,Meta意外变赢家用GPT-4评估Vicuna和其他开源模型。

短短几周内,以羊驼为原型的“羊驼家族”不断壮大。

4月3日,伯克利人工智能研究所发布了基于LLaMa微调的新模型考拉(考拉)。培训费用不到100美金,相当于一半以上情况下的ChatGPT成绩。5月4日,来自卡耐基梅隆大学语言技术研究所、IBM研究院和马萨诸塞大学阿默斯特分校的研究人员推出了单峰驼(Dromedary),它起源于对齐语言模型。在不到300行人工注释的情况下,65B LLaMA基本语言模型可以在TruthfulQA上超过GPT-4。

在中国,也出现了垂直医疗领域的“羊驼家族”成员。基于LLaMa模型的指令微调,哈工大推出了中医智能问诊模型华佗,可以生成专业的医学知识答案。

大模型遭泄两月后,Meta意外变赢家哈工大推出中医智能问诊模式华佗(华佗)

基于该模型的开源创新,不仅是在大模型上,更是在应用层上。

3月31日,AI公司Age of AI推出了基于斯坦福大学羊驼开发的语言模型FreedomGPT。3月29日,加州大学伯克利分校发布了基于其庞大人工智能的巨像对话机器人。其能力包括知识问答、中英对话、内容创作、编程等。

从基础模型层到应用层,基于羊驼的“羊驼家族”还在一路奔跑中。

由于“开源”LLaMA来自Meta,发布文章的谷歌研究员认为,Meta意外地成为了这场AI竞赛的最大受益者——在开源社区的帮助下,Meta赢得了全球顶级开发者的免费劳动力,因为大多数开源AI创新都发生在他们的基础设施中,所以没有什么可以阻止Meta将这些成果直接集成到他们的产品中。

开源动力触发“人工智能的安卓时刻”

在ChatGPT引爆人工智能热潮后,英伟达首席执行官黄仁勋将这一浪潮称为“人工智能的iPhone时刻”。他认为,当iPhone诞生并颠覆手机行业时,AI行业已经进入了一个革命性的时代。当LLaMA打开开源社区的小宇宙时,网友们以为“AI的安卓时刻”来了。

回过头来看,Google用开源的思想让更多的开发者参与到Android应用生态的构建中,最终让Android成为电脑和手机系统/应用的主流。今天,LLaMA再次让AI行业看到了开源的力量。

智能软硬件开发公司Mobvoi的CEO李志飞也注意到了谷歌内部的声音:

“在大模型领域,谷歌在势头上已经远远落后于OpenAI。在开源生态中,如果Google再犹豫,即使以后想开源,也会远远落后于Meta的LLaMA。相反,如果开源,可以进一步降低OpenAI的壁垒,吸引(或留住)很多支持开源的高级人才。”

特斯拉前AI总监安德烈·卡帕西(Andrej Karpathy)认为:

“当前开源模型的生态趋势已经显示出寒武纪大爆发的早期迹象。”

的确,开发者对开源AI模型前所未有的热情正从Github的摘星指数中溢出:羊驼获得23.2k星,llama.cpp获得26.3k星,llama获得20.8k星...而且在“羊驼家族”之前,AutoGPT等开源项目在Github也有很高的人气,突破100k星。

大模型遭泄两月后,Meta意外变赢家开发者对开源AI模型的星级评定

此外,为了赶上ChatGPT,构建大型开源社区的AI初创公司Hugging Face最近推出了底层模型拥有300亿个参数的开源聊天机器人HuggingChat,并向外界开放了其训练数据集。Nvidia的AI科学家Jim Fan认为,如果应用程序开发得更晚,拥抱脸将比OpenAI更有优势。

开源的力量来了,手握OpenAI的微软也不准备孤注一掷。今年4月,微软推出开源模型DeepSpeed Chat,为用户提供“傻瓜式”操作,将训练速度提高了15倍。

以LLaMA为核心的AI开源社区正与OpenAI等大模型巨头并行空,在开源思想和实践中爆发的创新力量不容巨头小觑。

温馨提示:注:内容来源均采集于互联网,不要轻信任何,后果自负,本站不承担任何责任。若本站收录的信息无意侵犯了贵司版权,请给我们来信(j7hr0a@163.com),我们会及时处理和回复。

原文地址"da模型,模型大会":http://www.guoyinggangguan.com/qkl/142563.html

微信扫描二维码关注官方微信
▲长按图片识别二维码