ChatGPT的爆发引爆了AI行业,全球科技巨头纷纷涌入这一领域展开混战。上周五,Meta还宣布推出大型语言模型LLaMA,加入由微软和谷歌等科技巨头主导的AI“军备竞赛”。
当地时间2月24日,Meta宣布将面向研究社区推出“Meta人工智能大语言模型Meta AI”系统,简称“LLaMA”。
与ChatGPT和New Bing不同,LLaMA不是一个任何人都可以与之对话的产品,也没有连接到任何元应用。更具体地说,该产品将是一个开源的“研究工具”。
该公司首席执行官扎克伯格在社交媒体上表示,LLaMA旨在帮助研究人员推进他们的研究工作,LLM(大型语言模型)在文本生成、问题回答、书面材料总结、数学定理自动证明和蛋白质结构预测等更复杂的方面也有很大的发展前景。
开源“研究工具”
Meta表示,可以在非商业许可下向政府、社区和学术界的研究人员和实体工作者提供LLaMA,正在接受研究人员的申请。
此外,LLaMA将提供底层代码供用户使用,因此用户可以自己调整模型,并将其用于研究相关的用例。相比之下,谷歌的DeepMind和OpenAI并不公开训练代码。
该公司还表示,LLaMA作为一款基本款,其设计目的是多功能的,可以应用于许多不同的用例,而不是针对特定任务设计的微调款。
性能优于GPT3.5
Meta官网显示,LLaMA包括四款基本款,参数分别为70亿、130亿、330亿、650亿。其中,美洲驼65B和美洲驼33B已经进行了1.4万亿代币的训练,最小的模型美洲驼7B也进行了1万亿代币的训练。
Meta表示,在大多数基准测试中,参数小得多的LLaMA-13B比GPT3.5的前身GPT3-175B具有更好的性能,LLaMA-65B可以与业界最好的Chinchilla-70B和PaLM-540B竞争。值得一提的是最近火的ChatGPT是支持GPT3.5的。
Meta还提到,LLaMA-13B具有“低得多的计算能力要求”,可以在单个数据中心级GPU(英伟达特斯拉V100)上运行。
扎克伯格写道:
“Meta致力于这种开放的研究模型,我们将向人工智能研究社区提供我们的新模型。”
值得一提的是,去年5月,Meta还推出了大型语言模型OPT-175B。该项目也面向研究人员,这是其聊天机器人blenterbot新迭代的基础。后来,该公司还推出了一款名为“Galactica”的机型,但由于它经常分享有偏见和不准确的信息,因此被下架。
据媒体报道,扎克伯格已经将人工智能作为公司内部的重中之重,他本人也经常在财务电话会议和采访中谈论其在改善Meta产品方面的重要性。据媒体分析,虽然现在在Meta产品中不使用LLaMA,但未来不排除其使用的可能性。
本文不构成个人投资建议,不代表平台观点,市场有风险,投资需谨慎,请独立判断和决策。
温馨提示:注:内容来源均采集于互联网,不要轻信任何,后果自负,本站不承担任何责任。若本站收录的信息无意侵犯了贵司版权,请给我们来信(j7hr0a@163.com),我们会及时处理和回复。
原文地址"Meta推出先进大型语言模型 下一个ChatGPT不远了?":http://www.guoyinggangguan.com/qkl/177399.html。

微信扫描二维码关注官方微信
▲长按图片识别二维码