作者:葛家明
也许每一次历史潮流的开启,总是那么熙熙攘攘。年初,ChatGPT引爆的AI大语言模型(LLM)迎来了一个重磅进入者——稳定性AI。
4月19日,推出热门AI画道Stable Diffusion开源模型的公司Stability AI宣布“加入战局,挑战ChatGPT”,推出开源大语言模型StableLM。
在Stability AI公布大语言模型的网页上,一只体现了Stability Diffusion XL绘画特点的绿鹦鹉出现在大语言模型介绍之前,而& # 8221;“稳定扩散”的时刻可能只是不期而至。
对于大语言模型,网站介绍:
目前StableLM的Alpha版本有30亿和70亿个参数。可以从GitHub等开源平台下载:
Stability AI未来会推出150亿到650亿参数的版本。
类似于稳定扩散,开发者可以在遵守协议的情况下,将这种模式用于商业或研究活动。
批评OpenAI不够“开放”的Stability AI能否稳定发挥,推出超越ChatGPT的大语言模型?
大语言模型的“安卓时刻”
Stability AI成立于2019年,是生殖人工智能领域最著名的公司之一。
在ChatGPT占据的大语言模型市场,很多人期待类似稳定扩散的开源模型尽快出现。
大型语言模型& # 8221;“稳定扩散”的时刻可能在十几个小时前就已经到来。
AI军备竞赛的开始可以追溯到去年7月。继Open AI的绘画模型DALL- E2之后,Stability AI发布的模型图像生成模型Stable Diffusion由于其开源代码,对公众开放使用(应用需要使用DALL-E2,通过率很低),在当时引起了更多的关注。
稳定性AI把StableLM的发布比作稳定扩散,让AI继续为大家服务:
2022年,Stability AI推动了Stability Diffusion的公开发布,这是一个革命性的图像模型,代表了透明、开放和可扩展的AI。这一次,我们发布了开源的StableLM模型,想继续让AI为所有人所用。我们的StableLM模型可以生成文本和代码,并将支持一系列下游应用。
正如Stability AI的首席执行官艾玛德·莫斯塔克所说,他们最新的LLM代表了Stability AI的最初“开源”:
现在每个人都可以在拥抱脸上测试和驾驶这个7B版本的聊天机器人。
艾玛德·莫斯塔克认为,LLM不应该在大公司培训,社区体系的开放性也很重要,需要更多的监管。巨头控制流量算法的游戏规则是对人的操纵。
艾玛德·莫斯塔克来源:稳定AI
因此,今年年初,Stability AI与拥抱脸等几家创业公司一起资助了研究中心Eleuther AI,StableLM基于Eleuther AI的开源模型构建:
StableLM基于我们与EleutherAI(一个非营利研究中心)一起开源的早期语言模型。这些语言模型包括GPT J,GPT NeoX,皮媞亚等等。这个大模型也是在Pile的开源数据集上训练出来的,这个数据集结合了PubMed、StackExchange和* * * *的文本样本,规模是Pile的三倍,包括1.5万亿个内容标签。
Stability AI表示,由于这一丰富的数据集,尽管参数规模无法与GPT-3相比,但StableLM在通信和编程方面表现出了“惊人的高性能”:
虽然StableLM的参数规模只有30亿到70亿(相比之下,GPT-3有1750亿个参数),但性能非常好。这里有一个例子:在这个例子中,StableLM返回到问题“你对高中毕业的朋友说什么?”以及“写邮件”的请求。
在这个例子中,要求模型写一个“计算生命意义的C语言程序”,但模型表示这个任务无法完成,而是写了一个计算生命长度的程序。
Mostaque在Twitter上表示,他相信StableLM及其训练数据会随着时间的推移变得更好,没有人知道这个模型可以优化到什么程度:
我知道现在还有很长的路要走,这只是开始。我觉得我们可以在未来3-6个月内让这个模型变得像稳定扩散一样有用,未来几年发展会很惊人。
OpenAI不够开放,稳定性AI足够稳定吗?
不久前,马斯克批评Open AI背离了开源和非盈利的初衷。这是Open AI一直面临的争议,也是Stability AI“暗戳”讽刺的要点。
虽然OpenAI不够开放,但GPT-4无疑是目前最好用的大语言模型。而足够开放的稳定性AI,其语言模型是否足够稳定?
要知道,目前StableLM的Alpha版本有30亿和70亿个参数,而GPT-3.5模型有2000亿个参数。
有网友表示,Stability AI在公告中并没有说明StableLM目前的局限性。
这个模型是否像其他模型一样倾向于捏造事实?经常答非所问吗?
有媒体分析,该模型基于桩训练,桩数据集中有大量不雅词语,对话过程可能会让用户不舒服。
有网友表示,他曾尝试在抱抱脸上测试这些模特,但每次都遇到“满载”的问题,无法在前端成功运行,这大概与模特的体型和人气有关。
“大语言模型是否应该开源”也成为最近争论的焦点。一些研究人员认为,StableLM等开源模型的发布很可能被用于不良目的,如发送钓鱼消息或协助恶意软件攻击。
不过,Stability AI认为,开源模型的出现可以帮助研究人员识别潜在的风险,并制定一些保护措施。
稳定AI的收入困境
更严重的问题是,稳定性AI可能面临营收困难。
最近有媒体报道称,稳定AI正在以惊人的速度烧钱,但没有明确的盈利方式。而且在竞争激烈的AI赛道上,也面临着多家初创企业和科技巨头的“围剿”。
Meta此前发布了开源大语言模型LLaMA,这让越来越多的公司期望基于开源模型定制自己的大模型,人工智能也迎来了“Android时刻”。
稳定AI现在正在寻找新的高管,希望他能在恶劣的条件下为公司带来收入,解决目前“疯狂烧钱,营收不佳”的尴尬局面。
去年年底,Stability AI宣布融资1.01亿美元,并称Stability Diffusion已经成为最可用的开源模式。
根据福布斯的数据,大约有1000万人使用稳定扩散——每天——超过OpenAI的DALL-E 2。同时,稳定性AI还提供了面向消费者的产品——梦想工作室,目前拥有100万注册用户。
然而,训练模型所需的计算资源和成本迫使Stability AI探索新的商业模式。Mostaque曾在Twitter上回复一位用户说:
“事实上,我们的型号使用了256块A100显卡,总计15万小时,所以按照市场价格是60万美元。”
稳定性人工智能去年筹集的1亿美元已经“烧掉”了一半以上。
另一个不容忽视的事实是,其竞争对手Midjourney已经成为互联网上事实上的图像生成模式的领导者,甚至在一定程度上击败了OpenAI的DALL-E。
目前有消息称,Stability AI正在寻求新一轮融资,希望将公司估值提升至40亿美元。Stability AI能否扭转局面,筹集到足够的资金维持局面,还有待观察。
温馨提示:注:内容来源均采集于互联网,不要轻信任何,后果自负,本站不承担任何责任。若本站收录的信息无意侵犯了贵司版权,请给我们来信(j7hr0a@163.com),我们会及时处理和回复。
原文地址"ai语言是什么,ai语言专家":http://www.guoyinggangguan.com/qkl/156097.html。

微信扫描二维码关注官方微信
▲长按图片识别二维码