您好,欢迎您来到国盈网!
官网首页 小额贷款 购房贷款 抵押贷款 银行贷款 贷款平台 贷款知识 区块链

国盈网 > 区块链 > 马斯克叫停,马斯克建议

马斯克叫停,马斯克建议

区块链 岑岑 本站原创

马斯克要告微软,拒绝AI训练“白嫖”数据“诉讼时间到了。”4月20日,Twitter被微软踢出其数字营销平台后,新掌门人马斯克立即回复称,微软利用Twitter数据进行“非法培训”。这种困境直接揭示了AI模型开发者与数据源之间的利益之争。

此前,在线社区论坛Reddit和程序员社区Stack Overflow宣布,将向使用平台API训练数据的公司收费。环球音乐集团直接声明,将阻止人工智能从其拥有版权的歌曲中捕捉歌手的声音。

在此之前,AI大模型开发者都是用互联网上发布的低成本内容数据来训练自己的大模型。现在,各科技巨头加持的大模式开始陆续商业化,互联网内容平台突然反应过来,不能让这些巨头薅羊毛“白嫖”数据。

当Twitter把API收费门槛放到微软面前的时候,AI大模型训练的成本不仅仅是芯片计算能力和开发算法的人才,还有“为数据买单”。

马斯克指责微软“非法培训”

“他们非法使用Twitter数据进行训练。现在是诉讼的时候了。”4月20日,“宇宙顶流”马斯克在推特上明确告诉微软。他亲自卸任Twitter的CEO,是为了借鉴微软将Twitter踢出微软数字营销中心的做法。

这个“中心”是做什么的?它实际上是微软利用大数据和AI技术开发的广告和营销管理平台,聚合了包括Twitter、脸书、Ins等在内的所有主流海外社交平台,从而方便企业主在一个平台上完成广告和营销活动的推送,同时还可以管理各种账号,分析推送数据。刷微博、微信朋友圈弹出的广告,有微软这样的工具的贡献。

微软这个数字营销中心可以实现这些功能。很重要的一部分就是接入这些社交平台的API,这是企业主推送广告和分析数据的基础。

结果马斯克买下Twitter后,直接把Twitter API的企业包初始订阅费定为4.2万美元/月,折合人民币28.9万元。以这个价格,他可以获得2500万条推文,其中一条差不多1元多。如果你每月支付12.5万美元,你可以获得1亿条推文,你会根据使用情况增加这笔钱。

Twitter API新的收费标准直接让很多小公司望而却步。连财大气粗的微软数字营销中心都直言“要价太高”,于是Twitter直接被踢出了管理库。这意味着,以微软为平台实施广告和营销计划的广告主,不能把它们放在Twitter上。

本来这是企业主、分销平台、渠道商之间的广告业务。马斯克跳出来指出,微软利用Twitter数据从事非法培训。

马斯克要告微软,拒绝AI训练“白嫖”数据 Musk用Twitter数据称微软“非法培训”。

大家都知道,爆款ChatGPT背后有微软的资本加持。然而,马斯克和GPT模式的开发者OpenAI不仅渊源深厚,而且积怨已久。

2015年,马斯克和萨姆·奥特曼(Sam Altman)共同创立了OpenAI人工智能实验室,致力于建立一个开源的非营利组织来开发人工智能,以对抗当时在人工智能领域占据主导地位的谷歌。为此,马斯克捐赠了1亿美元,并承诺未来将继续捐赠9亿美元。结果不到两年,马斯克就退出了OpenAI的董事会。既有烧钱大模式短时间内没有出成果的问题,也有马斯克和奥特曼对OpenAI管理的争执。

马斯克退出一年后,也就是2019年3月,OpenAI成立了子公司OpenLP,定位为“有限盈利组织”。重组后,OpenAI很快获得了微软10亿美元的投资。谁也没想到,又过了三年,OpenAI站在了全球科技舞台的最前沿。

ChatGPT爆炸后,曾为OpenAI买单并站在台上的马斯克频频表示反感。

2月17日,马斯克在推特上表示,OpenAI已经从开源、非盈利变成了微软控制的公司,是一家“封闭源代码、追求利益最大化”的公司。后来他多次在公开场合强调人工智能对人类社会的潜在危害,甚至认为“风险大于飞机、汽车、毒品”;3月29日,这封署名为科技大亨“暂停AI巨人实验”的信,他也首次署名表态。

马斯克为人工智能的健康发展伤透了心。看来现实版的“钢铁侠”把巨型载人飞船送上了Tai 空似乎无意追随人工智能的潮流。

不过,4月17日,马斯克在接受媒体采访时透露,将推出一款生成式AI模型TruthGPT。很快就有媒体爆料称,马斯克买了一万块英伟达A100芯片。这是AI模型训练的重要硬件。

撕毁微软的非法训练数据,让OpenAI变成了一家逐利公司。无论马斯克如何批评这两家公司,都难掩他对人工智能的兴趣。左手阻止了Twitter数据的低价流出,右手高价砸碎了芯片。在AI模型赛道上,马斯克开始冲刺。

多平台API计划收取AI培训费用被推高。

然而,Twitter并不是最近唯一一个向AI模型开发者收取API费用的平台。

4月18日,海外最大的社区论坛Reddit宣布,将向使用其API进行数据训练的公司收取数据使用费。Reddit还没有公布具体的收费标准。业内猜测,Reddit很可能按照数据量收费,这也是业内通行的做法。此外,程序员问答网站Stack Overflow也计划向AI巨头收取训练数据费用。

马斯克要告微软,拒绝AI训练“白嫖”数据Reddit更新数据API条款阻止大公司薅羊毛

要知道,算法、算力、算数据这“三算”是AI大模型发展不可或缺的。以OpenAI training GPT-3.5为例,该模型包含多达45TB的文本语料库,不仅包括书刊等出版物的内容,还包括社交平台、问答网站、论坛群等线上数据中的用户生成内容。从OpenAI的* * *信息来看,该公司并未提及是否为在线数据付费。用“爬虫”爬行、与第三方合作、购买都是OpenAI获取数据的可能方式。

此前,所有的生成式大模型似乎都是毫无限制地使用互联网上的公开内容,影响大模型性能的因素集中在算法和计算能力的差异上。在对Twitter、Reddit等平台的API收费后,大模型开发者免费使用数据的好日子到头了。

2019年之前,OpenAI是一个非营利组织。如今ChatGPT已经有了付费版的Plus,更何况公司还开通了API付费通道。目前,OpenAI的估值接近300亿美元,研究机构PitchBook预测,该公司今年的营收将达到2亿美元,明年将增长5倍。

社交平台对API收费有明确规定,剑指大模型开发者。双方也正式成为了“商家对商家”的关系,收费和付费都很正常。这也意味着,在AI大模型成为科技巨头的赛车场后,像Reddit这样的海量内容平台将增加商业来源,数据将成为重要因素。

以2008年成立的Reddit为例。它是全球互联网中最具活力的社区之一。目前,其日活达到3.3亿,大量用户创建了超过14万个活跃社区,总发帖量超过3.6亿。尤其是在很多少数民族地区,Reddit论坛贡献了很多有价值的讨论。换句话说,Reddit提供了英语互联网中最重要的语料库。

OpenAI首席执行官山姆·奥特曼(Sam Altman)也表示,该公司正在积极与内容公司合作,并愿意“为高质量的数据支付高价”。

虽然奥特曼声称“目前没有在训练GPT-5”,但OpenAI不应该停止数据训练的步伐,因为GPT-4还有很多需要打磨的地方,比如一般知识的准确性,对人类语言的理解和进化等这些还是需要语料库数据的持续输入。

放眼全球,研究AI大模型的公司不止一家,海外有谷歌,国内有百度、华为、阿里。可以预见,切入大模型赛道的公司将面临数据主的收费口,培训成本上升。

另一个值得深思的问题是,无论是Twitter还是Reddit,他们都向手里有数据的大模型开发公司收取昂贵的费用。那么,为这些平台贡献了大量内容和数据的用户得到了什么呢?

温馨提示:注:内容来源均采集于互联网,不要轻信任何,后果自负,本站不承担任何责任。若本站收录的信息无意侵犯了贵司版权,请给我们来信(j7hr0a@163.com),我们会及时处理和回复。

原文地址"马斯克叫停,马斯克建议":http://www.guoyinggangguan.com/qkl/154750.html

微信扫描二维码关注官方微信
▲长按图片识别二维码