随着OpenAI推出具有视觉功能的模型GPT-4V和适合其ChatGPT系统的多模态对话模式,生成式人工智能(AI)领域持续升温。
随着9月25日宣布的新升级,ChatGPT用户将能够与聊天机器人交谈。支持ChatGPT、GPT-3.5和GPT-4的型号现在可以理解简单语言的口头查询,并以五种不同声音之一做出响应。
根据OpenAI的博文,这种新的多模态界面将允许用户以一种新颖的方式与ChatGPT进行交互:在旅行时拍摄一张地标的照片,并实时讨论其有趣的点。回到家,拍下冰箱和餐具室的照片,就能知道晚饭吃什么了(还可以问后续问题,一步一步的食谱)。晚饭后,通过拍照、圈出问题集并让它与你俩分享技巧来帮助你的孩子解决数学问题。
ChatGPT的升级版本将在未来两周内在移动平台上向Plus和企业用户推出,后续将“很快”向开发者和其他用户提供访问。
ChatGPT的多模式升级是在OpenAI最先进的图像生成系统DALL-E 3推出之后进行的。
OpenAI称,DALL-E 3还集成了自然语言处理。这允许用户与模型对话以微调结果,并集成ChatGPT以帮助创建图像提示。
在其他人工智能新闻中,OpenAI的竞争对手Anthropic于9月25日宣布与亚马逊建立合作关系。据Cointelegraph报道,亚马逊将投资高达40亿美元,包括云服务和硬件接入。作为回报,Anthropic表示,将为亚马逊的基岩基础人工智能模型提供增强的支持,并为企业提供安全的模型定制和微调。
温馨提示:注:内容来源均采集于互联网,不要轻信任何,后果自负,本站不承担任何责任。若本站收录的信息无意侵犯了贵司版权,请给我们来信(j7hr0a@163.com),我们会及时处理和回复。
原文地址"ChatGPT现在可以说话、听和看图像":http://www.guoyinggangguan.com/qkl/137682.html。

微信扫描二维码关注官方微信
▲长按图片识别二维码