当前位置：

财经观察：提升人机交互效率多模态大模型易用性进一步推进

时间:2024-05-19 07:26:52 出处:休闲阅读（143）

人民网北京5月14日电（焦磊、财经实习生张泊洋）陪人聊天、观察帮助分析工作中的提升态邢台市某某化工销售部问题并给出解决方案，甚至和人建立起情感羁绊……在科幻电影《Her》中，人机聊天机器人“Samantha”用充满智慧和幽默的交互进回答展示出高度的智能性和适应性。当下，效率性进这些来自过去的多模科幻想象正加速照入现实中。

北京时间5月14日凌晨，模型美国科技公司OpenAI在春季发布会上发布了最新GPT-4o多模态大模型。易用据OpenAI公司首席技术官米拉·穆拉蒂（Mira Murati）介绍，步推GPT-4o可以接收文本、财经邢台市某某化工销售部音频和图像的观察任意组合作为输入，并实时生成文本、提升态音频和图像的人机任意组合进行输出，其中“o”代表“omni全能”。交互进

一直以来，多模态人机交互便是AI领域重点研究发力方向之一。继文生视频大模型Sora之后，GPT-4o的发布迎合了业内对多模态大模型的更多期待。

模态即每一种信息的来源或形式。人们在信息获取、环境感知、知识学习与表达等方面都是采用多模态的输入、输出方式。业内分析认为，相比单模态，多模态大模型同时处理文本、图片、音频以及视频等多类信息，与现实世界融合度高，更符合人类接收、处理和表达信息的方式，与人类交互方式更加灵活，表现得更加智能，能够执行更大范围的任务。

作为面向未来人机交互范式的全新大模型，GPT-4o具有文本、语音、图像三种模态的理解力，并可以综合对话者语气和所处环境空间等因素进行回答，展现出了高度智能性。

发布会上，GPT-4o展示了多项多模态交互能力。在进行实时语音交流时，其响应极快，并且可以识别用户的语音情绪，语音有情感，还能用不同语言和多人同时交互。在语音的同时可以与视频实时交互，演示了一边聊天一边解答手写数学问题，以及实时交流阅读代码，指导编程、视频聊天等能力。

米拉·穆拉蒂表示，“这是我们第一次在易用性方面真正向前迈出了一大步。”

此前，大模型在各个领域的应用主要集中在文生文、文生图之上，今年初Sora的发布则推动文生视频领域进一步发展。业内分析表示，此次GPT-4o的发布，将促使多模态综合交互成为生成式AI的重点发展方向，进而提升人机交互效率，逐渐向AGI方向迈进。

国盛证券研报分析，GPT-4o是迈向更自然的人机交互的重大进步，新功能带来了崭新的多模态交互能力，通过新的端到端模型实现了体验上的新突破，有望在各类终端实现用户体验的最大化。

多模态大模型包含的图文、音频、视频内容数据量巨大，进而引发人们对算力供应的关注。业内分析认为，未来AI的发展对算力的需求将会是几何式增长，算力限制可能是影响生成式AI应用开放使用的重要因素，而算力的可获取性以及成本将是挑战之一。此外，多模态大模型还将带来更严峻的安全挑战。

米拉·穆拉蒂表示，在安全性问题上，GPT-4o通过过滤训练数据和通过训练后细化模型行为等技术，在跨模态设计中内置了安全性。OpenAI还创建了新的安全系统，为语音输出提供防护。

据介绍，用户可有数量限制地免费使用GPT-4o模型来进行数据分析、图像分析、互联网搜索、访问应用商店等操作。

OpenAI CEO山姆·奥特曼在发布会后表示，“我们将创造人工智能，然后其他人将使用它来创造各种令人惊奇的事物，我们所有人都会从中受益。”此外，他还表示OpenAI其他业务收入将帮助公司向数十亿人提供免费的人工智能服务。

分享到：

上一篇： 踏春游玩，当心这个病！一家四口均确诊

下一篇： 纯手工为战机造“瞳孔”，她是“全国唯一”！

温馨提示：以上内容和图片整理于网络，仅供参考，希望对您有帮助！如有侵权行为请联系删除！

猜你喜欢

奶豆添营养，少油更健康

培养优秀后备人才，上海市体育运动学校开启2024年招生

上百名清华校友校外聚餐食物中毒？海淀疾控通报

教育博主“砸玩具”式粗暴家访引争议，嘉峪关市：将介入调查

减肥成功者都在做这6件事看你做对了么

五一观澜｜人气背后是活力，火爆“五一”展现经济景气

数读中国与塞尔维亚合作成就

梅大高速上货车一横，他为过往车辆的安全赌上了全部身家

野生动物园20只东北虎死亡安徽阜阳颍东林业局：多部门正联合调查

热门排行

16月1日国产大飞机C919首次境外商业飞行

2数读中国与塞尔维亚合作成就

3媒体：小孩打碎博物馆近12万瓷瓶，该不该免赔？

42024级蔡崇信篮球奖学金获得者揭晓，6名小球员将赴美留学

5为何沿海地区居民也要补碘？

6王石放弃万科千万元退休金

7数读中国与塞尔维亚合作成就

8以色列防长与美防长通话称将在拉法展开军事行动

看了又看

iPhone SE4渲染图类似iPhone 14没有灵动岛

女子称住山西襄汾一如家酒店裸睡被人强行刷开房门，酒店回应

2024级蔡崇信篮球奖学金获得者揭晓，6名小球员将赴美留学

“叫花鸡没有鸡”涉事商户道歉，赔偿消费者1000元

白云机场二号航站楼短时停电，机场方：部分区域照明断电，运行未受影响

夹在两栋房之间、入户通道不足半米，温州一学区房卖了238万

市值不足200万美元、FF处退市边缘贾跃亭开启个人IP商业化试图“自救”

奥运资格赛精彩呈现，城市体育节打造潮流体育“四大展玩圈”

沪指跌0.21%，创指跌0.95%：海运逆市走强

最新标签

热点

综合

探索

休闲

焦点

时尚

娱乐

知识

热门资讯

衡水市某某照明售后客服中心

财经观察：提升人机交互效率多模态大模型易用性进一步推进

猜你喜欢

热门排行

看了又看

最新标签

友情链接：

衡水市某某照明售后客服中心

财经观察：提升人机交互效率 多模态大模型易用性进一步推进

猜你喜欢

热门排行

看了又看

最新标签

友情链接：

财经观察：提升人机交互效率多模态大模型易用性进一步推进