20开云体育- 开云体育官方网站- APP 最新202525AI行业发生了什么?
2026-01-12开云体育官方,开云体育app,开云app下载,开云棋牌,开云直播,开云体育靠谱吗,开云体育和亚博,开云体育老板是谁,开云官网,开云体育,开云直播英超,开云电竞,开云游戏,开云,开云体育官网,开云体育官方网站, 开云app, kaiyun sports, 开云体育简介, 开云体育官方平台, 世界杯开云, 开云体育app下载, 开云体育网址, 开云体育2025
虽然从2024年开始,AI开发者们就开始大力发展模型的多模态能力,但在相当长一段时间里,这些努力仍然主要集中在对既有模型进行组合——文本一个系统,图像一个系统,语音再来一个系统,然后用工程手段把它们拼在一起。这样的模型可以完成一些多模态任务,但由于各系统之间存在协调问题,其能力局限性一直十分明显。到了2025年,越来越多的开发者不再满足于这种“拼装式”方案,转而开始设计“原生多模态”模型,从训练之初起,就让模型在同一个体系里同时处理文本、图像、音频、视频等信息。
在设计原生多模态模型的过程中,很多人逐渐意识到:多模态模型的真正瓶颈,并不在于它能不能看图、听声音,而在于能否把视觉、语言、时间与空间组织成一个可推理、可行动的统一表征。现在的大模型在语言上已经高度成熟,却依然缺乏对三维空间、物理约束和因果关系的系统理解。因此,下一代AI的突破重点,可能并不在于再多几个参数,而在于能否构建对真实世界的内部模型,使其可以在脑中“预演”行动后果。在这种思路之下,“世界模型”与“空间智能”重新被重视,并逐渐成为设计原生多模态模型的重要理论依据。
多模态模型的蓬勃发展,为AI技术的应用化和普及化提供了强大的助力。麦肯锡在《技术趋势展望2025》中指出,多模态AI正在成为新一代AI系统的关键底座,并将与智能体(Agent)、自动化、物理系统控制深度融合,其影响将从数字世界延伸至现实世界。而国际权威IT研究与咨询机构 Gartner(高德纳)则强调,多模态技术的影响将超出AI范畴,全面重塑当前的软件生态。据其预测,到2030年,80%的企业软件将在其产品中植入多模态AI能力。
如果说多模融合解决了AI“怎么看”和“怎么理解”的问题,那么具身智能(EmbodiedAI)要回答的,则是AI在真实世界中“做什么”和“怎么做”。虽然具身智能的发展已有数十年时间,但过去,机器人更多停留在实验室展示阶段:完成一些酷炫动作,在受限场景中做局部自动化,人们讨论的也只是它们“技术上究竟能做到什么”。而到了2025年,情况开始发生变化——具身机器人真正走向市场,行业叙事也从“能不能做到”转向“能不能规模化、能不能稳定工作、能不能进入岗位”。
具身智能在2025年的“爆发”,是多种因素共同作用的结果。一方面,原生多模态AI的发展,补上了机器人“看不懂世界”的短板,让它不仅会跑会跳,还能理解环境、根据情境做出决策,从而具备真正的实用价值;另一方面,用工成本的持续抬升,也在扩大市场需求。制造、物流、巡检、服务等领域本就劳动力密集,在老龄化、年轻人不愿进入高强度岗位、合规与安全成本增加等因素叠加下,企业开始转而接受机器人替代,由此带动了需求的快速增长。
比如,“图灵奖”得主杨立昆多次指出,单纯扩大自回归大模型,并不会自然通向通用智能。当前以语言预测为核心的模型,本质上仍是“被动系统”,缺乏因果理解、物理常识与长期规划能力;继续堆参数与数据,只会带来收益递减,反而掩盖结构性短板。类似的观点,也被其他研究者认同。安德烈·卡帕斯强调,未来突破更可能来自训练范式、数据结构与推理机制,而不是参数规模本身;原OpenAI首席科学家伊利亚·苏茨克维同样提醒,“无限堆规模”可能正在接近阶段性极限。
2025年3月,初创公司Monica公布了一段名为Manus的AI应用演示视频。视频中,它可以根据用户要求,自动调用外部工具,完成简历筛选、房产研究、股票分析等复杂任务,全程无需人工干预。Manus一度迅速走红,被视为继DeepSeek之后的又一“现象级”产品;虽然随后因“技术创新不足”“炒作过度”而引发争议,但它仍被看作AI智能体崛起的重要象征。更有意味的是,Meta随后以数十亿规模收购了Manus,从侧面印证了这一趋势。


