近日,清华大学具身智能与机器人研究院院长、自动化系系主任张涛教授,在“人文清华”讲坛发表题为《具身智能:智赋万物》的演讲,指出,具身智能将让机器人深度进入人类生活的物理空间——这不仅是技术的跃迁,更意味着人机关系将走向“共处共融”。中国在具身智能领域走在世界前列,国家已经把具身智能定为六大产业之一。张涛认为,交叉研究是具身智能与机器人领域创新的基础,产学研用是发展的动力,而与人文相融合则是持续发展的灵魂。

具身智能=强健本体+智慧大脑
1950年图灵首次提出具身智能,是指能够与环境交互感知,具备自主规划、决策、行动、执行能力的机器人或虚拟环境中的仿真人。与主要处理文字、图像和数据的人工智能方向不同,具身智能强调智能体必须依托机器人、智能终端等物理载体,在真实场景中与人、物体和空间发生交互,并通过实际行动完成任务。2026年《政府工作报告》提出“深化拓展'人工智能+'”“推动重点行业领域人工智能商业化规模化应用”,具身智能正是连接智能体、新一代智能终端与实体经济场景的重要技术形态。
具身智能机器人的核心特征可概括为通用性、交互性和自主性,实现机器人在动态任务和动态环境中的主动感知、深度推理、自主规划和灵活执行。其技术架构可分解为两大支柱,即“强健本体”和“智慧大脑”。
张涛教授用“骨骼、肌肉、手脚、心脏”四个维度形象地概括了强健本体的构成——轻量化本体框架构成“骨骼”,高功率密度执行单元构成“肌肉”,灵巧手与高性能腿足构成“手脚”,高能量密度电池与能量管理系统构成“心脏”。人形机器人本体需要同时满足灵活性、稳定性、可靠性和安全性。
智慧大脑包括四个层面:芯片提供计算核心;多模态感知系统是机器人感知环境的主要手段;运动规划与鲁棒控制是提升机器人智能性的前提;人机交互与共融则让机器人“更懂人”。近年来,操作系统高实时、高可靠、高智能,使机器人能够将大规模视觉语言知识迁移到真实操作任务中。
智赋万物
具身智能的突出价值是把人工智能从数字空间延伸到真实物理空间,推动人工智能与实体经济深度融合,能够让机器人直接参与生产、服务、巡检、搬运、护理和应急处置,把智能能力转化为现实世界中的劳动能力和服务能力。
张涛教授指出,具身智能系统融合人工智能、机器人、高端制造、智能传感器、边缘计算、工业数据和安全控制,是培育新质生产力的重要方向。目前具身智能迭代迅速,以机器人世界杯为例,2024年参赛机器人还需要有人在场辅助,而2025年已经可以独立比赛,清华火神队机器人于2025年夺得人形组冠军。在智能经济新形态的发展要求下,具身智能的意义不只是增加一种自动化设备,而是把感知、理解、决策和执行能力嵌入实体经济流程,推动制造、医疗、康养、物流和高风险作业等场景向智能化、柔性化和自主化升级。例如,在工业制造场景中,具身智能赋能生产线实现柔性化和自主化;在育儿养老场景中,机器人可以承担照护和陪伴任务;在教育娱乐领域,具身智能正在打开全新的应用空间。
张涛教授作为院长负责的清华大学具身智能与机器人研究院,由自动化系、机械系、电子系、计算机系共同建设,是清华大学主动服务国家战略需求、充分发挥多学科与人才优势、有组织开展前瞻性科技攻关的重要举措。目前重点突破“强健本体+智慧大脑”全栈技术,构建从技术研发到场景应用的转化链条。研究布局覆盖多个前沿方向:具身智能大脑与交互系统,机器人感知理解与控制决策,机器人软硬件及本体协同设计,机器人系统数据与测试。
他指出,交叉研究是具身智能与机器人领域创新的基础,产学研用是发展的动力,而与人文相融合则是其持续发展的灵魂。
具身智能对人类社会的挑战

张涛教授特别指出,安全测试是具身智能进入实体产业的前提,应覆盖运动稳定性、碰撞安全、紧急制动、感知失效、误指令处理和网络安全等内容。只有数据、仿真、测试和标准体系协同完善,具身智能才能实现可信落地和规模化应用。治理不能等技术成熟再开始,必须在技术早期就介入。
他特别提醒,具身智能的普及将深刻改变社会生产生活,人机关系将从工具使用逐步转向协同分工。人类将更多承担目标设定、过程监督、异常判断和创造性工作,机器人则承担重复、高强度、高风险和高精度任务。人机协作使人和机器人之间发生很多关联关系,包括法律关系、经济关系、伦理关系等。
面对这些挑战,他强调,具身智能发展必须始终遵循三条基本原则:第一,具身智能要成为人类社会不断发展的动力;第二,让机器人更好地服务人类;第三,不能让机器人颠覆人类社会。
中国正走在具身智能前沿。但比技术领先更重要的,是率先建立起与新技术相匹配的人文框架与治理智慧。唯有融合技术、规则与人文关怀,才能确保具身智能真正造福人类社会。
2345浏览器
火狐浏览器
谷歌浏览器