自动驾驶 · 人形机器人 · 轮足系统

强化学习多模态

强化学习与具身智能

项目经历

🚗 基于强化学习的自动驾驶决策框架

关键词： PPO · CARLA · 多智能体 · 分布式训练

本项目基于高保真仿真环境，构建面向复杂交通场景的自动驾驶强化学习框架。

基于 CARLA 搭建城市级自动驾驶仿真环境
构建融合视觉、车辆状态与路径信息的多模态观测空间
采用 PPO（Proximal Policy Optimization）进行策略学习
引入多车辆对抗学习机制，提升策略在动态环境中的鲁棒性
基于 Ray RLlib 实现分布式采样与训练，加速模型收敛

项目亮点

通过并行化采样显著提升训练效率
在复杂多车交互场景下提升策略稳定性与泛化能力
设计融合动力学约束的奖励函数，提高控制可行性

🤖 融合触觉反馈的人形机器人步态优化

关键词： 强化学习 · 触觉感知 · 步态优化 · Sim-to-Real

本项目面向人形机器人动态行走问题，探索融合物理接触信息的强化学习方法。

构建基于足底压力分布（电子皮肤）的触觉反馈建模方法
将接触稳定性与力分布引入奖励函数设计
建立“物理接触—反馈建模—策略优化”的学习闭环
探索引入物理约束信息以缩小仿真与现实之间的差距

项目亮点

利用触觉信息显著提升步态稳定性
强化学习过程显式引入物理接触约束
为具身智能中的 sim-to-real 问题提供思路

🦿 轮足机器人控制与动力学建模（课程设计）

关键词： 轮足混合运动 · 动力学建模 · 控制系统

本课程设计围绕轮足机器人系统，开展动力学建模与控制方法研究。

建立轮足机器人动力学模型，分析耦合运动特性
设计稳定运动控制策略，实现多模态运动切换
实现轨迹跟踪与姿态稳定控制
分析不同运动工况下系统响应特性

项目亮点

加深对混合运动机器人系统的理解
将动力学建模与控制方法相结合
强化对物理约束与控制策略关系的认识

💡 研究方向

目前我的研究主要聚焦于：

强化学习在控制优化中的应用
融合物理约束的学习方法（Physically-Grounded Learning）
具身智能系统中的 sim-to-real 问题
多智能体交互与自适应优化机制

我希望构建能够实现感知—决策—控制闭环的智能系统，使其在复杂真实环境中具备稳定性与泛化能力。