2025年10月22日,课题组在嘉定校区通达管展开学术交流会议,会议的主题是课题组内2024级研究生学位论文开题预答辩。本次会议由方启哲、徐雅娇、罗文泽、赵欣然同学进行分享和汇报,方启哲同学主持,徐宁同学记录。
首先,方启哲同学以“城市快速路合流区连续换道行为交互与风险研究”为题展开阐述,首先从城市快速路承压与事故严峻性入手,指出在高速、封闭的快速路环境下,合流区的连续换道因多车博弈和高动态性成为诱发交通冲突与事故的重要因素,NHTSA统计约17%的严重事故源于换道冲突,凸显面向连续换道的机理化研究与风控策略的现实必要性与紧迫性。在研究目标与意义上,他计划从真实或仿真轨迹中系统提取合流区的换道事件,辨析连续换道与单次换道在时空特征上的差异,并以“语义划分—交互模式识别—风险判别—轨迹预测—预警策略”的链条贯通研究,期望在揭示复杂换道的时空规律与风险机理的同时,为降低事故率与提升通行效率提供方法支撑。在现状综述与理论动机方面,他指出换道决策实为车辆间动态影响与反馈的闭环过程,单向影响或纯传感器驱动的实时方法难以解释交互机制,因而提出将驾驶活动分解为可复用的运动“字母表”,以语义片段刻画驾驶者意图与阶段,从而提升可解释性与泛化能力。围绕风险与预测,他比较了运动学、机器学习与深度学习在多样场景与长期预测中的优劣,明确采用安全距离与安全替代指标两类判别思路,尤其强调具有直观可解释性的碰撞时间(TTC)作为核心指标,并指出仅以距离阈值忽略相对速度并不全面,需综合考虑多维要素。据此,他提出的研究内容与方法包括:基于轨迹数据识别换道车辆及其开始—结束时刻并匹配关联车辆;开展连续换道的持续时间、车头间距与行驶距离等特性分析;构建机器学习/深度学习的语义划分模型输出阶段片段并进行聚类以获得交互模式;在模式层面评估风险异质性并面向多车构建轨迹预测与预警策略,形成从数据到模型再到应用落地的技术闭环。在创新性方面,他强调首次将“语义分割建模”系统引入合流区连续换道场景,将换道过程细分为意图生成、准备、执行与完成等阶段,结合时序与空间语义特征识别多车交互模式,并把识别到的异质交互模式作为先验嵌入风险评估与预警策略设计,以实现“可解释识别—风险感知—主动预警”的贯通创新。最后,他给出分阶段计划:自2025年9月起完成目标与路线梳理、样本提取与关联匹配、语义划分建模与模型筛选、语义聚类确定交互模式、联动风险评估与多车轨迹预测以形成预警策略,并于2027年初完成论文定稿与答辩准备,保证研究的节奏与产出里程碑可衡量、可落地。
本次组会分享中,徐雅娇同学围绕“基于模型化强化学习的自动驾驶汇入场景决策研究”展开系统阐述。她首先从国家战略、现实需求与技术演进三方面说明课题意义:自动驾驶已成为“交通强国”的关键支撑,复杂汇入区域因多车交互与高动态性成为事故高发与通行瓶颈,而决策方法正由规则驱动迈向“数据驱动+模型驱动”的融合范式,因此有必要探索更高效、更安全且可解释的汇入决策新路径。在国内外研究进展方面,她指出传统规则与优化方法在复杂交互中的通用性与样本效率不足,无模型强化学习虽具鲁棒性但训练稳定性与计算成本仍受限,提示基于模型的强化学习(MBRL)有望以更高样本效率与对长尾场景的适应性突破瓶颈。基于此,课题确立的总体目标是围绕复杂汇入场景的决策效率与泛化能力,构建轻量化仿真基准、优化世界模型架构,并在多种汇入场景中系统评估其性能,以期实现更高效与更安全的自动驾驶汇入决策。技术路线方面,她计划在MetaDrive平台搭建典型汇入场景,建立标准化评估接口并实现基线模型(如IDM+MOBIL与PPO);随后引入注意力机制优化世界模型的序列建模,基于Dreamer框架在潜空间进行Actor–Critic策略学习,通过“想象”训练提升样本效率;评估上兼顾宏观与微观两层:在多场景、多交通密度下对比成功率、碰撞率与耗时,同时通过注意力权重可视化分析决策机理与依据。她还从方法论成熟度、平台生态与自身技能储备等角度论证了研究可行性:既有强化学习与世界模型的理论与工程基础,也预留了自开题起一年以上的连续研究周期,结合其在视觉数据处理、PyTorch与强化学习实践及交通仿真开发经验,保障项目稳步推进。最后,她以参考文献综述为基础明确本课题将在现有规则法、无模型RL与博弈/优化方法之上,重点验证并提升MBRL在高速公路匝道汇入与车道缩减等典型场景中的决策效率、稳定性与可解释性,力求形成可复用的算法基准与分析框架,为复杂汇入区的安全高效通行提供支撑。

罗文泽同学的开题答辩围绕“面向非结构化道路运输的网联车队管控方法”展开,聚焦矿区、港区、农场等无车道线、路面与环境高度动态的专用作业场景,立足行业对全天候、高效率、低成本无人化运输的迫切需求与相关政策牵引,指出现有面向结构化道路的算法与调度模型在此类场景中易在鲁棒性与安全性上失效、去中心化协同在强不确定与通信受限条件下易受扰动等关键痛点。为此,研究提出以强化学习赋能的分层耦合管控思路:底层构建去中心化多智能体轨迹规划与控制器,通过状态编码与奖励设计强化车间交互、安全边界与泛化能力,并在高保真、可交互且引入课程学习的训练环境中提升样本效率与收敛表现;顶层设计协同任务分配机制,将底层控制器的性能反馈作为权重更新与约束输入,打通“任务分配—执行控制—性能回灌”的闭环,实现顶/底层一体化联动优化。文献回顾显示,传统优化在规模扩展与实时性方面受限,图搜索与优先级方法协同效率偏低,而现有分层与RL方法普遍存在顶/底层割裂、执行过程过度简化等不足,进一步凸显本研究的必要性与创新性。预期成果包括非结构化道路不确定性建模方法、面向该场景的多车去中心化RL轨迹规划算法以及融入底层性能反馈的任务分配机制,目标是在安全可控前提下显著提升协同效率与运行鲁棒性。理论上,研究将为强不确定、弱规则与受限通信条件下的多智能体协同提供体系化方法论与可迁移工具;应用上,可支撑智慧矿山、智慧港口、智能农场等场景实现动态最优调度与常态化无人化运营,兼顾安全、效率与成本。

赵欣然同学以“通学接送非机动车交通需求分析与设施优化”为题,围绕校园周边在上下学高峰期出现的潮汐式非机动车交通与停车矛盾展开阐述:她首先指出,由于通学出行对私家车的高度依赖,学校周边形成周期性拥堵与瓶颈区,并伴随噪声与碳排放问题,而非机动车出行与设施配置的系统研究在既有通学研究中相对不足,提升非机动车分担率与优化设施布局具有现实紧迫性与社会效益。在现状梳理中,她总结了通学方式选择受个人、家庭、学校与外部环境等多因素耦合影响,非机动车停车需求也同时受基础设施、建成环境、政策管理与主观感知等因素驱动;方法范式方面,回归与机器学习更重结果精度,SEM强调机理解释,她据此提出以SEM识别关键影响因素、再用预测模型验证与量化的思路,兼顾可解释性与预测性能。在技术路线与模型体系上,她计划先基于关键影响因素构建多元回归模型,再进一步采用LightGBM与LSTM对非机动车动态交通流进行训练与寻优;针对静态停车需求,则对比Lasso与XGBoost以在可解释性与非线性拟合能力间取得平衡,并创新性地将“动态流量预测结果”作为“静态停车需求”模型的关键输入,形成动—静态需求的递进式耦合预测框架。在应用落地方面,她拟搭建交通仿真平台,结合具体案例对多种组织与设施优化策略进行综合评估,形成可操作的校园周边系统改善方案;同时,她明确了数据预处理(含主客观变量的问卷清洗与因子提取)、模型训练与寻优等关键难点,并给出“文献与开题—问卷数据处理—耦合建模与框架搭建—案例仿真验证—论文整理答辩”的阶段性计划与可行性依据(含既有项目与数据基础的支撑),以保证研究进度与成果产出。
四位同学汇报后都与三位老师和诸位同学们进行了充分的讨论与交流,三位老师认真倾听了四位同学的汇报,肯定了其研究工作,但也对四位同学后续的研究指出了一些建议,最后还对四位同学后续的研究工作提出了详细的指导,大家都收获颇丰。
