为进一步加强学术交流,2023年6月14日14:30,信息与智能工程学院邀请了孙立民教授在书新4号楼四楼会议室进行了基于强化学习的生产再决策问题研究报告,信息与智能工程学院教授与讲师参与本次报告。
报告伊始,孙立民教授先提出了背景介绍,此研究是为满足某离散制造型企业提出的订单变更需求,提出了一种基于强化学习(Reinforcement learning)的订单变更后生产再决策的设计方案。
随后他通过列举案例表明强化学习在国内外研究现状,并对基于SMDP的生产再决策系统模型、Q-learning算法描述、Q-learning数值实验、部署方式等展开了详细介绍:
在实现过程中,先对变更问题采用半马尔可夫决策模型进行建模,将企业实际生产环节中的设备使用情况、产品的库存开销、产品的收益及订单的违约赔偿等考虑在内。之后,采用一种动态改变探索速率和学习速率的Q-learning算法进行具体实现,最终达到贴合实际生产的效果。并将采用一种学习执行隔离模式进行部署,保证实际生产过程能够安全和高效化运行。
最后,孙立民教授作结语,老师们提出问题、交流问题,孙教授做出专业上的解答。
本次研究报告营造了浓厚的学术氛围,促进了专业老师的教学研究与科研工作的进行。科技的发展是一环套一环,任何科研都是在研究事物上不断更新的,相信本次报告将对推动信息与智能工程学院科研发展存在重要意义。