探索科研，学术引领——孙立民教授做基于强化学习的生产再决策问题研究报告

发布者：系统管理员发布时间：2023-06-14浏览次数：647

为进一步加强学术交流，2023年6月14日14：30，信息与智能工程学院邀请了孙立民教授在书新4号楼四楼会议室进行了基于强化学习的生产再决策问题研究报告，信息与智能工程学院教授与讲师参与本次报告。

图片1.png

报告伊始，孙立民教授先提出了背景介绍，此研究是为满足某离散制造型企业提出的订单变更需求，提出了一种基于强化学习（Reinforcement learning）的订单变更后生产再决策的设计方案。

随后他通过列举案例表明强化学习在国内外研究现状，并对基于SMDP的生产再决策系统模型、Q-learning算法描述、Q-learning数值实验、部署方式等展开了详细介绍：

图片2.png

在实现过程中，先对变更问题采用半马尔可夫决策模型进行建模，将企业实际生产环节中的设备使用情况、产品的库存开销、产品的收益及订单的违约赔偿等考虑在内。之后，采用一种动态改变探索速率和学习速率的Q-learning算法进行具体实现，最终达到贴合实际生产的效果。并将采用一种学习执行隔离模式进行部署，保证实际生产过程能够安全和高效化运行。

最后，孙立民教授作结语，老师们提出问题、交流问题，孙教授做出专业上的解答。

图片3.png

本次研究报告营造了浓厚的学术氛围，促进了专业老师的教学研究与科研工作的进行。科技的发展是一环套一环，任何科研都是在研究事物上不断更新的，相信本次报告将对推动信息与智能工程学院科研发展存在重要意义。