大连理工大学主页平台管理系统都牧 Transfer Reinforcement Learning for Mixed Observability Markov Decision Processes with Time-Varying Interval-Valued Parameters and Its Application in Pandemic Control 都牧-中文主页

当前位置: 都牧-中文主页 >> 科学研究 >> 论文成果

Transfer Reinforcement Learning for Mixed Observability Markov Decision Processes with Time-Varying Interval-Valued Parameters and Its Application in Pandemic Control

点击次数：

发表时间：2024-11-02

发表刊物：INFORMS JOURNAL ON COMPUTING

文献类型：J

页面范围：1-23

ISSN号：1526-5528

上一条： Collaborative order fulfillment in omni-channel retailing: Unpaired multi-pickup and delivery problem with time windows

下一条：基于区块链的农产品供应链溯源研究综述

都牧 (副教授)