Meditate
【论文阅读】Dynamic Weights in Multi-Objective Deep Reinforcement Learning 【论文阅读】Dynamic Weights in Multi-Objective Deep Reinforcement Learning
本文研究了权重变化的多目标强化学习方式。 ==主要贡献:== 提出了一种能够适应动态权重变化的多目标Q-Learning方式(CN)。 提出了多样化经验化回放缓存(DER)保存多样化的经验,使模型能够从过去的不同的权重的经验中获取
2022-09-22
【论文阅读】Distral Robust Multitask Reinforcement Learning 【论文阅读】Distral Robust Multitask Reinforcement Learning
本文提出了一种同时在多个任务上训练的强化学习方法,叫做Distral。主要的想法是把各个任务上学到的策略进行提纯(distill,本意是蒸馏)得到一个共有的策略,然后再使用这个共有的策略去指导各个特定任务上的策略进行更好的学习。文章称,这种
2022-09-15
【论文阅读】Multi-Objective Congestion Control 【论文阅读】Multi-Objective Congestion Control
这篇文章是==首篇将多目标强化学习算法应用到拥塞控制(CC)==的一篇偏应用的文章。现有的CC算法无法应对不同程序的新的需求,当应对新的应用时需要学习一个新模型,作者提出了MOCC多目标强化学习框架。在这个框架下,MOCC 进一步应用迁移学
2022-09-10
【论文阅读】Multi-Task Reinforcement Learning with Soft Modularization 【论文阅读】Multi-Task Reinforcement Learning with Soft Modularization
将一个基础的网络分层并模块化,使用一个路由网络来为每个任务选择不同的模块,路由网络也可以学习。这就是所谓的软模块。 用到的是SAC算法的改进型,文中引用的确实最原始的SAC文章(坑死)。改进的SAC取缔了V网络,并且温度系数\(\alph
2022-08-25
【论文阅读】Multi-Task Deep Reinforcement Learning for Continuous Action Control 【论文阅读】Multi-Task Deep Reinforcement Learning for Continuous Action Control
本文基于机器人场景,提出了一种multi-DDPG的算法,将DDPG拓展到了多任务场景,使机器人能够学习多个连续的动作。并且引入mlpconv显著减少了模型参数量,将图像和传感器数据组合为输入。 MLPConv mlpconv m
2022-08-24
【论文阅读】Towards Impartial Multi-Task Learning 【论文阅读】Towards Impartial Multi-Task Learning
文章主要提出了一种方法能够均衡的学习multi task learning问题,这种方法的优点是不需要对分布有任何假设,并且对gradient scale的过程是和训练过程同步的,同时文章发现对loss balance和gradients
2022-08-16
【论文阅读】Task Switching Network for Multi-task Learning 【论文阅读】Task Switching Network for Multi-task Learning
这篇论文提出了任务交换网络(TSN),首次使用单编码器-单解码器的结构显著减少了参数量。 TSN TSN的总体结构 主干网络是Resnet-18,解码器中每一层会接受上一层中上采样后的特征图拼接上本层的特征图。 与以往的模型
2022-08-16
【论文阅读】Multi-task Learning with Attention for End-to-end Autonomous Driving 【论文阅读】Multi-task Learning with Attention for End-to-end Autonomous Driving
这篇文章是自动驾驶领域的文章,自动驾驶领域往往有两类任务:感知环境(如:语义分割),驾驶决策(根据周围环境做出相应的操作)。 这篇文章聚焦于自动驾驶中的点对点的导航问题,将多任务学习引入了自动驾驶,并且引入了注意力机制有效提高了准确率,文
2022-08-16