【论文阅读】Dynamic Weights in Multi-Objective Deep Reinforcement Learning 本文研究了权重变化的多目标强化学习方式。 ==主要贡献:== 提出了一种能够适应动态权重变化的多目标Q-Learning方式(CN)。 提出了多样化经验化回放缓存(DER)保存多样化的经验,使模型能够从过去的不同的权重的经验中获取 2022-09-22 机器学习 多目标强化学习
数据中心网络综述 目前常用的数据中心网络拓扑是多根树架构。该拓扑分为三层,从下到上分别为==接入层、汇聚层和核心层==,规模较小的数据中心可以只有接入层和汇聚层。接入层交换机将服务器连接起来。为了提高可用性,一台服务器可能连接到两台接入交换机。同样,接入交换 2022-09-20 云计算 数据中心网络
【论文阅读】Load Balancing in Data Center Networks A Survey 数据中心网络的架构 ==架构可分为以交换机为中心、以服务器为中心和混合结构。== 在以交换机为中心的架构中,交换机用于在服务器之间提供多条路径并执行数据包转发。 在以服务器为中心的体系结构中,服务器既执行计算功能,又充当连接到其他 2022-09-17 云计算 数据中心网络 负载平衡
【论文阅读】Distral Robust Multitask Reinforcement Learning 本文提出了一种同时在多个任务上训练的强化学习方法,叫做Distral。主要的想法是把各个任务上学到的策略进行提纯(distill,本意是蒸馏)得到一个共有的策略,然后再使用这个共有的策略去指导各个特定任务上的策略进行更好的学习。文章称,这种 2022-09-15 机器学习 多任务学习
【论文阅读】Multi-Objective Congestion Control 这篇文章是==首篇将多目标强化学习算法应用到拥塞控制(CC)==的一篇偏应用的文章。现有的CC算法无法应对不同程序的新的需求,当应对新的应用时需要学习一个新模型,作者提出了MOCC多目标强化学习框架。在这个框架下,MOCC 进一步应用迁移学 2022-09-10 机器学习 多目标强化学习
【论文阅读】Multi-Task Reinforcement Learning with Soft Modularization 将一个基础的网络分层并模块化,使用一个路由网络来为每个任务选择不同的模块,路由网络也可以学习。这就是所谓的软模块。 用到的是SAC算法的改进型,文中引用的确实最原始的SAC文章(坑死)。改进的SAC取缔了V网络,并且温度系数\(\alph 2022-08-25 机器学习 多任务学习
【论文阅读】Multi-Task Deep Reinforcement Learning for Continuous Action Control 本文基于机器人场景,提出了一种multi-DDPG的算法,将DDPG拓展到了多任务场景,使机器人能够学习多个连续的动作。并且引入mlpconv显著减少了模型参数量,将图像和传感器数据组合为输入。 MLPConv mlpconv m 2022-08-24 机器学习 多任务学习
【论文阅读】Towards Impartial Multi-Task Learning 文章主要提出了一种方法能够均衡的学习multi task learning问题,这种方法的优点是不需要对分布有任何假设,并且对gradient scale的过程是和训练过程同步的,同时文章发现对loss balance和gradients 2022-08-16 机器学习 多任务学习
【论文阅读】Task Switching Network for Multi-task Learning 这篇论文提出了任务交换网络(TSN),首次使用单编码器-单解码器的结构显著减少了参数量。 TSN TSN的总体结构 主干网络是Resnet-18,解码器中每一层会接受上一层中上采样后的特征图拼接上本层的特征图。 与以往的模型 2022-08-16 机器学习 多任务学习
【论文阅读】Multi-task Learning with Attention for End-to-end Autonomous Driving 这篇文章是自动驾驶领域的文章,自动驾驶领域往往有两类任务:感知环境(如:语义分割),驾驶决策(根据周围环境做出相应的操作)。 这篇文章聚焦于自动驾驶中的点对点的导航问题,将多任务学习引入了自动驾驶,并且引入了注意力机制有效提高了准确率,文 2022-08-16 机器学习 多任务学习
docker docker 英文文档:https://docs.docker.com/ docker中文文档:https://gitee.com/docker_practice/docker_practice#https://gitee.com/li 2022-06-24 开发 docker 后端