【论文阅读】Dynamic Weights in Multi-Objective Deep Reinforcement Learning 本文研究了权重变化的多目标强化学习方式。 ==主要贡献:== 提出了一种能够适应动态权重变化的多目标Q-Learning方式(CN)。 提出了多样化经验化回放缓存(DER)保存多样化的经验,使模型能够从过去的不同的权重的经验中获取 2022-09-22 机器学习 多目标强化学习
数据中心网络综述 目前常用的数据中心网络拓扑是多根树架构。该拓扑分为三层,从下到上分别为==接入层、汇聚层和核心层==,规模较小的数据中心可以只有接入层和汇聚层。接入层交换机将服务器连接起来。为了提高可用性,一台服务器可能连接到两台接入交换机。同样,接入交换 2022-09-20 云计算 数据中心网络
【论文阅读】Load Balancing in Data Center Networks A Survey 数据中心网络的架构 ==架构可分为以交换机为中心、以服务器为中心和混合结构。== 在以交换机为中心的架构中,交换机用于在服务器之间提供多条路径并执行数据包转发。 在以服务器为中心的体系结构中,服务器既执行计算功能,又充当连接到其他 2022-09-17 云计算 数据中心网络 负载平衡
【论文阅读】Distral Robust Multitask Reinforcement Learning 本文提出了一种同时在多个任务上训练的强化学习方法,叫做Distral。主要的想法是把各个任务上学到的策略进行提纯(distill,本意是蒸馏)得到一个共有的策略,然后再使用这个共有的策略去指导各个特定任务上的策略进行更好的学习。文章称,这种 2022-09-15 机器学习 多任务学习
【论文阅读】Multi-Objective Congestion Control 这篇文章是==首篇将多目标强化学习算法应用到拥塞控制(CC)==的一篇偏应用的文章。现有的CC算法无法应对不同程序的新的需求,当应对新的应用时需要学习一个新模型,作者提出了MOCC多目标强化学习框架。在这个框架下,MOCC 进一步应用迁移学 2022-09-10 机器学习 多目标强化学习