将一个基础的网络分层并模块化,使用一个路由网络来为每个任务选择不同的模块,路由网络也可以学习。这就是所谓的软模块。
用到的是SAC算法的改进型,文中引用的确实最原始的SAC文章(坑死)。改进的SAC取缔了V网络,并且温度系数\(\alph
2022-08-25