Harmony

【论文笔记】Harmony论文阅读笔记
7 minutes

基于深度学习的机器学习集群的任务放置

这是一篇发表在INFOCOM'2019上的论文, 特点是使用了强化学习进行任务放置。

Abstract

  • 背景

    • 虽然作业之间的服务器共享提高了资源利用率,但位于ML 作业之间的干扰可能会导致性能显着下降。
    • 现有的集群调度程序(例如,Mesos)在其作业布置中是忽视干扰的,导致资源效率不佳。
    • 干扰感知工作安置已在文献中进行了研究,但使用详细的工作负载分析和干扰建模进行了处理,这不是通用的解决方案。
  • Harmony