雾网络中基于多臂老虎机学习和匹配的分布式任务卸载
1. 引言
雾计算已广泛应用于物联网和网络物理系统中,作为云计算的扩展,它位于云层和用户设备层之间,能为用户设备提供类似云的服务,可提升系统在服务延迟、节能和服务成本方面的性能。然而,要实现这些优势,需要高效的任务卸载操作,以应对计算设备的异构性和不同计算任务的各种需求等挑战。
目前,有大量集中式优化技术和算法用于提供最优卸载解决方案,但这些方法需要集中控制来收集全局系统信息,会产生显著的开销和算法计算复杂度,特别是在雾计算网络密度大且异构的情况下。为克服这些限制,基于博弈论的卸载解决方案应运而生,可避免成本高昂的集中式资源管理并降低算法复杂度。不过,经典博弈论算法如最佳响应需要其他玩家行动的信息,且许多博弈论算法引入了一些假设来简化系统模型,在某些情况下不切实际。此外,大多数博弈论解决方案只研究单边稳定性概念。
近年来,匹配理论成为推导分布式任务卸载算法的有前途的技术,可显著降低基于雾的系统中的服务延迟。匹配理论具有分布式和低计算复杂度的优势,但大多数方法假设玩家的完整偏好是先验已知的,这在实际应用中不现实。因此,双方玩家需要迭代交互来学习未知偏好,多臂老虎机(MAB)是建模这种学习过程的常用方法。在雾计算时代,ε - 贪心和上置信界(UCB)技术已用于设计去中心化卸载解决方案,而这里将应用汤普森采样(TS)技术进行老虎机学习,并研究其在动态雾计算环境中的性能。
2. 背景和相关工作
2.1 一对一匹配的计算卸载算法
一对一(OTO)匹配的典型模型是婚姻模型,有两个不同的代理集合 (X = {x_1, x_2, \ldots, x_n}) 和 (Y = {y_1