科学研究
网络传输
随着云计算、大数据和人工智能的兴起,在数据中心和集群系统中,如何降低任务处理延时、提高对用户的响应速度成为了当前的研究热点。随着网络带宽的增大,SSD及内存计算等方式对于IO的改善,网络协议栈的高CPU消耗和大处理延时的问题凸显了出来,基于RMDA的流量传输方式成为了当前的热门选项。相应地,如何管理基于RMDA的突发流量,并在此环境下优化传输协议,同时管理好网络流量和存储流量成为我们关注的核心问题。
另一方面,随着网络环境的变化和用户体验要求的提高,近期涌现了BBR、Copa、PCC、HPCC、PowerTCP等一系列创新性的网络传输协议,网络拥塞控制成为了当前的研究热点。结合不同环境下的特点和用户需求,探讨网络拥塞控制的本质问题,讨论基于AI的拥塞控制算法和经典拥塞控制算法的融合,为点播、直播、短视频、全息视频等主要视频流量规划码率、设计拥塞控制算法,提升用户体验质量,也是我们的主要关注点。
系统优化
分布式机器学习系统:当前机器学习系统大多采用分布式参数服务器模型,需要通过RDMA的方式在参数服务器和计算节点之间频繁的交互参数模型。在数据规模庞大的情形下,参数模型维度极高,单一参数模型高达上百兆。如何优化网络传输协议,提高数据传输效率,提高机器学习系统的性能,成为了我们的关注点。
大数据处理系统:Hbase、Cassandra等分布式NoSQL数据库由于在扩展性、可靠性等多方面的性能优势,在云计算与大数据系统中发挥着至关重要的作用。然而目前NoSQL数据库系统普遍使用默认参数、副本数目及选择策略和键值调度算法,无法达到最优的性能。因此,我们主要关注如何改善大规模分布式NoSQL数据库系统的副本选择策略和键值调度算法,优化分布式NoSQL数据库系统性能。
教学课程
现代网络技术与实现
《现代网络技术与实现》是一门关于现代计算机网络的高级课程,旨在介绍和深入探讨网络技术的最新发展和应用。本课程深入探讨现代网络技术的各个方面,涵盖了网络层、传输层、应用层以及前沿网络算法和虚拟网络等内容。学生将学习网络的逻辑结构、存储结构以及各种操作的实现方法,同时学习递归算法设计和典型的查找、排序算法等。
Python数据处理编程
Python是目前使用最方便、最流行的编程语言之一。本课程主要介绍基础的Python编程语言和Numpy、Pandas、Matplotlib等数据处理相关模块的使用,培养和提高学生的Python编程能力。同时,由于Python语言易于上手和使用,课程可以进一步训练学生通过编程来解决真实的数据处理问题,提高学生的数据分析能力。