性能很大程度由CPU决定,通过AI训练平台和GPU计算资源体系,对GPU资源调度使用进行优化,提升碎片资源使用率和调度灵活性,提高GPU使用率、CPU使用率对现在人工智能领域的持续发展是很有必要的。吉利星睿数据智能产业学院系列横向课题正式发布,系列横向课题涉及数据治理、大模型测评、数据集建设等多个领域。
课题分两个领域展开,一是对多个工作空间,GPU独占资源池,可灵活跨池做调度,如对于某个工作空间空闲的GPU,可临时供其他工作空间调度;二是,对于GPU服务器上可能出现空闲的CPU等资源,如何增加调度,进一步利用同时跑纯CPU的业务。
基于吉利星睿数据智能产业学院的验收标准,此课题将达到以下三点:
1、对比课题研发前后运行环境,多个工作空间的GPU池,能够带来至少5%的GPU使用率
2、在运行GPU训练任务,能够同时支持CPU规格的业务,使用率得到至少达到70%水平
3、运行的任务/业务相互不影响,结果无异常
算力是驱动人工智能产业发展的核心动力,是将数据和算法真正通过硬件执行的基础单元,并将数据、算法转化为最终的生产力。本次课题研究的CPU算力优化,可以提高电脑对数据的处理能力,优化CPU实际性能,更多地兼容软件,对未来人工智能领域的发展具有重要意义。