面向混合专家模型的流行专家预取策略-小型微型计算机系统2025年07期-手机知网

手机知网 App

24小时专家级知识服务

自动化技术

面向混合专家模型的流行专家预取策略

广西大学计算机与电子信息学院 | 叶进李温良余天添彭涯军

开通知网号

在混合专家模型训练中，引入专家并行可以有效减轻单节点的内存压力并提高模型性能.然而，专家并行训练存在因令牌(Token)频繁跨节点传输及节点间负载不均衡而导致的高通信开销问题.针对此问题，本文提出了一种基于流行度的预取专家策略(Prefetch Ex...

机　构:

广西大学计算机与电子信息学院；

领　域:

自动化技术；

关键词:

专家并行；通信开销；专家流行度；专家预取；深度学习；

格　式:

PDF原版；EPUB自适应版(需下载客户端)

开通会员更优惠，尊享更多权益

手机阅读本文

下载APP 手机查看本文

小型微型计算机系统

相似文献

期刊硕士博士会议报纸

图书推荐

相关工具书