6月11日消息,开源跨国科技公司Yandex最近推出了用于训练大型语言模型的大型开源方法YaFSDP。YaFSDP可用于增强GPU通信并减少LLM训练中的模型内存使用量,与FSDP相比,训练其训练速度提升最高可达26%。工具YaFSDP方法目前已可以在Github上免费访问。开源大型