发布于 2025-07-13
摘要
摘要:随着深度学习技术的不断发展,大模型在各个领域得到了广泛应用。大模型的训练和推理过程中,显存消耗成为制约其性能的关键因素。本文针对Stable Diffusion这一大模型,探讨了梯度检查点与模型分片加载两种显
