发布于 2025-07-13
摘要
摘要:随着人工智能技术的飞速发展,大模型在各个领域的应用越来越广泛。大模型的部署面临着诸多挑战,尤其是在边缘端设备上。本文将围绕边缘端分类这一主题,探讨低功耗设备上的AI大模型部署技术,包括模型压缩、量化、剪枝以及