发布于 2025-07-12
摘要
轻量化大模型在移动端高效推理的设计与实现 随着人工智能技术的飞速发展,计算机视觉领域的大模型在图像识别、目标检测、语义分割等方面取得了显著的成果。这些大模型在移动端设备上部署时,由于计算资源有限,往往面临着推理速