发布于 3 天前
摘要
摘要:随着人工智能技术的飞速发展,大模型如Whisper在语音识别领域的应用越来越广泛。大模型的推理速度成为制约其实际应用的关键因素。本文将围绕Whisper推理速度的提升,从量化部署和硬件加速两个方面进行探讨,并