发布于 2025-07-12
摘要
大模型声学融合:视听联合建模在计算机视觉中的应用 随着人工智能技术的飞速发展,计算机视觉领域取得了显著的成果。传统的计算机视觉模型往往只关注图像信息,忽略了声音等其他感官信息的重要性。近年来,大模型声学融合(视听
