COMOSVC是一种基于一致性模型的歌唱音高转换技术,它可以实现高质量的转换效果和快速的采样速度。该技术首先设计了一个基于弥散的教师模型,用于歌唱音高转换任务,然后通过自我一致性属性进行知识蒸馏,以实现一步采样。相比当前最先进的基于弥散的歌唱音高转换系统,COMOSVC在保持可比甚至优越的转换性能的同时,也实现了显著更快的推理速度。