在计算机听觉研究领域里,借鉴计算机视觉研究中的“视觉场景分析”概念而建立的声音信号处理模型概念。 人类对于声音信号的处理依据哪些规则,具有哪些特点?认知心理学很早就对于这个问题有了较为全面的答案。Bregman在1990年对此方面的研究进行了详尽的总结,总结出了以格式塔规则为基础的一系列感知规则,首次提出了“听觉场景分析”的概念。 而在此之前,Weintraub于1985年就已建立了第一个模拟单耳声源分离原理的人工听觉系统,将两个语音信号成功分离。这已经是听觉场景分析模型的雏形。后续的研究沿着类似的思想,不断地对模型进行完善。至2006年时,根据人类听觉信号处理规则和特点建立起来的听觉场景分析模型,已经达到了相当高的水平,能够较好的将基频分布范围处于相同频带上的多个同时语音进行分离。