人类可以通过视觉、味觉、听觉、嗅觉和触觉五个器官来认识世界
相关图书
,而对于他人情感的识别主要是通过视觉和听觉来完成的,即主要是通过人脸的情感识别、语言声调的情感识别和语言文字的情感识别来完成的。
人脸的情感识别
把用眼睛观察到的视觉信息叫做图象信息,如人脸的表情信息。一般的表情识别可以用单个感官完成,也可以用多个感官相配合来完成,它是一个整体识别和特征识别共同作用的结果。具体说来,远处辨认人,主要是依靠人脸的整体识别,而在近距离辨认人,主要是依靠人脸的特征识别。人脸的整体识别和特征识别虽然存在联系,但总体说是分开的、并行的处理过程。随着人脸的计算机处理技术(包括人脸检测和人脸识别)不断完善,利用计算机进行面部表情分析也就成为可能。由于各种面部表情本身体现在各个特征点运动上的差别并不是很大,而表情分析对于人脸的表情特征提取的准确性和有效性要求比较高,因而难以顺利地实现。例如:嘴巴张开并不代表就是笑,也有可能是哭和惊讶等。所用到的识别特征主要有:灰度特征、运动特征和频率特征三种。灰度特征是从表情图像的灰度值上来处理,利用不同表情有不同灰度值来得到识别的依据;运动特征利用了不同表情情况下人脸的主要表情点的运动信息来进行识别;频域特征主要是利用了表情图像在不同的频率分解下的差别,速度快是其显著特点。具体的表情识别方法主要有三个:一是整体识别法和局部识别法,二是形变提取法和运动提取法,三是几何特征法和容貌特征法。当然,这三个发展方向不是严格独立的,恰恰相反,是相互联系,相互影响的,它们只是从不同侧面来提取所需要的表情特征,都只是提供了一种分析表情的思路。
语言声调的情感识别
一般来说,不同语言声调表情的语言信号在其时间构造、振幅构造、基频构造和共振峰构造等特征方面也有着不同的构造特点和分布规律。由此,只要把各种具体模式的语言声调表情在时间构造、振幅构造、基频构造和共振峰构造等特征方面的构造特点和分布规律进行测算和分析,并以此为基础或模板,就可以识别出所有语言声调中所隐含的情感内容。
语言文字的情感识别
语言和文字属于第二信号系统,由于它们脱离了现实事物对于人的
条件反射活动的直接参与,从而可以更为广泛地、普遍地、直接地、快速地、灵活地、多样地、深入地对各种事物进行认识,从而可以使人类能够对更为抽象、更为本质、更为遥远、更为间接、更为广泛、更为模糊、更为变化莫测的事物的价值关系进行认识和反应。