2017年2月23日下午,应邹月娴教授的邀请,新加坡信息通讯研究所(I2R)的黄东延博士来我司进行了学术交流,并在C202教室做了题为“Deep Learning for Multimodal Emotion Analysis, Recognition, Synthesis and their Applications”的讲座。
黄东延博士是IEEE的高级会员,新加坡信息通讯研究所I2R(Institute for Infocomm Research) 资深科学家(Senior Scientist)。自2011年开始带领团队开展基于机器学习理论和统计学习理论的语音合成、声音转换、语音情感识别、人机交互等研究,研究成果丰硕,已在知名期刊和会议上发表70余篇文章,所带领团队在INTERSPEECH2011说话人状态挑战的睡眠子挑战中获得了第一名。
在讲座中,黄东延博士首先介绍了可供计算机量化分析的维度情感模型,在此基础上比较了几种用于情感识别的神经网络,如限制玻尔兹曼机、卷积神经网络、循环神经网络等,随后介绍了他们团队在多模态情感识别、声音转换、情感声音合成和面部表情识别等方面的研究工作,并展示了算法流程和demo,最后提出了对于神经网络和情感识别的几点展望。
图1 黄东延博士在做学术讲座
图2 同学们认真聆听黄东延博士的演讲
图3 同学向黄东延博士提问
在讲座的尾声,同学们自由提问,与黄博士进行了深入交流。此次讲座加深了同学们对情感识别等相关领域的了解,让同学们收获良多。
撰稿人:罗丹青