[1]刘奕,金小峰*.基于Bi -LSTM的面部特征与语音特征的映射模型[J].延边大学学报(自然科学版),2020,46(03):215-220.
 LIU Yi,JIN Xiaofeng*.A mapping model of facial features and speech features based on Bi -LSTM[J].Journal of Yanbian University,2020,46(03):215-220.
点击复制

基于Bi -LSTM的面部特征与语音特征的映射模型

参考文献/References:

[1] 李欣怡,张志超.语音驱动的人脸动画研究现状综述[J].计算机工程与应用,2017,53(22):21-28.
[2] 肖磊.语音驱动的高自然度人脸动画[D].合肥:中国科学技术大学,2019.
[3] LUO C W, YU J, WANG Z F. Synthesizing real -time speech -driven facial animation[C]//2014 IEEE International Conference on Acoustics, Speech and Signal Processing(ICASSP). Florence: IEEE, 2014:4568-4572.
[4] 赵晖.真实感汉语可视语音合成关键技术研究[D].长沙:国防科学技术大学,2009.
[5] 张贺,蒋冬梅,吴鹏,等.基于AAM和异步发音特征DBN模型的逼真可视语音合成[C]//第十一届全国人机语音通讯学术会议论文集.西安:西北工业大学,2011.
[6] TAYLOR S, KATO A, MATTHEWS I A, et al. Audio -to -visual speech conversion using deep neural networks[C]//San Francisco: Interspeech.2016:1482-1486.
[7] 阳珊,樊博,谢磊,等.基于BLSTM-RNN的语音驱动逼真面部动画合成[J].清华大学学报(自然科学版),2017,57(3):250-256.
[8] 宋怀波,齐关锋,钱程.基于YUV颜色空间的脸部区域特征点定位方法[J].吉林大学学报(工学版),2013,43(S1):39-42.
[9] 潘翔,陈敖,周春燕,等.基于视图特征点分布的三维模型检索算法[J].浙江工业大学学报(自然科学版),2013,41(6):641-645.
[10] 贾海鹏,张云泉,徐建良.基于OpenCL的图像积分图算法优化研究[J].计算机科学,2013,40(2):1-7.
[11] CRISTINACCE D, COOTES T. Feature detection and tracking with constrained local models[C]//British Machine Vision Conference. Edinburgh: BMVA, 2006:929-938.
[12] 高庆吉,赵志华,徐达,等.语音情感识别研究综述[J].智能系统学报,2020,15(1):1-13.
[13] AHMAD J, FIAZ M, KWON S I, et al. Gender identification using MFCC for telephone applications - a comparative study[J]. Iternational Journal of Computer Science and Electronics Engineering, 2015,3(5):351-355.
[14] HOCHREITER S, SCHMIDHUBER J. Long short -term memory[J]. Neural Computation, 1997,9(8):1735-1780.
[15] SCHUSTER M, PAILWAL K K. Bidirectional recurrent neural networks[J]. IEEE Transactions on Signal Processing, 1997,45(11):2673-2681.

备注/Memo

收稿日期: 2020-03-21 *通信作者: 金小峰(1970—),男,教授,研究方向为机器感知、图像及音频处理.
基金项目: 吉林省教育厅“十三五”科学技术项目(JJKH20191126KJ); 延边大学世界一流学科建设培育项目(18YLPY14)

更新日期/Last Update: 2020-09-20