基于听觉中枢模型的水下噪声音色表达与特性分析

杨立学; 陈克安; 伍莹

doi:10.7498/aps.62.194302

摘要

为建立水下噪声音色特征的定量表达以用于目标识别, 本文将主观评价实验获得的 4个本质音色维度得分与声音的听觉中枢响应建立联系, 得到音色的偏最小二乘回归模型, 并基于回归系数对每个维度进行物理分析. 为验证该方法的有效性, 本文提取大量音色描述符作为自变量进行对比, 结果表明听觉中枢模型预测能力有一定优势. 同时发现, 前 3个本质音色维度可分别由高频能量比例、谱平坦程度和时域连续性描述, 而第4 维度则无法与任何声学特征建立联系.

关键词:

Abstract

In order to establish quantitative timbre representation of underwater noise, this paper tries to build a relationship between essential timbre scores and central auditory responses to stimulus based on partial least squares regression, and use regression coefficients to interpret the physical meaning of each dimension. In order to verify the utility of this method, this paper extracts a large amount of timbre descriptors as independent variables for comparisons, and it is shown that the predictive ability of the central auditory model is better. Finally it is found from two types of timbre representations that the first three dimensions in the timbre space can be respectively interpreted as high-frequency energy ratio, spectral flatness and temporal continuity; however, dimension 4 cannot be related to any acoustical features.

Keywords:

作者及机构信息

1.
西北工业大学环境工程系, 西安 710072

基金项目: 国家自然科学基金(批准号:11074202)资助的课题.

Authors and contacts

1.
Department of Environment Engineering, Northwestern Polytechnical University Xi’an 710072, China

Funds: Project supported by the National Natural Science Foundation of China (Grant No. 11074202).

参考文献

[1]	Wang N, Chen K A 2010 Acta Phys. Sin. 59 2873 (in Chinese) [王娜, 陈克安 2010 物理学报 59 2873]
[2]	Zwicker H E, Fastl H 1999 Psychoacoustics: Facts and Models (Berlin Heidelberg: Springer-Verlag Press)
[3]	Donnadieu S 2007 Analysis, Synthesis, and Perception of Musical Sounds (Berlin Heidelberg: Springer-Verlag Press) p272-319
[4]	Peeters G, Giordano B L, Susini P, Misdariis N, MaAdams S 2011 J. Acoust. Soc. Am. 130 2902
[5]	Collier G L 2004 Speech Commun. 43 297
[6]	Wang N, Chen K A, Huang H 2009 Acta Phys. Sin. 58 5730 (in Chinese) [王娜, 陈克安, 黄凰 2009 物理学报 58 5730]
[7]	Wang N 2010 Ph.D. Dissertation (Xi’an: Northwestern Polytechnical University) (in Chinese) [王娜 2010 博士学位论文 (西安: 西北工业大学)]
[8]	Shamma S 2003 IETE J. Res. 49 1
[9]	Chi T, Gao Y H, Guyton M C, Ru P, Shamma S 1999 J. Acoust. Soc. Am. 106 2719
[10]	Mesgarani N, Shihab S, Slaney M 2004 IEEE International Conference on Acoustics, Speech, and Signal Processing Montreal, Quebec, Canada, May 17-21, 2004 I-601
[11]	Kumar S, Foster H M, Bailey P, Griffiths T D 2008 J. Acoust. Soc. Am. 124 3810
[12]	Chen K A, Wu Y, Yang L X 2011 Appl Acoust 30 407 (in Chinese) [陈克安, 伍莹, 杨立学 2011 应用声学 30 407]
[13]	Chen K A, Wang N, Wu Y, Ma M, Zhang B R 2010 Chinese Sci. Bull. 55 651 (in Chinese) [陈克安, 王娜, 伍莹, 马苗, 张冰瑞 2010 科学通报 55 651]
[14]	Meddis R, Hewitt M J, Shackleton T M 1990 J. Acoust. Soc. Am. 87 1813
[15]	Wang H W 1999 Partial Least-Squares Regression: Method and Applications (Beijing: National Defense Industry Press) (in Chinese) [王慧文 1999 偏最小二乘回归方法及其应用 (北京: 国防工业出版社)]
[16]	Akitoshi I, Hiroshi Y 2006 IEEE Asia Pacific Conference on Circuits and Systems Singapore, December 4-7, 2006 992
[17]	Fabian M, Ultsch A, Thies M, Lohken I 2006 IEEE Trans. Audio and Speech Processing 14 81
[18]	Vassilakis P N 2007 Proceedings SMC’07, 4th Sound and Music Computing Conference Lefkada, Greece, July 11-13, 2007 319
[19]	Gygi B, Kidd G R, Watson C S 2007 Percept Psycho 69 839
[20]	Mackie R R, Wylie C D, Ridihalgh R R, Shultz T E, Seltzer M L 1981 Some Dimensions of Auditory Sonar Signal Perception and Their Relationship to Target Classification ADA102598, California: Human Factors Research

施引文献

[1]	Wang N, Chen K A 2010 Acta Phys. Sin. 59 2873 (in Chinese) [王娜, 陈克安 2010 物理学报 59 2873]
[2]	Zwicker H E, Fastl H 1999 Psychoacoustics: Facts and Models (Berlin Heidelberg: Springer-Verlag Press)
[3]	Donnadieu S 2007 Analysis, Synthesis, and Perception of Musical Sounds (Berlin Heidelberg: Springer-Verlag Press) p272-319
[4]	Peeters G, Giordano B L, Susini P, Misdariis N, MaAdams S 2011 J. Acoust. Soc. Am. 130 2902
[5]	Collier G L 2004 Speech Commun. 43 297
[6]	Wang N, Chen K A, Huang H 2009 Acta Phys. Sin. 58 5730 (in Chinese) [王娜, 陈克安, 黄凰 2009 物理学报 58 5730]
[7]	Wang N 2010 Ph.D. Dissertation (Xi’an: Northwestern Polytechnical University) (in Chinese) [王娜 2010 博士学位论文 (西安: 西北工业大学)]
[8]	Shamma S 2003 IETE J. Res. 49 1
[9]	Chi T, Gao Y H, Guyton M C, Ru P, Shamma S 1999 J. Acoust. Soc. Am. 106 2719
[10]	Mesgarani N, Shihab S, Slaney M 2004 IEEE International Conference on Acoustics, Speech, and Signal Processing Montreal, Quebec, Canada, May 17-21, 2004 I-601
[11]	Kumar S, Foster H M, Bailey P, Griffiths T D 2008 J. Acoust. Soc. Am. 124 3810
[12]	Chen K A, Wu Y, Yang L X 2011 Appl Acoust 30 407 (in Chinese) [陈克安, 伍莹, 杨立学 2011 应用声学 30 407]
[13]	Chen K A, Wang N, Wu Y, Ma M, Zhang B R 2010 Chinese Sci. Bull. 55 651 (in Chinese) [陈克安, 王娜, 伍莹, 马苗, 张冰瑞 2010 科学通报 55 651]
[14]	Meddis R, Hewitt M J, Shackleton T M 1990 J. Acoust. Soc. Am. 87 1813
[15]	Wang H W 1999 Partial Least-Squares Regression: Method and Applications (Beijing: National Defense Industry Press) (in Chinese) [王慧文 1999 偏最小二乘回归方法及其应用 (北京: 国防工业出版社)]
[16]	Akitoshi I, Hiroshi Y 2006 IEEE Asia Pacific Conference on Circuits and Systems Singapore, December 4-7, 2006 992
[17]	Fabian M, Ultsch A, Thies M, Lohken I 2006 IEEE Trans. Audio and Speech Processing 14 81
[18]	Vassilakis P N 2007 Proceedings SMC’07, 4th Sound and Music Computing Conference Lefkada, Greece, July 11-13, 2007 319
[19]	Gygi B, Kidd G R, Watson C S 2007 Percept Psycho 69 839
[20]	Mackie R R, Wylie C D, Ridihalgh R R, Shultz T E, Seltzer M L 1981 Some Dimensions of Auditory Sonar Signal Perception and Their Relationship to Target Classification ADA102598, California: Human Factors Research

[1]	姜锦铭, 孙庆德, 张卫兵. 面向软晶格筛选的立方钙钛矿体模量可解释性描述符研究. 物理学报, 2025, 74(17): 170201. doi: 10.7498/aps.74.20250652
[2]	李环娅, 周柯, 尹万健. 材料的非简谐性描述符. 物理学报, 2024, 73(5): 057101. doi: 10.7498/aps.73.20231428
[3]	梁可达, 刘滕飞, 常哲, 张猛, 李志鑫, 黄松松, 王晶. 基于最小二乘法和支持向量机的海洋内孤立波传播速度反演模型. 物理学报, 2023, 72(2): 028301. doi: 10.7498/aps.72.20221633
[4]	唐舟进, 任峰, 彭涛, 王文博. 基于迭代误差补偿的混沌时间序列最小二乘支持向量机预测算法. 物理学报, 2014, 63(5): 050505. doi: 10.7498/aps.63.050505
[5]	田中大, 高宪文, 石彤. 用于混沌时间序列预测的组合核函数最小二乘支持向量机. 物理学报, 2014, 63(16): 160508. doi: 10.7498/aps.63.160508
[6]	赵永平, 张丽艳, 李德才, 王立峰, 蒋洪章. 过滤窗最小二乘支持向量机的混沌时间序列预测. 物理学报, 2013, 62(12): 120511. doi: 10.7498/aps.62.120511
[7]	行鸿彦, 程艳燕, 徐伟. 基于广义窗函数和最小二乘支持向量机的混沌背景下微弱信号检测. 物理学报, 2012, 61(10): 100506. doi: 10.7498/aps.61.100506
[8]	杨红, 王瑞. 基于反馈和多最小二乘支持向量机的分数阶混沌系统控制. 物理学报, 2011, 60(7): 070508. doi: 10.7498/aps.60.070508
[9]	陈强, 任雪梅. 基于多核最小二乘支持向量机的永磁同步电机混沌建模及其实时在线预测. 物理学报, 2010, 59(4): 2310-2318. doi: 10.7498/aps.59.2310
[10]	陈跃宁, 徐征, 赵谡玲, 孙钦军, 尹飞飞, 董宇航. 最小二乘拟合计算有机薄膜晶体管迁移率的研究. 物理学报, 2010, 59(11): 8113-8117. doi: 10.7498/aps.59.8113
[11]	行鸿彦, 金天力. 基于对偶约束最小二乘支持向量机的混沌海杂波背景中的微弱信号检测. 物理学报, 2010, 59(1): 140-146. doi: 10.7498/aps.59.140
[12]	阎晓妹, 刘丁. 基于最小二乘支持向量机的分数阶混沌系统控制. 物理学报, 2010, 59(5): 3043-3048. doi: 10.7498/aps.59.3043
[13]	王娜, 陈克安. 水下噪声音色属性回归模型及其在目标识别中的应用. 物理学报, 2010, 59(4): 2873-2881. doi: 10.7498/aps.59.2873
[14]	汤波, 李俊峰, 王天舒. 水珠滴落的最小二乘粒子有限元方法模拟. 物理学报, 2008, 57(11): 6722-6729. doi: 10.7498/aps.57.6722
[15]	李军, 董海鹰. 基于小波核偏最小二乘回归方法的混沌系统建模研究. 物理学报, 2008, 57(8): 4756-4765. doi: 10.7498/aps.57.4756
[16]	任韧, 徐进, 朱世华. 最小二乘支持向量域的混沌时间序列预测. 物理学报, 2006, 55(2): 555-563. doi: 10.7498/aps.55.555
[17]	叶美盈. 基于最小二乘支持向量机建模的混沌系统控制. 物理学报, 2005, 54(1): 30-34. doi: 10.7498/aps.54.30
[18]	刘涵, 刘丁, 任海鹏. 基于最小二乘支持向量机的混沌控制. 物理学报, 2005, 54(9): 4019-4025. doi: 10.7498/aps.54.4019
[19]	叶美盈, 汪晓东, 张浩然. 基于在线最小二乘支持向量机回归的混沌时间序列预测. 物理学报, 2005, 54(6): 2568-2573. doi: 10.7498/aps.54.2568
[20]	包紫薇, 魏荣爵. 用语噪声法研究发音人的音色特征. 物理学报, 1978, 27(4): 476-479. doi: 10.7498/aps.27.476

计量

文章访问数: 8202
PDF下载量: 682
被引次数: 0

姓名
邮箱
手机号码
标题
留言内容
验证码

搜索

留言板