机器人听觉声源定位研究综述

来源：华佗养生网

第７卷第１期２０１２年２月智能系统学报ＣＡＡＩＴｒａｎｓａｃｔｉｏｎｓＯｆｆＶ０１．７Ｎｏ．１Ｆｅｂ．２０１２ＩｎｔｅｌｌｉｇｅｎｔＳｙｓｔｅｍｓＤＯＩ：１０．３９６９／ｊ．ｉｓｓｎ．１６７３－４７８５．２０１２０１００３网络出版地址：ｈｔｔｐ：／／ｗｗｗ．ｃｎｋｉ．ｎｅｔ／ｋｃｍｓ／ｄｅｔａｉｌ／２３．１５３８．ＴＰ．２０１２０２１９．２２２４．００１．ｈｔｍｌ机器人听觉声源定位研究综述李晓飞１，刘宏１，２（１．北京大学深圳研究生院集成微系统科学工程与应用重点实验室，广东深圳５１８０５５；２．北京大学机器感知与智能教育部重点实验室。北京１００８７１）摘要：声源定位技术定位出外界声源相对于机器人的方向和位置，机器人听觉声源定位系统可以极大地提高机器人与外界交互的能力．总结和分析面向机器人听觉的声源定位技术对智能机器人技术的发展有着重要的意义．首先总结了面向机器人听觉的声源定位系统的特点，综述了机器人听觉声源定位的关键技术，包括到达时间差、可控波束形成、高分辨率谱估计、双耳听觉、主动听觉和视听融合技术．其次对麦克风阵列模型进行了分类，比较了基于三维麦克风阵列、二维麦克风阵列和双耳的７个典型系统的性能．最后总结ｒ机器人听觉声源定位系统的应用，并分析了存在的问题和未来的发展趋势．关键词：机器人；机器人听觉；声源定位；麦克风阵列中图分类号：ＴＰ２４２．６；ＴＮ９１２．３文献标志码：Ａ文章编号：１６７３－４７８５（２０１２）Ｏｌ－０００９－１２ＡｓｕｒｖｅｙｏｆｓｏｕｎｄｓｏｕｒｃｅｌｏｃａｌｉｚａｔｉｏｎｆｏｒｒｏｂｏｔａｕｄｉｔｉｏｎＬＩＸｉａｏｆｅｉｌ，ＬＩＵＨｏｎ９１，２（１．ＫｅｙＬａｂｏｒａｔｏｒｙｏｆＩｎｔｅｇｒａｔｅｄＭｉｃｒｏｓｙｓｔｅｍｓ，ＳｈｅｎｚｈｅｎＧｒａｄｕａｔｅＳｃｈｏｏｌｏｆＰｅｋｉｎｇＵｎｉｖｅｒｓｉｔｙ，Ｓｈｅｎｚｈｅｎ５１８０５５，Ｃｈｉｎａ；２．ＫｅｙＬａ－ｂｏｒａｔｏｒｙｏｆＭａｃｈｉｎｅＰｅｒｃｅｐｔｉｏｎ（ＭｉｎｉｓｔｒｙｏｆＥｄｕｃａｔｉｏｎ），ＰｅｋｉｎｇＵｎｉｖｅｒｓｉｔｙ，Ｂｅｉｊｉｎｇ１００８７１，Ｃｈｉｎａ）ｌｏｃａｌｉｚａｔｉｏｎｃａｎＡｂｓｔｒａｃｔ：Ｔｈｅｔｅｃｈｎｏｌｏｇｙｏｆｓｏｕｎｄｔｉｖｅａｃｔｔｏａｓｏｕｒｃｅｌｏｃａｌｉｚｅｔｈｅｄｉｒｅｃｔｉｏｎａｎｄｐｏｓｉｔｉｏｎｏｆｃａｎａｓｏｕｎｄａｓｏｕｒｃｅｒｅｌａ—ｉｎｔｅｒ－ｒｏｂｏｔ．Ｓｏｕｎｄｓｏｕｒｃｅｌｏｃａｌｉｚａｔｉｏｎｓｙｓｔｅｍｆｏｒｒｏｂｏｔａｕｄｉｔｉｏｎｇｒｅａｔｌｙｉｍｐｒｏｖｅｔｈｅａｂｉｌｉｔｙｏｆｒｏｂｏｔｔｏｗｉｔｈｅｘｔｅｒｎａｌｃｏｎｄｉｔｉｏｎｓ．ＴｈｅｓｕｍｍａｒｙａｎｄａｎａｌｙｓｉｓｏｆｓｏｕｎｄｓｏｕｒｃｅｌＯＣａｌｉｚａｔｉｏｎｆｏｒｒｏｂｏｔａｕｄｉｔｉｏｎｃｓｎｓｉｇｎｉｆｉ－ｃｈａｒａｃｔｅｒｉｓｔｉｃｓｏｆｓｏｕｎｄｓｏｕｒｃｅｌｏｃａｌｉｚａ－ｃａｎｎｙｐｒｏｍｏｔｅｔｈｅｄｅｖｅｌｏｐｍｅｎｔｏｆｉｎｔｅｌｌｉｇｅｎｔｒｏｂｏｔｓ．Ｉｎｔｈｉｓｗｏｒｋ，ｆｉｒｓｔ，ｔｈｅｔｉｏｎｆｏｒｒｏｂｏｔａｕｄｉｔｉｏｎｗｅｒｅｓｕｍｍａｒｉｚｅｄ．Ｔｈｅｋｅｙｔｅｃｈｎｏｌｏｇｉｅｓｗｅｒｅｓｕｍｍａｒｉｚｅｄ，ｉｎｃｌｕｄｉｎｇｔｈｅｔｉｍｅｄｅｌａｙｏｆａｒｒｉ－ｖａｌ，ｓｔｅｅｒｅｄｂｅａｍｆｏｒｍｉｎｇ，ｈｉｇｈｒｅｓｏｌｕｔｉｏｎｓｐｅｃｔｒａｌｅｓｔｉｍａｔｉｏｎ，ｂｉｎａｕｒａｌ，ａｃｔｉｖｅａｕｄｉｔｉｏｎ，ａｎｄａｕｄｉｏ－ｖｉｓｕａｌ．Ｔｈｅｎ，ｔｈｅｍｏｄｅｌｓｏｆａｍｉｃｒｏｐｈｏｎｅａｒｒａｙｗｅｒｅｃｌａｓｓｉｆｉｅｄ．ａｎｄｔｈｅｐｅｒｆｏｒｍａｎｃｅｓｏｆｗｅｒｅｓｅｖｅｎｔｙｐｉｃａｌｓｙｓｔｅｍｓｂａｓｅｄａｏｎａ３一Ｄｍｉ－ｓｏｕｒｃｅｃｒｏｐｈｏｎｅａｒｒａｙ，２－Ｄｍｉｃｒｏｐｈｏｎｅａｒｒａｙ，ａｎｄｂｉｎａｕｒａｌｃｏｍｐａｒｅｄ．Ｆｉｎａｌｌｙ，ｔｈｅａｐｐｌｉｃａｔｉｏｎｓｏｆｓｏｕｒｃｅｓｏｕｎｄｌｏｃａｌｉｚａｔｉｏｎｓｙｓｔｅｍｏｆｒｏｂｏｔａｕｄｉｔｉｏｎｗｅｒｅｓｕｍｍａｒｉｚｅｄ．Ｓｅｖｅｒａｌｉｓｓｕｅｓｔｈａｔｓｏｕｎｄｗｅｌｌａ８ｌｏｃａｌｉｚａｔｉｏｎｓｙｓｔｅｍｓｆａｃｅ嬲ｄｅｖｅｌｏｐｍｅｎｔｔｒｅｎｄｓｗｅｒｅａｎａｌｙｚｅｄ．ｓｏｕｒｃｅＫｅｙｗｏｒｄｓ：ｒｏｂｏｔ；ｒｏｂｏｔａｕｄｉｔｉｏｎ；ｓｏｕｎｄｌｏｃａｌｉｚａｔｉｏｎ；ｍｉｃｒｏｐｈｏｎｅａｒｒａｙ机器人听觉系统是一种自然、方便、有效、智能的机器人与外界系统交互的方式．由于声音信号的衍射性能，听觉具有全向性，相较于视觉、激光等其他的传感信号听觉不需要直线视野，在有视野遮蔽障碍物的情况下依然可以有效地工作．一般来讲机器人听觉包括声源信号的定位与分离、自动语音识别、说话人识别等．机器人听觉声源定位是指机器人利用搭载在机器人上或者外部设备上的麦克风阵列定位出声源的相对位置．随着信息技术、电子科学技术、计算机科学技术和智能科学的迅速发展，自２０世纪９０年代中期始，人ｆｆｌｘ寸机器人听觉声源定位技术进行了深入而广泛的研究，并取得了重要的进展．收稿日期：２０１２－０１一１０．网络出版时问：２０１２－０２－１９．基金项目：【ｑ家“８６３”汁划｛｝ｆｌ嘶ＪＯＩＩＩ（２００６ＡＡ０４２２４７）；网家内然科学基金资助项Ｉｊ（６０６７５０２５，６０８７５０５０）；深圳Ｉｌ】科技计划及毓ｆＩ｝Ｉｊ研究ｉｆ划资助项｜ｊ（ＪＣ２（Ｘ）９０３１６０３９）．通信作者：刘宏．Ｅ－ｍａｉｌ：ｈｏｌｌｇｌｉｕ＠ｐｋｕ．ｅｄｕ．ｃｎ．声源的位置信息包括轴向角、仰角和距离，其中万方数据１０智能系统学报第７卷轴向角可以确定声源的二维方向，轴向角和仰角可以确定声源的三维方向，轴向角、仰角和距离可以确定声源的三维位置．在噪声环境下，利用少量的麦克风实时地定位声源的三维位置是一个实用的机器人听觉声源定位系统的目标．虽然机器人听觉声源定位技术的研究取得了很多成果，但是该技术的实际应用还面临很多问题．１ｃｏｒｒｅｌａｔｉｏｎ，ＧＣＣ）”ｏ、互功率谱相位法（ＣｒｏＳＳ．ｐｏｗｅｒｓｐｅｃｔｒｕｍｐｈａｓｅ，ＣＳＰ）”１、特征值分解”１、声学传递函数比”１等．获取ＴＤＯＡ以后，乘以声速便可以得到距离差，这样就可以通过声源与麦克风的几ｃｒｏｓｓ何关系得到声源位置．主要的几何定位方法包括最大似然估计（ｍⅡｉＩｎｕｍｌｉｋｅｌｉｈｏｏｄｅｓｔｉｍａｔｏｒ）”１和最小均方估计（１ｅａｓｔｓｑｕａｒｅｅｓｔｉｍａｔｏｒ）”…．ＴＤＯＡ方法计算量小，可实时实现，但双步估计带来累积误差，是一种次最优估计，为了取得较高的分辨率，对信号采样率要求较高，适用于单声源定位．１９９７年Ｈｕａｎｇ等利用３个麦克风组成平面三角阵列定位声源的全向轴向角ｐ］．根据声音的优先效应，通过无回响起点检测算法（ｅｃｈｏ－ｆｒｅｅｏｎｓｅｔｄｅ—ｔｅｃｔｉｏｎ）检测出无回响的声音段，利用过零点（ｚｅｒｏ．ｃｒｏｓｓｉｎｇｐｏｉｎｔ）检测时延，然后根据几何关系定位声源轴向角．２００２年他们利用如图ｌ所示的三维麦克风阵列进行声源轴向角和仰角的定位””，互相关函数和互功率谱相位差分别被用于时延估计．识别阶机器人听觉系统声源定位的特点相较于一般的声源定位系统．机器人听觉声源定位具有以下特点：１）麦克风阵列易搭载：搭载在机器人平台上的麦克风阵列应该尽量小，麦克风阵列的小型化可以通过减少麦克风的数量和优化阵列拓扑来实现．２）机器人运动：搭载在机器人平台上的麦克风阵列的运动改变了听觉场景，给声源定位带来了困难．但另一方面可以通过麦克风阵列的主动运动．丰富麦克风阵列的拓扑，提高定位能力．３）声源移动：在大多数机器人听觉声源定位系统应用中，声源是移动的，需要进行移动声源的定位与跟踪．４）实时性高：机器人的运动和声源的移动造成机器人和声源相对位置的即时变化，要求定位具有较高的实时性．机器人与外界交互的实时性是机器人友好性和安全性的保障，是评价交互性能的重要指标，因此声源定位系统的实时性是极其必要的．５）抗混响和噪声：机器人工作在真实环境中，信号混响和噪声是难以避免的，因此声源定位系统的抗混响和抗噪声能力在很大程度上影响定位性能．段，６个时间差组成时间差序列：瓯＝（血。△ｌ。址１．’△垴，△ｋ，血。），时间差序列误差为ｅ（口，妒）＝０Ａｔ（口，妒）一Ａｆ。０，其中血（ｐ，妒）为理论时间差，轴向角０和仰角妒取使ｅ（ｐ，妒）最小化的值．２００７年文献［１１］对于多个声源，利用６个互相关函数的几何平均：Ｐ（口，妒）＝｛ｌｌｃ口（△～（口，妒））｝“６表示一个声源位置存在声源的概率，概率越大则存在声源的可能性越大．２机器人听觉系统声源定位方法１９９５年ｈｉｅ第１次将声源定位技术用于智能机器人…，利用短时时域、频域特征和神经网络技术区分摄像头视角内的左中右３个声源方向．其后．基于麦克风阵列的到达时间差技术（ｔｉｍｅｄｅｌａｙｏｆａｒｒｉ．圈Ｉｎ垂１４通道阵刭４－曲ａｒｒａｙ术（ｓｔｅｅｒｅｄ蛐ｍｈ培，ＢＳ）、高分辨率谱估计技术（ｈｉｇｈｒｅｓｏｌｕｔｉｏｎｓｐｅｃｔｒａｌｖａｌ，ＴＤＯＡ）、基于最大输出功率的可控波束形成技ｅｓ血１撕∞）、双耳听觉（ｂｉｎ—ａｕｒ８１）、机器学习（ｍａｃｈｉｎｅｌｅａｒｎｉｎｇ）、主动听觉技术（ａｃｔｉｖｅａｕｄｉｔｉｏｎ）、视听融合（ａｕｄｌｏ－ｖｉｓｕａｌ）等方法被用于机器人听觉声源定位．２．１到达时间差技术基于ＴＤＯＡ的定位技术是一种２步定位方法，首先估计出声源信号到达各个麦克风之间的时问延迟，然后利用几何定位方法求出声源位置．稳健的时间延迟估计是精确声源定位的基础，常用的时延估计算法包括广义互相关（ｇｅｎｅｒａｌｉｚｅｄ万方数据２００２年Ｓｅｋｍｅｎ等提出一种自然的人机交互方式，把人作为一个被动的用户，不用通过键盘、鼠标等人工的方式与机器人进行交互“”．机器人只是人的运动的一个直接物理再现，利用声源定位和红外运动跟踪，为人脸跟踪系统提供候选区域和机器人的注意力．２个麦克风摆放在一个开放的空间，头部传输函数不用考虑．假设声源位于仿人机器人的前方，利用互相关法估计时延，通过远场近似几何方法便可定位远场声源．２００３年Ｖａｌｉｎｄ等放置８个麦克风在长方体支架的顶点”…，如图２所示．该麦克风阵列搭载在Ｐｉ—第１期李晓飞，等：机器人听觉声源定位研究综述一一一一—■渊髻国二ｓ通遗立五体阵列Ｆｉｇ．２８．－ｃｈｃｕｂｅａｒｒａｙ该图和互相关函数得到Ｃｒｏｓｓ・ＡｎｇＩｅ・Ｃｏｒｒｅｌａｔｉｏｎ函数Ｒ（ｐ）．该函数在声源方向取较大的值．对于多个声源，竞争Ｋ－ｍｅａｎｓ算法被用于基于Ｃｒｏｓｓ－Ａｎｇｌｅ－Ｃｏｒ－ｒｅｌａｔｉｏｎ函数的声源角度聚类，该系统利用正三角形麦克风阵列定位声源轴向角．２．２基于最大输出功率的可控波束形成技术该方法对麦克风接受到的声源信号滤波并加权求和形成波束，按照某种搜索策略全局搜索可能的声源位置来引导波束，波束输出功率最大的位置即为声源位置””Ｊ．延迟和波束形成算法（ｄｅｌａｙ—ａｎｄ—ｓｕｍｂｅａｍ＿ｆｏｒｍｉｎｇ，ＤＳＢ）””通过对麦克风接受信号采用时间移位以补偿声源到达各麦克风的传播延迟，并通过相加求平均来形成波束．滤波和波束形成算法（ｆｉｌｔｅｒ—ａｎｄ．ｓｕｍｂｅａｍｆｏｒｍｉｎｇ，ＦＳＢ）…１在时间移位的同时进行滤波，然后相加求平均形成波束．可控波束形成算法的定位性能取决于麦克风阵列方向图的主瓣和旁瓣的分布．主瓣能量越大。宽度越窄，则形成波束的分辨率越高．通常该算法要求大量的麦克风以取得较好的方向图．该算法本质上是一种最大似然估计，需要声源和噪声的先验信息，但通常这些信息在实际应用中不易获得．最大似然估计是一种非线性优化问题，传统搜索算法容易陷入局部最小点，而遍历式的搜索方法的运算量极大ｍ－．１９９９年Ｍａｔａｕｉ等研制出一种办公室接待机器人Ｊｉｊｏ－２．它可在办公室环境下引导客人参观…Ｊ．该机器人视觉声源定位系统基于波束形成算法，利用平均分布于半圆弧的平面８通道麦克风阵列定位声源的轴向角．２００４年Ｖａｌｉｎ等利用ＤＳＢ定位多声源位置。预求出所有对的麦克风信号频域的互相关ｍ・：一嘲２００７年Ｒｕｄｚｙｎ利用与图１相似的麦克风阵列定位声源三维位置““．包括距离、轴向角和仰角．利用加权互相关函数（ｗｅｉｇｈｔｅｄｃｒｏｓｓｃｏｒｒｅｌａｔｉｏｎ，ｗｃｃ）估计时延以。。＝丘／（正。＋６），其中工“为平均幅度差函数（ａｖｅｒａｇｅｍａｇｎｉｔｕｄｅｄｉｆｆｅｒｅｎｃｅｆｕｎｅ－ｔｉｏｎ），用于增强ＧＣＣ的性能．同样使用近场几何定位方法来定位三维声源．２００８年Ｋｗｈ＆等利用平面正三角形阵列定位声源”“．语音信号的声门激励信息被用于时延估计．首先求出语音信号线性预测残差表示声门激励信号，然后线性预测残差的希尔伯特包络（Ｈｉｌｂｅｒｔｅｎｖｅｌｏｐ）信号被用于基于ＧＣＣ－ＰＨＡＴ的声源估计，再通过一种可靠的几何定位方法定位出声源轴向角．该系统成本低廉、实时性好，可用于家庭服务机器人．２００９年Ｈｕ等利用基于特征结构（ｅｉｇｅｎｓｔｒｕｃ—ｔａｒｅ）的ＧＣＣ方法估计多个声源的时延”…．多声源情况下麦克风接受信号的频域表示为ｋ＝∑：：．ｎ—ｓｅ一“＋Ⅳｍ．式中：Ｄ为声源个数．接收信号互相关矩阵的特征分解为Ｒ地（埘）＝（∑：．．ｘ（∞，七）】，Ｔ（埘，七））／Ｋ＝∑二。Ａ．（ｍ）ｙｉ（∞）口（ｍ）．式中：ｘ为特征值，’，为特征向量．与前西个最大特征值对应的向量表示声源向量，利用声源向量的ＧＣＣ方法进行时延估计．文献［１７］利用声速的求出声源个数Ｄ，定位阶段。利用最小均方估计求解超定线性方程组定位多个声源，近场情况下求解声源三维直角系坐标，远场情况下求解声源轴向角．图３为该系统搭载在移动机器人平台上的８通道麦克风阵列．民（ｒ）＝∑：：：置（＾）玛＋（＾）ｅ４“‘．每个波束输出功率可以通过Ⅳ（ＪＩｖ—１）／２个互相关万方数据智能系统学报第７卷累积和求得．谱加权在互相关求解中给信噪比大的频带赋予更大的权值，有效地抑制了窄带噪声的影响．另外为了避免声源的错误检测，一个基于声源存在概率的后处理算法被提出．２００９年Ｂａｄａｌｉ和Ｖａｌｉｎ等利用如图２所示的麦克风阵列测试了可控响应功率（ｓｔｅｅｒｅｄｒｅｓｐｏｎｓｅｐｏｗｅｒ）和其他算法的性能…】．运用谱加权用于抑制噪声，方向优化算法是在ＤＳＢ算法定位的结果临近范围内应用高分辨率方法，从而更精确地定位声源．上述２篇文献的麦克风阵列如图２所示，图４显示了２种球形搜索网格．文献［２６］的实验结果显示三角网格声源搜索策略相较于矩形网格更有效。三角网格共２５６２个搜索占．每个援索区域覆薷２．５０．８通道麦克风阵列定位多声源，并利用粒子滤波（ｐｍｉ－ｄｅｆｉｌｔｅｒ）方法融合房间麦克风阵列和机器人麦克风阵啊ｆ竹定牛杵早即踪影个甫浮底∥想目ｌ球形搜熏嘲格圈６分布式麦克风阵列ｎｇ．６ＩＩ缸ｔｒｉｌｍｔｅｄｍｉｃｒｏｐｈｏｎｅａｒｒａｙ２００６年Ｓａｓａｋｉ等利用３２通道３同心圆阵列通过机器人的运动定位多声源的二维位置”“．首先利用基本ＤＳＢ算法减弱噪声，然后通过频带选择算法（ｆｉ＇ｅｑｕｅｎｃｙｂａｎｄｓｅｌｅｃｔｉｏｎ）消除剩余噪声并定位出多声源的水平方向，最后根据运动的机器人可以在不同的位置检测同一个声源的方向，通过三角定位方法和ＲＡＮＳＡＣ算法（ｒａｎｄｏｍｓａｍｐｌｅｃｏｎｓｅｎｓｕｓ）定位脚４ｓＩ知蝻咖∞岫舭２００４年Ｔａｍａｉ等利用搭载在Ｎｏｍａｄ机器人上的平面圆形３２通道麦克风阵列定位１—４个声源的水平方向和垂直方向”１．由于麦克风数量较多，ＤＳＢ算法可以很好地抑制环境噪声和机器人机体噪声．文献［２８］提出了一种３个圆形阵列组成的３２通道阵列，相较于一个圆形阵列具有更好的波束方向图分布．以上２种阵列如图５所示．出声源的精确位置．２００７年他们通过主瓣消除算法（ｍａｉｎ－ｌｏｂｅｃａｎｃｅｌｉｎｇ）从ＤＳＢ算法得出的空间谱中逐个检测声源的位置”Ｊ．每次检测出当前具有最大能量的方向作为当前声源的方向，然后减除该方向的主瓣继续检测下一个声源．主瓣消除算法需要阵列方向图具有较小的旁瓣．图７显示了同心圆阵列和八边形３２通道麦克风阵列，八边形阵列在７００—２５００Ｈｚ的频率范围内旁瓣能量较小．Ｋａｇ—ｉ等利用文献［３２］中的声源方向定位和粒子滤波方法，通过机器人的运动定位静止声源的精确位置”“．２０１０年Ｓａｓａｋｉ等综合上述的声源定位功能，并进行短时声音信号识别以标定声源…１，通过跟踪多个声源，画出声源图并定位机器人的位置．量、、二遘遣二睾壹元ｒＩ：：＝车一３２－ｅｈ２－Ｄｎ昏５ｍｈ唧妇ａｒｒａｙ剖¨Ｃ１加晒年Ｎａｋｅｄａｉ等利用６４通道分布式麦克风阵列在电视等噪声环境中检测真实语音信号９Ｊ，并定位声源的平面二维位置．图６为麦克风阵列，麦克风分布在１．２ｍ高度的墙壁和高度为０．７ｍ的桌面上．加权ＤＢＳ用于求解每个可能方向的方向性模式（ｄｌｒｅｄｉ“ｔｙｐａｔｔｅｒｎ），方向性模式用于检测麦克风接收信号是否为真实的语音信号，并定位声源．２００６年他们在文献［３０］中基于ＭＵＳＩＣ方法利用搭载在ＡＳｌＭＯ机器人头部的ｊｏ耋匿＿ｔ，、．三睁葺｛Ｊｒｍ【ｉｌｌ｜ｔ：ｅｌ｜ｔｌ’ｉｃｌｉｆｔ．１、ａｌｌ（１ＩＫｔ。ｔ圳¨１ｔ●１．１Ｔ２．３肓分辨率谱估计技术该方法来源于现代高分辨率谱估计技术，如自回归模型（ａｕｔｏｒｅｇｒｅｓｓｉｖｅ）汹】、多重信号分类（ｍｕｌｔｉ－ｐｋｓｉｇｎａｌｃｌａｓｓｉｆｉｃａｔｉｏｎ，ＭＵＳＩＣ）洋。等方法，利用特万方数据第１期李晓飞．等：机器人听觉声源定位研究综述征值分解（ｅｉｇｅｎｖａｌｕｅｄｅｃｏｍｐｏｓｉｔｉｏｎ）将麦克风信号的协方差矩阵分解为信号子空间和噪声子空间，然后找出与噪声子空间正交的方向矢量来进行声源的方向估计．基于高分辨率谱估计的定位方法是一种超分辨率的估计技术．其空间分辨率不会受到信号采样频率的．并且在一定条件下可以达到任意定位精度”“．然而．该类方法也存在一定的不足，主要表现在：１）易受空间相关噪声的干扰，当方向性噪声的能量与声源信号能量相当时，该算法容易定位到噪声方向；２）房间的反射作用使信号和干扰之间有一定的相关性，从而降低了该方法的有效性；３）需要对整个空间进行搜索来确定声源的位置，且其估计精度与空间的细分程度有关，计算复杂度偏高．１９９９年Ａｓａｎｏ等利用搭载在办公室机器人Ｊｉｊｏ－２上的平均分布于半圆弧的平面８通道麦克风阵列定位多个声源的轴向角”“．扩展的ＭＵＳＩＣ算法被用于近场定位，近场方向向量为口（ｒ．口）＝ｆｅ－Ｊ埘ｌ（删’ｅ１晰２（㈣…ｅ一Ⅳ“删］７．式中：ｒ和０分别为声源的水平距离和轴向角．大多数机器人听觉声源定位系统接收的声源信号是宽带信号，原始的ＭＵＳＩＣ算法只能定位窄带信号．２００７年Ａｒｇｅｎｔｉｅｒｉ等给出ＭＵＳＩＣ算法的宽带声源扩展…１，近场ＭＵＳＩＣ空间谱为＾（ｒ，８）＝１／’，１（ｒ，口）兀。，ｙ（口，口）．式中：ｙ为可能声源位置的方向向量，兀为噪声子空间．令空间谱最大的方向向量对应于声源位置，一种朴素的宽带扩展方法为置宽带ＭＵＳＩＣ的声源个数上限，实验证明这种方法与已知声源个数情况下的定位性能差不多．图８显示了该机器人平台和１４通道的稀疏麦克风阵列．Ⅲ１稀疏至克』砒晖州Ⅲ龟．８Ｓｐａｒｓｅｍｉｃｒｏｐｈｏｎｅａｒｒａｙ２．４双耳听觉人可以通过双耳定位３－Ｄ空间声源方向，双耳时间差（ｉｎｔｅｒａｕｒａｌｔｉｍｅｄｉｆｆｅｒｅｎｃｅ，ｒｒＤ）和双耳强度差（ｉｎｔｅｒａｕｒａｌｉｎｔｅｎｓｉｔｙｄｉｆｆｅｒｅｎｃｅ，ＩＩＤ）用于定位声源轴向角。由耳廓衍射和散射效应带来的声谱特性（ｓｐｅｃｔｒａｌｃｕｅ）用于定位声源仰角…Ｊ．声音信号从声源位置传播至人耳鼓膜处的传输函数被称为头部相关传递函数（ｈｅａｄ－ｒｅｌａｔｅｄｔｒ∞ｓｆｅｒｆｕｎｃｔｉｏｎｓ，ＨＲＴＦｓ）…Ｊ。影响ＨＲＴＦｓ的因素有耳廓、头部、耳道、肩膀和躯体等．基于双耳的声源定位方法对于仿人机器人是一种自然、有效的方式，利用人工头和人工耳廓可以有效地模仿人的听觉定位能力”ｏ．Ｎａｋａｄａｉ等基于仿人机器人ＳＩＧ的双耳听觉定位声源轴向角……．由立体视觉扩展的听觉Ｅｐｉｐｏ－ｌ”几何可以数学化地估计出特定声源方向的ＩＰＤ：△妒。＝２兀，｝（０＋ｓｉｎ日）向，其中，、ｒ、０和口分别为信号频率、头部半径、声源角度和声速．一般，小于１５００Ｈｚ．可能声源方向和实测信号的ＩＰＤ之差最小的为声源方向．Ｅｐｉｐｏｌａｒ几何很难确定出精确的ＩＩＤ，只能通过频率大于ｌ５００Ｈｚ的频带确定出声源的大概方向．利用物理学中的散射理论（ｓｃａｔｔｅｒｉｎｇｔｈｅｏｒｙ）也可以数学化地估计ＩＰＤ△亿（口，，）和ＩＩＤ如。（口∞，同样分别采用小于和大于１５００Ｈｚ的频带，相较于Ｅｐｉｐｏｌａｒ几何散射理论的ＩＰＤ估计误差更小。并且可以较精确地估计出ｌｉＤ．利用Ｄｅｍｐｓｔｅｒ．Ｓｈａｌｅ理论联合ＩＰＤ和ＩＩＤ信息．联合概率取最大的可能位置为声源位置．２００５年Ｋｕｍｏｎ等根据声波在耳廓中反射决定的声谱特性（ｓｐｅｃｔｒａｌｃｕｅ）设计了一个人工耳廓ｍ］．耳廓形状如图９所示，耳廓必须关于声源仰角非对称以保证可以区分不同仰角的声源信号．该耳廓对于仰角大于９０。的声源具有较明显的谱峰（ｓｐｅｃｔｒａｌｐｅａｋ）．２００６年Ｓｈｉｍｏｄａ等改进了文献［４９］中设计＾ｄ。（ｒ，ｐ）＝∑：：。ｋ（ｒ，Ｏ）／Ｂ．式中：ｂ为信号频点数．Ｂ为频带宽度．实验证明该宽带扩展方法性能很好，但计算量太大．波束空间算法利用频率和范围不变的波束形成聚焦频点，生成一个对所有兴趣频点有效的空间谱．２００９年Ｎａｋａｍｕｒａ等利用广义特征值分解抑制空间相关噪声的影响…１，在静音段估计出噪声的空间互相关矩阵，对带噪声源信号的互相关矩阵和噪声的互相关矩阵进行广义特征值分解，生成一个完全抑制噪声的空间谱．２０１１年他们联合视觉跟踪算法．利用粒子滤波进行说话人的跟踪”“．２００９年１８Ｉｌｉ测试了ＭＵＳＩＣ方法在办公室环境和室外环境下定位轴向角的性能…１．办公室环境存在空调噪声和机器人机体噪声．室外环境存在背景音乐噪声．他们分别测试了信号分帧长度对方向估计性能和实时性的影响，宽带ＭＵＳＩＣ频带宽度和声源个数对方向估计的影响．另外还提出了一种确定声源个数的方法。对每个频率采用固定声源数，并设万方数据智能系统学报第７卷的人工耳廓的仰角定位算法侧．由于机器人头部运动是连续的，所以声谱特性变化也是连续的，即相邻时刻的声谱特性不会产生突变．根据此特性对长时闹怜岬＿卉々甫、竹ｊ’ｆｔ．１卅｛■’皇＿々九节ｆ。盯特蔫：’ｒ‘、寸ｉｉ廿｝ｋ’ｌ１．｛ｌ二’：｝４【Ｈ＿Ｉ・『ｏ㈠＂崮ｔ’人工耳肝Ｆｉｇ，９Ａｒｔｅｒｉａｌ—ｍ＿ｅ２００６年Ｈｏｍｓｔｅｉｎｄ等利用人工耳廓和人工头模拟人的听觉定位”“．人工头模型如图１０所示，通过ＩＴＤ、ｌｉＤ和谱谷（ｓｐｅｃｔｒａｌｎｏｔｃｈｅｓ）定位声源的轴向ｍ剐…】ｍ¨托：ｊＩ｜Ｊ“、州｝０川，㈦￥图Ⅲ人工头部柏耳廓Ｆｉｇ．１０Ａｎ蛐删ｂｅａｄａｎｄｐｒｉｍｅ２００６年Ｋｅｙｒｏｕｚ等利用人工头和人工双耳¨，』分离和定位２个声源的轴向角和仰角”Ｊ，一种时域的盲源分离算法被用于分离２个且相距不太近的声源．令第１个声源到第２个分离信号的冲激响应为Ｃ。第２个声源到第１个分离信号的冲激响应为ｃ２．，则声源到麦克风的冲激响应＾需满足：Ｃ１２＝ｈ¨１１０１２＋ｈｎ∞≈＝０，（１）Ｃ２Ｉ。屯１ｗｌｌ＋ｈｎｔ０２ｌ＝ｏ．（２）式中：∞为解混冲激响应．通过式（１）、（２）可以分别求出２个声源方向的ＨＲＴＦｓ，进一步可以定位声源的全向轴向角和仰角．２００８年Ｒｏｄｅｍａｎｎ等利用仿人耳蜗和双麦克风进行声源的３一Ｄ方向定位０１，耳蜗和机器人如图１１所示．在提取ｒｒＤ、ｌｉＤ和ｓｐｅｃｔｒａｌＣＵｅ前先进行双耳信号的同步谱减去噪．为了消除声源信号特性对声万方数据谱特性的影响，用左右耳对数谱之差表示声谱特性：Ｓ（％）＝ｌｇ（ｊ，（＆））一ｌｇ（；ｌ（ｋ））．２０１０年他们在文献『５４］中联合声音幅度、谱幅度、ｒｉｄ和ＩＩＤ定位声源的ｍ高≤１曼一图１１仿人耳廓和机器人Ｆｉｇ．１１Ｈｕｍａｎｏｉｄｐｉｍｍｅａｎｄｒｏｂｏｔ２０１１年Ｋｉｍ等为了降低基于信号相关的时延估计算法的信号采样率对定位分辨率的影响，利用最大似然方法找出最大化互功率谱之和的声源轴向角，分辨率达到１ｏ［ＳＳ］．另外考虑机器人球形头部带来的多径效应，一个基于ｆｒｏｎｔ—ｂａｃｋ的多径补偿因子被用来修正时延估计．２０１１年Ｓｋａｆ等”ｏ测试了放置在一个椭球人工头上的８８对对称双耳的定位性能，ｌＩＤ和ＩＴＤ被分别测试，实验结果显示，综合ＩＩＤ和ＩＴＤ性能时双耳放置在人工头的后下方性能最优．人工头及双耳位置如图１２所示．厂１Ｌ一圈１２■优双耳位Ｉｎ昏１２ＯｐａｍｌｐｏｓｉｔｋｍｏｆｔｗｏⅫ２．５机器学习Ｓａｘｅｎａ等利用单麦克风和人工耳廓基于机器学习方法定位声源方向田】．不同声源方向到麦克风的传输函数不同．用隐马尔可夫模型表示时变的麦克风信号Ｅ，则声源方向可以通过式（３）估计。式（３）可以通过前向—后向算法求解，以１５０的步长遍历轴向角求解ａ．ａ＝ａｒｇ印ⅡＰ（ｙ２，Ｅ，…，蚌１日）．（３）２．６主动听觉文献［５８］指出机器人的感知能力应该是主动的，可以通过机器人的移动和传感器参数的控制获得更好的感知环境．该文基于ＳＩＧ人形机器人的头第１期李晓飞，等：机器人听觉声源定位研究综述部转动建立了主动听觉系统，通过头部的转动可以调节双耳麦克风垂直于声源方向以取得更好的定位性能．机器人头部和摄像机的马达转动、齿轮、传送带和滚珠会带来内部噪声，由于离麦克风较近，所以会极大影响声源定位性能，因此自适应滤波器被用于抑制内部噪声．文献［５９］提出感知一马达（ｓｅｎｓｏｒｙ－ｍｏｔｏｒ）融合的概念：感知信息指导马达的运动和导航，通过机器人的运动消除双耳声源定位算法的前后向混淆．２０１１年Ｍａｒｔｉｎｓｏｎ等用３台Ｐｉｏｎｅｅｒ３－ＡＴ机器人分别搭载２、１和１个麦克风组成动态可重置的麦克风阵列…】，如图１３所示．对于给定的兴趣区域，吸引／排斥模型可以动态优化各麦克风位置以获得更好的声源定位性能．ＳＩＧ机器人注意力的转移㈦６“］，其中听觉事件为声源方向估计，视觉事件为多人人脸检测．Ｌｖ等利用视觉物体检测修正听觉声源定位结果㈣１．Ｌｅｅ等利用视觉信息在多个人中区分出真正的说话者‘刚．３机器人听觉系统分析３．１麦克风阵列类型声源定位系统的麦克风数量和拓扑主要取决于声源定位方法，一般情况下ＴＤＯＡ方法、高分辨率方法和波束形成方法需要的麦克风数量依次增多．麦克风阵列类型如表ｌ所示．襄１麦克风阵列类型Ｔａｂｌｅ１Ｔｙｐｅｓｏｆｍｉｃｒｏｐｈｏｎｅａｒｒａｙ麦克风阵列类型三维阵列二维阵列稀疏阵列分布式阵列动态阵列双麦克风单麦克风阵列举例图１—３图５、７图８图６图１３图９—１１文献［５７］【ｏ。、Ｆｉｇ．１３’冉息互五，阵々ｌ二维和三维阵列一般为规则拓扑麦克风阵列，如ｉ眭、三角形、多边形、多面体阵列等，分Ｎｊｌｓｆｉ－－维平面和三维空间声源定位能力．面向机器人听觉的声源定位的麦克风阵列应该易搭载在机器人平台上，通常要求阵列的小型化，包括麦克风数量的减少和阵列尺寸的减小．实时性是人机交互的重要特点，因此实时的机器人听觉系统声源定位要求选取计算复杂度低的定位方法，一般来讲双耳定位和基于到达时间差的定位具有较小的计算复杂度，其次是基于高分辨率定位方法，基于波束形成方法的定位复杂度较高．双麦克风模拟人耳听觉，通常需要借助人工头和耳廓的辅助，并且精确的头部相关传递函数较难获取．３．２机器人听觉声源定位系统Ｄ”Ⅲ砌ｃｍｉｃｒｏｐｈｏｎｅａｒｒａｙＰｏｒｔｅｌｌｏ等建立了一个动态双耳听觉模型”“，麦克风和声源相对运动的动态ｒｉｄ模型给无味卡尔曼滤波器提供了一个ｇｒｏｕｎｄｃｒｅｄｉｂｌｅ等式，以确定声源的距离和轴向角的定位，该算法不适用于声源和传感器之间高速相对运动的情况．Ｋｕｍｏｎ提出一种主动软耳廓”１，软耳廓由具有弹性的硅橡胶制成，背面覆盖一层皮毛，以保证耳廓的单向性．耳廓可以旋转和变形以提供主动听觉声源定位能力，软耳廓如图１４所示．笔者利用搭载在移动机器人平台上的二维平面４通道十字型麦克风阵列定位说话人的轴向角和距离，以进行友好、有效的人机交互．文献［６７］提出指导性谱时定位方法（ｇｕｉｄｅｄＳＴｐｏｓｉｔｉｏｎａｌｇｏｒｉｔｈｍ），通过粗定位结果估计的声场条件进行二次精确定位，可以有效地消除混响的影响．文献［６８］提出一种基于时间差特征的空间栅格匹配（ｓｐａｔｉａｌｇｒｉｄｍａｌｃ・ｈｉｎｇ）算法，找到与待定位声源的时间差特征最匹配的栅格作为声源位置．该方法可以有效地避免几何定位方法的非线性方程组求解问题，复杂度较低．并且合理的麦克风阵列拓扑可以避免几何定位方法可能陷入局部最优点的问题．移动机器人和麦克风阵列如图１５所示．圈１４软耳廓Ｆｉｇ．１４Ｓｏｆｔｐｉｎｎａｅ２．７视昕融合技术基于视觉的物体检测与跟踪在光照条件好、视野无遮挡的情况下具有更好的性能．融合听觉信息与视觉信息可以极大提高各传感器单独的感知能力．０ｋｕｎｏ和Ｎａｋａｄａｉ等融合听觉事件形成的听觉流与视觉事件形成的视觉流生成联合流，以控制万方数据。‘能系统学报第７卷然后基于时间差特征，利用蒙特卡洛方法为每个栅格训练一个混合高斯模型，该模型表示平均分布于栅格内的时间差特征．定位阶段。声源定位的问题可以表示为ＧＪｏｃａｒｇｍａｘＰ（ｒＩＧ）・式中：Ｇ表示栅格，ＧＩ表示声源栅格．计算出未知声源的时间差特征相对于所有栅格的似然值，似然值最大的栅格被定位为声源栅格．另外有效特征检测算法利用信号时间差之间的约束移除错误的时间差，提高了定位性能．并且决策树提供了一种由粗到细的定位方式，极大减少了未知声源的时间差与栅ｒｏｂｏｔａｎｄｍｉｃｒｏｐｕｏｎｅａｒｒａｙ（ａ）移明机器人圈１５移动机器人和麦克风阵列ｌ砘．１５Ｍｏｂｉｌｅ格的匹配次数．实验测试了４ｍ以内的２０１６组数据，轴向角栅格精度为１。，距离分为０一１．５ｍ、１—２ｍ和ｌ＿５～４ｍ３个栅格．轴向角测量误差小于５０的定位率超过９５％，距离定位率超过９０％，可以有效定位说话人的方位和说话人是否处于人机交互的安全距首先，利用谱加权Ｃ，ＣＣ—ＰＨＡＴ方法求出各个麦克风对之间的信号时间差，６个时间差组成时间差特征序列：ｔ＝（下１２，ｆ１３，ｒ…％，ｒ斟，ｒ３４）．可以证明，时间差特征与声源位置是一一对应的，即一个特定的时间差对应一个特定位置，反之亦然；另外２个声源位置之间的时间差特征的差与声源的位置之差成正比，即２个声源距离越远，另外２个位置的时间差特征的差越大．根据这２个特点，可以把二维平面按照某种方式分割成栅格，每个栅格内的声源看作同一类声源，平面栅格如图１６所示．离．而且听觉声源定位结果控制机器人转向说话人，使说话人在摄像头的视野范围之内，基于视觉的人体检测技术被用于更精确的目标人定位，以进行进一步的人机交互．３．３机器人听觉声源定位系统分析一个机器人听觉声源定位系统可以从麦克风阵列拓扑、麦克风数量、声源定位能力、声源个数、抗噪声和混响能力、定位性能等方面来评价，其中定位能力指是否能进行声源轴向角、仰角和距离的定位．表２列出了基于三维麦克风阵列、二维麦克风阵列和双耳的７个典型声源定位系统，其中声源个数只是列出了相关文献中实验测试的声源个数，不能完全反映该声源定位系统的能办．因为机器人听觉声源禳淹≮粼麦，嵝—／、０、＼＇水｛定位算法发展的时间较短，并没有公共的测试实硷数据库或实验平台；所以不同系统的实验场景和性能测量标准不同，本文只列出了相关文献中公布的图１６平面橱格ｒｉｇ．１６Ｈｏｍａａｔａｌｇｒｉｄ定位性能．衰２典型机器人听觉声曩定位蕞统的分析Ｔａｂｌｅ２Ａ叫ＩＩ扣缸ｏｆ白ｒｐｌｅａｌｓｏｕｎｄ轴雌Ｉｏｃ蝴ｚａｔｉｏｎ母岫ｆｏｒｒｏｂｏｔ舢蜥ｎ声源敷Ｉ１—２作者及文献Ｊ．Ｍ．Ｖａｌｉｎｔ”１Ｈ．Ｌｉ［“１麦克风阵列定位方法定位能力轴向角轴向角、仰角芸翥喜抗噪声抗混响定位性能精度：３ｍ之外、声源３。误差：单声源小于５。８通道、三维阵列ＴＤＯＡ４通道、三维阵列ＴＤＯＡＹ．ＴＡｌｔ¨ｄｍ，弛通道、二维阵列ＤＳＢ㈨轴慌仰角胤抗噪声蒋嚣２黧；、竺多个１—２１２Ｙ．ｓｔＢ出㈨Ｋ．№ｋｍｍ…Ｋ．Ｎａｋａｄ．ｓｉｔ糟１３２通道、二雏阵列ＤＳＢ８通道双耳、头部双耳、头部、耳廓ＧＥＶＤＢｉｎａｕｒａｌＢｉｎａｕｒａｌ轴向角、距离轴向角１８０。轴向角轴向角、仰角一抗噪声一一误差：平均２８２叫定位事：１００％精度：ｌＯ。Ｆ．Ｋｅｙｒｏｍ［８１精度：轴向角竺、仰角１０。万方数据第１期李晓飞，等：机器人听觉声源定位研究综述・１７・４总结与展望机器人听觉声源定位系统的应用场景主要有家庭环境、公共场所、危险环境和一些其他特定场景中，面向的声源有人的语音和其他各种声源，主要包括以下几类应用：１）服务机器人：声源定位系统提供了一种自然、高效的人机交互方式，主要应用在家庭、商场等环境．服务机器人定位的声源通常为人的语音，并且面临复杂的噪声．２）接待机器人：在办公室或家庭等场所接待客人，引导客人的行动，一般具有一定的语音识别能力，如文献［２４］．３）军用机器人：战场声源的定位，如文献［６９］在城市环境基于军用无人车定位声、尖叫声．４）救援机器人：危险环境中救援任务的声源定位，如文献［７０］．在危险环境中，由于对人来说工作环境较为恶劣，因此机器人可以发挥较大的作用，比如救援、事故检测等．５）助残机器人：引导残疾人，特别是盲人的活动，如文献［７１］．与机器人的语音交互和机器人的引导可以极大地提高盲人的活动能力．自１９９５年，经过十几年的研究与探索，面向机器人听觉的声源定位技术取得了一定的成果，但系统的实用化还面临着一些问题，这些问题引导了未来的发展趋势：１）机器人的运动．机器人运动带来的麦克风阵列的运动是机器人听觉与传统声源定位技术主要的差别所在，运动的麦克风阵列会面临即时变化的声学环境，要求声源定位系统具有较高的实时性．现在大多数声源定位系统的传感器数量较多，导致算法计算复杂度较高．少量的麦克风和低复杂度的定位算法有待进一步探索．２）复杂的声学环境．几乎所有的实用声源定位系统必然面临着复杂的声学环境，存在各种类型的噪声．现有的抗噪声技术大多只是针对某类或某几类噪声有效，一种鲁棒的、对各种噪声广泛适用的抗噪声技术或方案也还有待进一步研究．３）阵列的小型化．机器人搭载平台要求麦克风的数量尽量少，阵列尺寸尽量小。并且通常麦克风数量的减少会有效降低运算量．现有的麦克风阵列大多需要专门的搭载平台，甚至需要辅助设备，实用化比较差．双耳声源定位的发展提供了更接近于人的定位方式和能力，但特制的人工头和耳廓，以及它们的数学模型的建立都带来了诸多不便．４）友好、智能的交互方式．人机交互中人应该万方数据是被动的，即不用通过某种不方便的主动方式与机器人交互．这就要求机器人可以主动、透明地与人交互，因此，智能声源定位技术的应用还与其他相关技术息息相关，并且一定程度上受到它们的制约，比如声音的检测与识别等．本文主要依据定位算法综述了机器人听觉声源定位技术，不同于传统的声源定位技术，智能机器人带来了一些新的问题，比如机器人平台对麦克风阵列结构的、机器人运动给声源定位带来的诸多问题、人机交互对实时性的要求、机器人特定的工作场景等．依据机器人技术的声源定位系统仍然有待进一步地总结与分析．总之，实时、精确的机器人系统与外界系统的交互是机器人听觉声源定位技术追求的目标．声源定位技术与机器人技术的融合带来了很多新的挑战，但更重要的是两者会互相促进对方的发展．参考文献：［１］ＩＲＩＥＲＥ．Ｒｏｂｕｓｔｓｏｕｎｄｌｏｃａｌｉｚａｔｉｏｎ：ａｎａｐｐｌｉｃａｔｉｏｎｏｆａｎａｕｄｉｔｏｒｙｐｅｒｃｅｐｔｉｏｎｓｙｓｔｅｍｆｏｒａｈｕｍａｎｏｉｄｒｏｂｏｔ［Ｄ］．Ｃａｍ—ｂｒｉｄｇｅ，ＵＳＡ：ＤｅｐａｒｔｍｅｎｔｏｆＥｌｅｃｔｒｉｃａｌＥｎｇｉｎｅｅｒｉｎｇａｎｄＣｏｍｐｕｔｅｒＳｃｉｅｎｃｅ，ＭＩＴ。１９９５．［２］ＫＮＡＰＰＣＨ，ＣＡＲＴＥＲＧＣ．Ｔｈｅｇｅｎｅｒａｌｉｚｅｄｃｏｒｒｅｌａｔｉｏｎｍｅｔｈｏｄｆｏｒｅｓｔｉｍａｔｉｏｎｏｆｔｉｍｅｄｅｌａｙ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＡｃｏｕｓｔｉｃｓ，Ｓｐｅｅｃｈ，ａｎｄＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ，１９７６，２４（４）：３２０－３２７．［３］ＯＭＯＬＯＧＯＭ，ＳＶＡＩＺＥＲＰ．ＡｃｏｕｓｔｉｃｓｏｕｒｃｅｌｏｃａｔｉｏｎｉｎｎｏｉｓｙａｎｄｒｅｖｅｒｂｅｒａｎｔｅｎｖｉｒｏｎｍｅｎｔｕｓｉｎｇＣＳＰａｎａｌｙｓｉｓ［Ｃ］／／ＩＥＥＥＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＡｃｏｕｓｔｉｃｓ，Ｓｐｅｅｃｈ，ａｎｄＳｉ伊“Ｐｒｏｃｅｓｓｉｎｇ．Ａｔｌａｎｔａ，ＵＳＡ，１９９６：９２１・９２４．［４］ＢＥＮＥＳＴＹＪ．Ａｄａｐｔｉｖｅｅｉｇｅｎｖａｌｕｅｄｅｃｏｍｐｏｓｉｔｉｏｎａｌｇｏｒｉｔｈｍｆｏｒｐａｓｓｉｖｅａｃｏｕｓｔｉｃ８０ｕｒｃｅｌｏｃａｌｉｚａｔｉｏｎ［Ｊ］．ＪｏｕｒｎａｌｏｆＡ－ｃｏｕｓｔｉｃａｌＳｏｃｉｅｔｙｏｆＡｍｅｒｉｃａ，２０００，１０７（１）：３８４－３９１．［５］ＤＶＯＲＫＩＮＤＴＧ，ＧＡＮＮＯＴＳ．Ｔｉｍｅｄｉｆｆｅｒｅｎｃｅｏｆａｒｒｉｖａｌｅｓｔｉｍａｔｉｏｎｏｆｓｐｅｅｃｈｓｏｕｒｃｅｉｎａｎｏｉｓｙａｎｄｒｅｖｅｒｂｅｒａｎｔｅｎｖｉ－ｒｏｎｍｅｎｔ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ。２００５，８５（１）：１７７－２０４．［６］ＨＡＨＮＷ。ＴＲＥＴｒＥＲＳ．Ｏｐｔｉｍｕｍｐｒｏｃｅｓｓｉｎｇｆｏｒｄｅｌａｙ—ｖｅｃｔｏｒｅｓｔｉｍａｔｉｏｎｉｎｐａｓｓｉｖｅｓｉｇｎａｌａｒｒａｙｓ［Ｊ］．ＩＥＥＥＴｒａｎｓ－ａｃｔｉｏｎｓｏｎＩｎｆｏｒｍａｔｉｏｎＴｈｅｏｒｙ，１９７３，１９（５）：６０８－６１４．［７］ＷＡＮＧＨ。ＣＨＵＰ．Ｖｏｉｃｅｓｏｕｒｃｅｌｏｃａｌｉｚａｔｉｏｎｆｏｒａｕｔｏｍａｔｉｃｃａｍｅｍｐｏｉｎｔｉｎｇｓｙｓｔｅｍｉｎｖｉｄｅｏｃｏｎｆｅｒｅｎｃｉｎｇ［ｃ］／／ＩＥＥＥＷｏｒｋｓｈｏｐｏｎＡｐｐｌｉｃａｔｉｏｎｓｏｆＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇｔｏＡｕｄｉｏａｎｄＡｃｏｕｓｔｉｃｓ．ＮｅｗＰａｌｔｚ．ＵＳＡ。１９９７：１８７－１９０．［８］ＳＣＨＡＵＨ。ＲＯＢＩＮＳＯＮＡ．Ｐａｓｓｉｖｅｓｏｕｒｃｅｌｏｃａｌｉｚａｔｉｏｎｅｍ．ｐｆｏｙｉｎｇｉｎｔｅｒｓｅｃｔｉｏｎｓｐｈｅｒｉｃａｌｓｕｒｆａｃｅｓｆｒｏｍｔｉｍｅ－ｏｆ－ａｒｒｉｖａｌｄｉｆｆｅｒｅｎｃｅ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＡｃｏｕｓｔｉｃｓ，Ｓｐｅｅｃｈ。ａｎｄＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ．１９８７，３５（８）：１２２３・１２２５．・１８・智能系统学报第７卷［９］ＨＵＡＮＧＪｉｅ，ＳＵＰＡＯＮＧＰＲＡＰＡＴ，ＴＥＲＡＫＵＲＡＩ，ｅｔａ１．Ｍｏｂｉｌｅｒｏｂｏｔａｎｄｓｏｕｎｄｌｏｃａｌｉｚａｔｉｏｎ［Ｃ］／／ＩＥＥＥ／ＲＳＪＩｎｔｅｒ－ｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＩｎｔｅｌｌｉｇｅｎｔＲｏｂｏｔｓａｎｄＳｙｓｔｅｍ．Ｇｒｅｎｏｂｌｅ，Ｆｒａｎｃｅ，１９９７：６８３－６８９．［１０］ＨＵＡＮＧＪｉｅ，ＫＵＭＥＫ，ＳＡＪＩＡ，ｅｔａ１．Ｒｏｂｏｔｉｃｓｐａｔｉａｌｓｏｕｎｄｌｏｃａｌｉｚａｔｉｏｎａｎｄｉｔｓ３．Ｄｓｏｕｎｄｈｕｍａｎｉｎｔｅｒｆａｃｅ［Ｃ］／／ＦｉｒｓｔＩｎｔｅｒｎａｔｉｏｎａｌＳｙｍｐｏｓｉｕｍｏｎＣｙｂｅｒＷｏｒｌｄｓ（ＣＷ２００２）．Ｔｏｋｙｏ，Ｊａｐａｎ，２００２：１９１—１９７．［１１］ＬＩＨＫ，ＹＯＳＩＡＲＡＴ，ＺＨＡＯＱＦ．ＡｓｐａｔｉａｌｓｏｕｎｄＩｏｃａｌｉ－ｚａｔｉｏｎｓｙｓｔｅｍｆｏｒｍｏｂｉｌｅｒｏｂｏｔｓ［ｃ１／／ＩＥＥＥＩｎｓｔｒｕｍｅｎｔａｔｉ∞ａｎｄＭｅａｓｕｍｍｅｎｔＴｅｃｈｎｏｌｏｇｙＣｏｎｆｅｒｅｎｃｅ．Ｗａｒｓａｗ，Ｐｏ－ｌａｎｄ。２００７：ｌ击．［１２］ＳＥＫＭＥＮＡＳ，Ｗ１ＫＥＳＭ，ＫＡＷＡＭＵＲＡＫ．Ａｎａｐｐｌｉｃａ－ｔｉｏｎｏｆｐａｓｓｉｖｅｈｕｍａｎ－ｒｏｂｏｔｉｎｔｅｒａｃｔｉｏｎ：ｈｕｍａｎｔｒａｃｋｉｎｇｂａｓｅｄｏｎａｔｔｅｎｔｉｏｎｄｉｓｔｒａｃｔｉｏｎ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＳｙｓｔｅｍｓ，Ｍａｎ，ａｎｄＣｙｂｅｒｎｅｔｉｃｓ，ＰａｒｔＡ：ＳｙｓｔｅｍｓａｎｄＨｕ－ｉｎｏｌａｓ，２００２，３２（２）：２４８－２５９．［１３］ＶＡＬＩＮＪＭ，ＭＩＣＨＡＵＤＦ，ＲＯＵＡＴＪ，ｅｔａ１．Ｒｏｂｕｓｔｓｏｕｎｄｓｏｕｒｃｅｌｏｃａｌｉｚａｔｉｏｎｕｓｉｎｇａｍｉｃｒｏｐｈｏｎｅａｒｒａｙｏｎａｍｏｂｉｌｅｒｏｂｏｔ［Ｃ］／／ＩＥＥＥ／ｆｔｓＪＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＩｎｔｅｌｌｉｇｅｎｔＲｏｂｏｔｓａｎｄＳｙｓｔｅｍ．ＬａｓＶｅｇａｓ，ＵＳＡ，２００３：１２２８．１２３３．［１４］ＲＵＤＺＹＮＢ，ＫＡＤＯＵＳＷ，ＳＡＭＭＵＴＣ．Ｒｅａｌｔｉｍｅｒｏｂｏｔａｕｄｉｔｉｏｎｓｙｓｔｅｍｉｎｃｏｒｐｏｒａｔｉｎｇｂｏｔｈ３Ｄｓｏｕｎｄｓｏｕｒｃｅｌｏｃａｌ－ｉｓａｔｉｏｎａｎｄｖｏｉｃｅｃｈａｒａｃｔｅｒｉｚａｔｉｏｎ［Ｃ］／／ＩＥＥＥＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＲｏｂｏｔｉｃｓａｎｄＡｕｔｏｍａｔｉｏｎ．Ｒｏｍａ，Ｉｔａｌｙ，２００７：４７３３４７３８．［１５］ＫＷＡＫＫＣ，ＫＩＭＳＳ．Ｓｏｕｎｄｓｏｕｒｃｅｌｏｃａｌｉｚａｔｉｏｎｗｉｔｈｔｈｅａｉｄｏｆｅｘｃｉｔａｔｉｏｎｓｏｕｒｃｅｉｎｆｏｒｍａｔｉｏｎｉｎｈｏｍｅｒｏｂｏｔｅｎｖｉｉ－ｏｎ．ｍｅｎｔｓ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＣｏｎｓｕｍｅｒＥｌｅｃｔｒｏｎｉｃｓ，２００８，５４（２）：８５２名５６．［１６］ＨＵＪＳ，ＣＨＡＮＣＹ，ＷＡＮＧＣＫ，ｅｔａ１．Ｓｉｍｕｌｔａｎｅｏｕｓ１０－ｃａｌｉｚａｔｉｏｎｏｆｍｏｂｉｌｅｒｏｂｏｔａｎｄｍｕｌｔｉｐｌｅｓｏｕｎｄｓｏｕｌ℃ｅ８ｕｓｉｎｇｍｉｃｒｏｐｈｏｎｅａｒｒａｙ［Ｃ］／／ＩＥＥＥＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＲｏｂｏｔｉｃｓａｎｄＡｕｔｏｍａｔｉｏｎ．Ｋｏｂｅ，Ｊａｐａｎ。２００９：２９出．［１７］ＨＵＪＳ，ＹＡＮＧＣＨ，ＷＡＮＧＣＫ．Ｅｓｔｉｍａｔｉｏｎｏｆｓｏｕｎｄｓｏｕｒｃｅｎｕｍｂｅｒａｎｄｄｉｒｅｃｔｉｏｎｓｕｎｄｅｒａｍａｌｔｉ－ｓｏｕｒｃｅｅｎｖｉｒｏｎ．ｍｅｎｔ［Ｃ］／／ＩＥＥＫ／ＲＳＪＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＩｎｔｅｌｌｉ－ｇｅｎｔＲｏｂｏｔｓａｎｄＳｙｓｔｅｍ．Ｌｏｕｉｓ，ＵＳＡ，２００９：１８１—１８６．［１８］ＬＥＥＢ。ＣＨＯＩＪＳ．Ｍｕｌｔｉ—ｓｏｕｒｃｅｓｏｕｎｄｌｏｃａｌｉｚａｔｉｏｎｕｓｉｎｇｔｈｅｃｏｍｐｅｔｉｔｉｖｅＫ・ｍＰ＿．ａｕｓｃｌｕｓｔｅｒｉｎｇ［Ｃ］／／ＩＥＥＥＣｏｎｆｅｒｅｎｃｅｏｎＥｍｅ晒ｎｇＴｅｃｈｎｏｌｏｇｉｅｓａｎｄＦａｃｔｏｒｙＡｕｔｏｍａｔｉｏｎ．Ｂｉｌｂａｏ，Ｓｐａｉｎ。２０ｌＯ：ｌ－７．［１９］ＨＡＨＮＷＲ．Ｏｐｔｉｍ，ｕｎｓｉ删ｐｒｏｃｅｓｓｉｎｇｆｏｒｐａｓｓｉｖｅｓｏｎａｒｒａｎｇｅａｎｄｂｅａｒｉｎｇｅｓｔｉｍａｔｉｏｎ［Ｊ］．ＪｏｕｒｎａｌｏｆＡｃｏｕｓｔｉｃａｌＳｏ－ｃｉｅｔｙｏｆＡｍｅｒｉｃａ，１９７５，５８（１）：２０１－２０７．［２０］ＣＡＲＴＥＲＧ．ＶａｒｉａｎｃｅｂｏｕｎｄｓｆｏｒｐａｓｓｉｖｅｌｙｌｏｃａｔｉｎｇａｎａｃｏｕｓｔｉｃｓｏｕｒｏＢ诮ｔｈａｓｙｍｍｅｔｒｉｃｌｉｎｅａｒｒａｙ［Ｊ］．ＪｏｕｒｎａｌｏｆＡｃｏｕｓｔｉｃａｌＳｏｃｉｅｔｙｏｆＡｍｅｒｉｃａ，１９ｒ７７，６２（４）：９２２－９２６．［２１］ＲＡＭＯＳＬＬ，ＨＯＬＭＳ，ＧＵＤＹＡＮＧＥＮＳ，ｅｔａ１．Ｄｅｌａｙ—ａｎｄ・ｓｕｎ］ｂｅａｍｆｏｒｍｉｎｇｆｏｒｄｉｒｅｃｔｉｏｎｏｆａｒｒｉｖａｌｅｓｔｉｍａｔｉｏｎａｐ－万方数据ｐｌｉｅｄｔｏｇｕｎｓｈｏｔａｃｏｕｓｔｉｃｓ［Ｃ］／／ＰｒｏｃｅｅｄｉｎｇｓｏｆＳＰＩＥＤｅ—ｆｅｎｓｅ，Ｓｅｃｕｒｉｔｙ，ａｎｄＳｅｎｓｉｎｇ．Ｏｒｌａｎｄｏ，ＵＳＡ，２０１１．［２２］ＫＡＪＡＬＡＭ．Ｆｉｌｔｅｒ－ａｎｄ—ｓｕｍｂｅａｍｆｏｒｍｅｒｗｉｔｈａｄｊｕｓｔａｂｌｅｆ＇ｄｔｅｒｃｈａｒａｃｔｅｒｉｓｔｉｃｓ［Ｃ］／／ＩＥＥＥＩｎｔｅｒｎａｔｉｏｈａｌＣｏｎｆｅｒｅｎｃｅｏｎＡｃｏｕｓｔｉｃｓ，Ｓｐｏｅｅｈ，ａｎｄＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ．ＳａｌｔｌａｋｅＣｉｔｙ。ＵＳＡ．２００１：２９１７－２９加，［２３］曹玮玮．基于麦克风阵列的声源定位与语音增强方法研究［Ｄ］．北京：清华大学，２００８．ＣＡＯＷｅｉｗｅｉ．Ｓｔｕｄｙｏｎｍｅｔｈｏｄｓｏｆｍｉｃｒｏｐｈｏｎｅａｒｒａｙｂｕｓｅｄｓｏｕｎｄｓｏｕｒｃｅｌｏｃａｌｉｚａｔｉｏｎａｎｄｓｐｅｅｃｈｅｎｈａｎｃｅｍｅｎｔ［Ｄ］．Ｂｅｉｊｉｎｇ：ＴｓｉｎｇｈｎａＵｎｉｖｅｒｓｉｔｙ，２００８．［２４］ＭＡＴＳＵＩＴ，ＡＳＯＨＨ，ＦＲＹＪ，ｅｔａ１．ＩｎｔｅｇｒａｔｅｄｎａｔｕｒａｌｓｐｏｋｅｎｄｉａｌｏｇｕｅｓｙｓｔｅｍｏｆＪｉｊｏ－２ｍｏｂｉｌｅｒｏｂｏｔｆｏｒｏｆｆｉｃｅｓｅｒｖｉｃｅｓ［Ｃ］／／ＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＳｉｘｔｅｅｎｔｈＮａｔｉｏｎａｌＣｏｎ—ｆｅｒｅｎｅｅｏｎＡｒｔｉｆｉｃｉａｌＩｎｔｅｌｌｉｇｅｎｃｅａｎｄｔｈｅＥｌｅｖｅｎｔｈＣｏｎｆｅｒ－ｅｎｃｅｏｎＩｎｎｏｖａｔｉｖｅＡｐｐｌｉｃａｔｉｏｎｓｏｆＡｒｔｉｆｉｃｉａｌＩｎｔｅｌｌｉｇｅｎｃｅ．ＭｅｎｌｏＰａｒｋ。ＵＳＡ，１９９９：６２１－６２７．［２５］ＶＡＬＩＮＪＭ，ＭＩＣＨＡＵＤＦ，ＨＡＤＪＯＵＢ．Ｌｏｃａｌｉｚａｔｉｏｎｏｆｓｉｍｕｌｔａｎｅｏｕｓｍｏｖｉｎｇｓｏｕｎｄｓｏｕｒｅｅｓｆｏｒｍｏｂｉｌｅｒｏｂｏｔｕｓｉｎｇａｆｒｅｑｕｅｎｃｙ—ｄｏｍａｉｎｓｔｅｅｒｅｄｂｅａｍｆｏｒｍｅｒａｐｐｒｏａｃｈ［ｃ］／／ＩＥＥＥＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅＯｉｌＲｏｂｏｔｉｃｓａｎｄＡｕｔｏｍａ－ｔｉｏｎ．ＮｅｗＯｒｌｅａｎｓ，ＵＳＡ，２００４：１０３３－１０３８．［２６］ＢＡＤＡＵＡ，ＶＡＬＩＮＪＭ，ＭＩＣＨＡＵＤＦ．Ｅｖａｌｕａｔｉｎｇｒｅａｌ—ｔｉｍｅａｕｄｉｏｌｏｃａｌｉｚａｔｉｏｎａｌｇｏｒｉｔｈｍｓｆｏｒａｒｔｉｆｉｃｉａｌａｕｄｉｔｉｏｎｉｎｒｏｂｏｔｉｃｓ［Ｃ］／／ＩＥＥＥ／ＲＳＪＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＩｎ．ｔｅｌｌｉｇｅｎｔＲｏｂｏｔｓａｎｄＳｙｓｔｅｍｓ．Ｓｔ．Ｌｏｕｉｓ，ＵＳＡ，２００９：２０３３－２０３８．Ｙ，ＫＡＧＡＭＩＳ，ＡＭＥＭＩＹＡＹ，ｅｔａ１．Ｃｉｒｃｕｌａｒｍｉ－ｃｒｏｐｈｏｎｅａｒｒａｙｆｏｒｒｏｂｏｔ’ｓａｕｄｉｔｉｏｎ［Ｃ］／／ＩＥＥＥＩｎｔｅｒｎａ－ｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＳｅｎｓｏｒｓ．Ｖｉｅｎｎａ，Ａｕｓｔｒｉａ，２００４：５６５－５７０．Ｙ，ＳＡＳＡＫＩＹ，ＫＡＧＡＭＩＳ．Ｔｈｒｅｅｒｉｎｇｍｉｃｒｏ－ｐｈｏｎｅａｒｒａｙｆｏｒ３Ｄｓｏｕｎｄｌｏｃａｌｉｚａｔｉｏｎａｎｄｓｅｐａｒａｔｉｏｎｆｏｒｍｏｂｉｌｅｒｏｂｏｔａｕｄｉｔｉｏｎ［Ｃ］／／ＩＥＥＥ／ＲＳＪＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎ．ｆｅｒｅｎｅｅｏｎＩｎｔｅｌｌｉｇｅｎｔＲｏｂｏｔｓａｎｄＳｙｓｔｅｍｓ．Ｅｄｍｏｎｔｏｎ，Ｃａｎａｄａ，２００５：４１７２－４１７７．Ｋ，ＮＡｌⅢＩＭＡＨ，ＹＡＭＡＤＡＫ，ｅｔａ１．Ｓｏｕｎｄｓｏｕｒｏｅｔｒａｃｋｉｎｇ硒ｔＩＩｄｉｒｅｃｔｉｖｉｔｙｐａｔｔｅｍｅｓｔｉｍａｔｉｏｎｕｓｉｎｇａ６４ｅｈｍｉｃｒｏｐｈｏｎｅａｒｒａｙ［ｃ］／／ＩＥＥＥ／ＲＳＪＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＩｎｔｅｌｌｉｇｅｎｔＲｏｂｏｔｓａｎｄＳｙｓｔｅｍｓ．Ｅｄｍｏｎｔｏｎ，Ｃａｎａｄａ，２００５：１６９０－１６９６．Ｋ，ＮＡｌｃＡＪＩＭＡＨ，ＭＵＲＡＳＥＭ，ｅｔａ１．Ｒｏｂｕｓｔｔｒａｃｋｉｎｇｏｆｍｕｌｔｉｐｌｅｓｏｕｎｄｓ∞ｌｒｃｅｓｂｙｓｐａｔｉａｌｉｎｔｅｇｒａｔｉｏｎｏｆｒｏｏｍａｎｄｒｏｂｏｔｍｉｃｒｏｐｈｏｎｅａ咖ｐ［Ｃ］／／ＩＥＥＥＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅ０１１１Ａｃｏｕｓｔｉｃｓ，Ｓｐｅｅｃｈ，ａｎｄＳｉｓ，瑚ｄＰｒｏｃｅｓｓｉｎｇ．Ｔｏｕｌｏｕｓｅ，Ｆｒａｎｃｅ，２００６：９２９－９３２．１］ＳＡＳＡＫＩＹ，ＫＡＧＡＭＩＳ，ＭＩＺＯＧＵＣＨＩＨ．Ｍｕｌｔｉｐｌｅｓｏｕｎｄｓｏｕｒｃｅｍａｐｐｉｎｇｆｏｒａｍｏｂｉｌｅｒｏｂｏｔｂｙｓｅｌｆ－ｍｏｔｉｏｎｔｒｉ扣喀血ｔｉｏｎ［Ｃ］／／ｌＥＥＫ／ＲＳＪＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｉｌＩｎｔｅｌｌｉ—ｇｅｎｔＲｏｂｏｔｓａｎｄＳｙｓｔｅｍｓ．ｔｈｉｊｉＩＩｇ。Ｃｈｉｎａ，２００６：３８０・３８５．［２７］ＴＡＭＡＩ［２８］ＴＡＭＡＩ［２９］ＮＡＫＡＤＡＩ［３０］ＮＡＫＡＤＡＩ［３第１期李晓飞，等：机器人听觉声源定位研究综述・１９－『３２］ＳＡＳＡＫＩＹ，ＫＡＧＡＭＩＳ，ＭＩＺＯＧＵＣＨＩＨ．Ｍａｉｎ－ｌｏｂｅｃａｎ—ｃｅｌｉｎｇｍｅｔｈｏｄｆｏｒｍｕｌｔｉｐｌｅｓｏｕｎｄｓｏｕｒｃｅｓｌｏｃａｌｉｚａｔｉｏｎｏｎｍｏｂｉｌｅｒｏｂｏｔ［Ｃ］／／ＩＥＥＥ／ＡＳＭＥＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＡｄｖａｎｃｅｄＩｎｔｅｌｌｉｇｅｎｔＭｅｃｈａｔｒｏｎｉｃｓ．Ｚｕｒｉｃｈ，Ｓｗｉｔｚｅｒ－ｌａｎｄ。２００７：ｌ－６．［３３］ＫＡＧＡＭＩＳ，ＴＨＯＭＰＳＯＮＳ，ＳＡＳＡＫＩＹ，ｅｔａ１．２Ｄｓｏｕｎｄｓｏｕｒｃｅｍａｐｐｉｎｇｆｒｏｍｍｏｂｉｌｅｒｏｂｏｔｕｓｉｎｇｂｅａｍｆｏｒｍｉｎｇａｎｄｐａｒｔｉｃｌｅｆｉｌｔｅｒｉｎｇ［Ｃ］／／ＩＥＥＥＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＡｃｏｕｓｔｉｃｓ，Ｓｐｅｅｃｈ，ａｎｄＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ．Ｔａｉｐｅｉ，Ｃｈｉｎａ，２００９：３６８９－３６９２．［３４］ＳＡＳＡＫＩＹ，ＴＨＯＭＰＳＯＮＳ，ＫＡＮＥＹＯＳＨＩＭ，ｅｔａ１．Ｍａｐ—ｇｅｎｅｒａｔｉｏｎａｎｄｉｄｅｎｔｉｆｉｃａｔｉｏｎｏｆｍｕｌｔｉｐｌｅｓｏｕｎｄＳＯＵｒｃｅｓｆｒｏｍｒｏｂｏｔｉｎｍｏｔｉｏｎ［Ｃ］／／ＩＥＥＥ／ＲＳＪＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＩｎｔｅｌｌｉｇｅｎｔＲｏｂｏｔｓａｎｄＳｙｓｔｅｍｓ．Ｔａｉｐｅｉ，Ｃｈｉｎａ，２０１０：４３７．４４３．［３５］ＳＣＨＭＩＤＴＲＯ．Ｍｕｌｔｉｐｌｅｅｍｉｔｔｅｒｌｏｃａｔｉｏｎａｎｄｓｉｇｎａｌｐａ－ｒａｍｅｔｅｒｅｓｔｉｍａｔｉｏｎ［Ｊ］．１ＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＡｎｔｅｎｎａｓａｎｄＰｍｐａｇａｔｉｏｎ，１９８６，３４（３３）：２７６—２８０．［３６］ＷＡＮＧＨ，ＫＡＶＥＨＭ．Ｃｏｈｅｒｅｎｔｓｉｇｎａｌｓｕｂｓｐａｃｅｐｒｏｃｅｓｓ－ｉｎｇｆｏｒｔｈｅｄｅｔｅｃｔｉｏｎａｎｄｅｓｔｉｍａｔｉｏｎｏｆａｎｇｌｅｓｏｆａｒｒｉｖａｌｏｆｍｕｌｔｉｐｌｅｗｉｄｅ－ｂａｎｄｓｏｕｒｃｅｓ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｍｏｎＡ－ｃｏｕｓｔｉｃｓ，Ｓｐｅｅｃｈ，ａｎｄＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ，１９８５，３３（４）：８２３－８３１．［３７］居太亮．基于麦克风阵列的声源定位算法研究［Ｄ］．成都：电子科技大学，２００６．ＪＵＴａｉｌｉａｎｇ．Ｒｅｓｅａｒｃｈｏｎｓｐｅｅｃｈｓｏｕｒｃｅｌｏｃａｌｉｚａｔｉｏｎｍｅｔｈ－ｏｄｓｂａｓｅｄｏｎｍｉｃｒｏｐｈｏｎｅａｒｒａｙｓ［Ｄ］．Ｃｈｅｎｇｄｕ：ＵｎｉｖｅｒｓｉｔｙｏｆＥｌｅｃｔｒｏｎｉｃＳｃｉｅｎｃｅａｎｄＴｅｃｈｎｏｌｏｇｙｏｆＣｈｉｎａ，２００６．［３８］ＡＳＡＮＯＦ，ＡＳＯＨＨ，ＭＡＴＳＵＩＴ．Ｓｏｕｎｄ８０ｕｒｃｅＩｏｃａｌｉｚａ－ｔｉｏｎａｎｄｓｉｇｎａｌｓｅｐａｒａｔｉｏｎｆｏｒｏｆｆｉｃｅｒｏｂｏｔ“Ｊｉｊｏ－２”［Ｃ］／／ＩＥＥＥＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＭｕｈｉｓｅｎｓｏｒＦｕｓｉｏｎａｎｄＩｎｔｅｇｒａｔｉｏｎｆｏｒＩｎｔｅｌｌｉｇｅｎｔＳｙｓｔｅｍｓ．ＴＭｐｅｉ，Ｃｈｉｎａ，１９９９：２４３．２４８．［３９］ＡＲＧＥＮＴＩＥＲＩＳ．ＢｒｏａｄｂａｎｄｖａｒｉａｔｉｏｎｓｏｆｔｈｅＭＵＳＩＣｈｉｇｈ－ｒｅｓｏｌｕｔｉｏｎｍｅｔｈｏｄｆｏｒｓｏｕｎｄｓｏｕｒｃｅｌｏｃａｌｉｚａｔｉｏｎｉｎｒｏｂｏｔｉｃｓ［Ｃ］／／ＩＥＥＥ／ＲＳＪＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＩｎｔｅｌｌｉｇｅｎｔＲｏｂｏｔｓａｎｄＳｙｓｔｅｍｓ．ＳａｎＤｉｅｇｏ。ＵＳＡ，２００７：２００９－２０１４．［４０］ＮＡＫＡＭＵＲＡＫ，ＮＡＫＡＤＡＩＫ，ＡＳＡＮＯＦ，ｅｔ８．１．Ｉｎｔｅｌｌｉ－ｇｅｎｔｓｏｕｎｄｓｏｕｒｃｅｌｏｃａｌｉｚａｔｉｏｎｆｏｒｄｙｎａｍｉｃｅｎｖｉｒｏｎｍｅｎｔｓ［Ｃ］／／ＩＥＥＥ／ＲｓＪＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＩｎｔｅｌｌｉｇｅｎｔＲｏｂｏｔｓａｎｄＳｙｓｔｅｍｓ．Ｓｔ．Ｌｏｕｉｓ，ＵＳＡ。２００９：６６４－６６９．［４１］ＮＡＫＡＭＵＲＡＫ，ＮＡＫＡＤＡＩＫ，ＡＳＡＮＯＦ，ｅｔａ１．Ｉｎｔｅｌｌｉ－ｇｅｎｔｓｏｕｎｄｓｏｕｒｃｅｌｏｃａｌｉｚａｔｉｏｎａｎｄｉｔｓａｐｐｌｉｃａｔｉｏｎｔｏｍｕｌｔｉ・ｍｏｄａｌｈｕｍａｎｔｒａｃｋｉｎｇ［Ｃ］／／ＩＥＥＥ／ＲＳＪＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎ－ｆｅｒｅｎｃｅｏｎＩｎｔｅｌｌｉｇｅｎｔＲｏｂｏｔｓａｎｄＳｙｓｔｅｍｓ．ＳａｎＦｒａｎｃｉｓｃｏ，ＵＳＡ。２０１ｌ：１４３—１４８．［４２］ＩＳＨＩｃＴ，ＣＨＡＴＯＴＯ．ＩＳＨＩＧＵＲＯＨ，ｅｔａ１．ＥｖａｌｕａｔｉｏｎｏｆａＭＵＳＩＣ・－ｂａｓｅｄｒｅａｌ・・ｔｉｍｅｓｏｕｎｄｌｏｃａｌｉｚａｔｉｏｎｏｆｍｕｌｔｉｐｌｅｓｏｕｎｄ８０ｕｒｅｅｓｉｎｒｅａｌｎｏｉｓｙｅｎｖｉｒｏｎｍｅｎｔｓ［Ｃ］／／ＩＥＥＥ／ＲＳＪＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＩｎｔｅｌｌｉｇｅｎｔＲｏｂｏｔｓａｎｄＳｙｓ－ｔｅｒｎｓ．Ｓｔ．Ｌｏｕｉｓ。ＵＳＡ。２００９：２０２７．２０３２．万方数据［４３］ＬＹＯＮＲＦ．Ａｃｏｍｐｕｔａｔｉｏｎａｌｍｏｄｅｌｏｆｂｉｎａｕｒａｌｌｏｃａｌｉｚａｔｉｏｎａｎｄｓｅｐａｒａｔｉｏｎ『Ｃ１／／ＩＥＥＥＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＡ—ｃｏｕｓｔｉｃｓ，Ｓｐｅｅｃｈ，ａｎｄＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ．Ｂｏｓｔｏｎ，ＵＳＡ，１９８３：１１４８－１１５１．［４４］ＡＬＧＡＺＵＶＲ，ＤＵＤＡＲＯ，ＭＯＲＲＩＳＯＮＲＰ，ｅｔａＪ．ＳｔｒｕｃｔｕｒａｌｃｏｍｐｏｓｉｔｉｏｎａｎｄｄｅｃｏｍｐｏｓｉｔｉｏｎｏｆＨＲＴＦｓ［ｃ］／／ＩＥＥＥＷｏｒｋｓｈｏｐｏｎＡｐｐｌｉｃａｔｉｏｎｓｏｆＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇｔｏＡｕｄｉｏａｎｄＡｃｏｕｓｔｉｃｓ．ＮｅｗＹｏｒｋ，ＵＳＡ．２００ｌ：１０３．１０６．［４５］ＨＡＮＤＺＥＬＡＡ，ＫＲＩＳＨＮＡＰＲＡＳＡＤＰＳ．Ｂｉｏｍｉｍｅｔｉｃｓｏｕｎｄ・ｓｏｕｒｃｅｌｏｃａｌｉｚａｔｉｏｎ［Ｊ］．ＩＥＥＥＪｏｕｒｎａｌｏｎＳｅｎｓｏｒｓ，２００２，２（６）：６０７－６１６．［４６］ＮＡＫＡＤＡＩＫ，ＯＫＵＮＯＴＨＧ，ＫＩＴＡＮＯＨ．Ｅｐｉｐｏｌａｒｇｅ－ｏｍｅｔｒｙｂａｓｅｄｓｏｕｎｄｌｏｃａｌｉｚａｔｉｏｎａｎｄｅｘｔｒａｃｔｉｏｎｆｏｒｈｕｍａｎ－ｏｉｄａｕｄｉｔｉｏｎ［ｃ］／／ＩＥＥＥ／ＲｓＪＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＩｎｔｅｌｌｉｇｅｎｔＲｏｂｏｔｓａｎｄＳｙｓｔｅｍｓ．Ｍａｕｉ，ＵＳＡ，２００１：１３９５—１４０１．［４７］ＮＡＫＡＤＡＩＫ，ＨＩＤＡＩＫ，ＭＩＺＯＧＵＣＨＩＨ，ｅｔａ１．Ｒｅａｌ－ｔｉｍｅａｕｄｉｔｏｒｙａｎｄｖｉｓｕａｌｍｕｌｔｉｐｌｅ・・ｏｂｊｅｃｔｔｒａｃｋｉｎｇｆｏｒｈｕ・－ｍａｎｏｉｄｓ［Ｃ］／／ＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＳｅｖｅｎｔｅｅｎｔｈＩｎｔｅｒｎａｔｉｏｎａｌＪｏｉｎｔＣｏｎｆｅｒｅｎｃｅｏｎＡｒｔｉｆｉｃｉａｌＩｎｔｅｌｌｉｇｅｎｃｅ．Ｓｅａｔｔｌｅ，ＵＳＡ，２００ｌ：１４２５－１４３６．［４８］ＮＡＫＡＤＡＩＫ，ＭＡＴＳＵＵＲＡＤ，ＯＫＵＮＯＨＧ，ｅｔａｌ。Ａｐ－ｐｌｙｉｎｇｓｃａｔｔｅｒｉｎｇｔｈｅｏｒｙｔｏｒｏｂｏｔａｕｄｉｔｉｏｎｓｙｓｔｅｍ：ｒｏｂｕｓｔｓｏｕｎｄｓｏｕｒｃｅｌｏｃａｌｉｚａｔｉｏｎａｎｄｅｘｔｒａｃｔｉｏｎ［Ｃ］／／ＩＥＥＥ／ＲｓＪＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＩｎｔｅｌｌｉｇｅｎｔＲｏｂｏｔｓａｎｄＳｙｓ—ｔｅｒｎｓ．ｋＶｅｇａｓ，ＵＳＡ，２００３：ｌ１４７－ｌ１５２．［４９］ＫＵＭＯＮＭ，ＳＨＩＭＯＤＡＴ，ＫＯＨＺＡＷＡＲ．Ａｕｄｉｏｓｅｒｖｏｆｏｒｒｏｂｏｔｉｃｓｙｓｔｅｍｓｗｉｔｈｐｉｎｎａｅ［Ｃ］／／ＩＥＥＥ／ＲＳＪＩｎｔｅｒｎａ－ｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＩｎｔｅｌｌｉｇｅｎｔＲｏｂｏｔｓａｎｄＳｙｓｔｅｍｓ．Ｅｄｍ－ｏｎｔｏｎ，Ｃａｎａｄａ，２００５：１８８ｌ－１８８６．［５０］ＳＨＩＭＯＤＡＴ，ＮＡＫＡＳＨＩＭＡＴ，ＫＵＭＯＮＭ，ｅｔａ１．Ｓｐｅｃ・ｔｒａｌｃｕｅｓｆｏｒｒｏｂｕｓｔｓｏｕｎｄｌｏｃａｌｉｚａｔｉｏｎｗｉｔｈｐｉｎｎａｅ［Ｃ］／／ＩＥＥＥ／ＲｓＪＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＩｎｔｅｌｌｉｇｅｎｔＲｏｂｏｔｓａｎｄＳｙｓｔｅｍｓ．Ｂｅｉｊｉｎｇ。Ｃｈｉｎａ，２００６：３８６－３９１．［５１］ＨＯＭＳＴＥＩＮＪ，ＬＯＰＥＳＭ，ＳＡＮＴＯＳ－ＶＩＣＴＯＲＪ。ｅｔａ１．Ｓｏｕｎｄｌｏｃａｌｉｚａｔｉｏｎｆｏｒｈｕｍａｎｏｉｄｒｏｂｏｔｓ・－ｂｕｉｌｄｉｎｇａｕｄｉｏ・－ｍｏ・・ｔｏｒｍａｐｓｂａｓｅｄｏｎｔｈｅＨＲＴＦ［Ｃ］／／ＩＥＥＥ／ＲＳＪＩｎｔｅｒｎａｔｉｏｎ．ａｌＣｏｎｆｅｒｅｎｃｅｏｎＩｎｔｅｌｌｉｇｅｎｔＲｏｂｏｔｓａｎｄＳｙｓｔｅｍｓ．Ｂｅｉｊｉｎｇ。Ｃｈｉｎａ。２００６：１１７０－１１７６．［５２］ＫＥＹＲＯＵＺＦ，ＭＡＩＥＲＷ，ＤＩＥＰＯＬＤＫ．Ａｎｏｖｅｌｈｕｍａｎ—ｏｉｄｂｉｎａｕｒａｌ３Ｄｓｏｕｎｄｌｏｃａｌｉｚａｔｉｏｎａｎｄｓｅｐａｒａｔｉｏｎａｌｇｏｒｉｔｈｍ［Ｃ］／／ＩＥＥＥ—ＲＡＳＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＨｕｍａｎｏｉｄＲｏｂｏｔ．Ｇｅｎｏｖａ，Ｉｔａｌｙ，２００６：２９６－３０１．［５３］ＲＯＤＥＭＡＮＮＴ，ＩＮＣＥＧ，ＪＯＵＢＬＩＮＦ，ｅｔａ１．Ｕｓｉｎｇｂｉｎ．ａｕｒａｌａｎｄｓｐｅｃｔｒａｌｃｕｅｓｆｏｒａｚｉｍｕｔｈａｎｄｅｌｅｖａｔｉｏｎｌｏｅａｌｉｚａ－ｔｉｏｎ［Ｃ］／／ＩＥＥＥ／ＲＳＪＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＩｎｔｅｌｌｉ．ｇｅｎｔＲｏｂｏｔｓａｎｄＳｙｓｔｅｍｓ．Ｎｉｃｅ，Ｆｒａｎｃｅ，２００８：２１８５－２１９０．［５４］ＲＯＤＥＭＡＮＮＴ．Ａｓｔｕｄｙｏｎｄｉｓｔａｎｃｅｅｓｔｉｍａｔｉｏｎｉｎｂｉｎａｕｒａｌｓｏｕｎｄｌｏｃａｌｉｚａｔｉｏｎ［ｃ］／／ＩＥＥＥ／ＲＳＪＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒ－ｅｎｃｅｏｎＩｎｔｅｌｌｉｇｅｎｔＲｏｂｏｔｓａｎｄＳｙｓｔｅｍｓ．Ｔａｉｐｅｉ，Ｃｈｉｎａ，智能系统学报２０１０：４２５－４３０．ｆｅｒｅｎｃｅ第７卷ＣｏｍｐｕｔｅｒＳｃｉｅｎｃｅａｎｄＩｎｆｏｒｍａｔｉｏｎＴｅｃｈｎｏｌｏｇｙ．ｏｎ［５５］ＫＩＭＵＨ，ＭＩＺＵＭＯＴＯＴ，ＯＧＡＴＡＴ，ｅｔａ１．Ｉｍｐｒｏｖｅｍｅｎｔｂｙｃｏｎｓｉｄｅｒｉｎｇｍａｌｆｉｐａｔｈｉｎｔｅｒｆｅｒ－Ｓｉｎｇａｐｏｒｅ，２００８：９４２－９４６．ｏｆｓｐｅａｋｅｒｌｏｃａｌｉｚａｔｉｏｎｅｎｃｅ［６６］ＬＥＥｔｉｏｎＢ，ＣＨＯＩＪＳ，ｌ（ＩＭＤ，ｅｔｉｎｒｅｖｅｒｂｅｒａｎｔｅｎｖｉｒｏｎｍｅｎｔａ１．ＳｏｕｎｄｕｓｉｎｇｓＯＩＬｒＣｅｌｏｅａｌｉｚａ－ｏｆｓｏｕｎｄｗａｖｅｆｏｒｂｉｎａｕｒａｌｒｏｂｏｔａｕｄｉｔｉｏｎ『Ｃ１／／ＩＥＥＥ／ｏｎｖｉｓｕａｌｏｎｉｎｆｏｒｍａｔｉｏｎＩｎｔｅｌｌｉｇｅｎｔＲｓＪＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｍｎｅｅＩｎｔｅｌｌｉｇｅｎｔＲｏｂｏｔｓａｎｄＳｙｓ・［Ｃ］／／ＩＥＥＥ／ＲＳＪＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅＲｏｂｅｔｓａｎｄＨｏｎｇ，ＳＨＥＮＭｉａｏ．Ｃｏｎｔｉｎｕｏｕｓｓｏｕｎｄｏｎｔｅｒｎｓ．ＳａｎＦｒａｎｃｉｓｃｏ．ＵＳＡ．２０１１：２９１０－２９１５．ｓｙ８ｋｍ．Ｔａｉｐｅｉ。Ｃｈｉｎａ．２０１０：３５４２－３５４７８０ｌｌｒｅｅ［５６］ＳＫＡＦＡ．Ｏｐｆｉｍａｌｐｏｓｉｔｉｏｎｉｎｇｏｆｓｏｕｒｃｅ８ｂｉｎａｕｒａｌｓｅｎｓｏｒｏｎａｈｕ—［６７］ＬＩＵｌｏｃａｌｉｚａ－ｍａｎｏｉｄｈｅａｄｆｏｒｓｏｕｎｄｌｏｃａｌｉｚａｔｉｏｎ［Ｃ］／／ＩＥＥＥ—ＢＡＳＲｏｂｏｔ．Ｂｌｅｄ，Ｓｈｉｒｅ－ｓｉｎ—ｏｎｄｏｎｂａｓｅｄｍｉｃｒｏｐｈｏｎｅａｒｒａｙｆｏｒｍｏｂｉｌｅｏｎｒｏｂｏｔｓ［Ｃ］／／ＩｎｔｅｍａｔｉｎｎａｌＣｏｎｆｅｒｅｎｃｅｎｉａ。２０１１：１６５－１７０．ｏｎＨｕｍａｎｏｉｄＩＥＥＥ／ＲＳＪＩｎｔｅｒｎａｆｉｏｎａｌＣｏｎｆｅｒｅｎｃｅａｎｄＩｎｔｅｌｌｉｇｅｎｔＲｏｂｅｔｓＳｙｓｔｅｍｓ．Ｔａｌｐａｉ，Ｃｈｉｎａ，２０１０：４３３２－４３３９．Ｘｕｅｓｏｎｇ．Ｓｏｕｎｄｏｎｓｏｕｒｃｅ［５７］ＳＡＸＥＮＡｇｌｅＡ，ＮＧＡＹ，ＬｅａｒｎｉｎｇｓｏｕｎｄｌｏｃａｔｉｏｎｆｒｏｍＩｎｔｅｒｎａｔｉｏｎａｌａ［６８ＪＬＩＸｉａｏｆｅｉ，ＬＩＵＨｏｎｇ，ＹＡＮＧｌｏ－ｍｉｃｒｏｐｈｏｎｅ［Ｃ］／／ＩＥＥＥａｎｄＣｏｎｆｅｒｅｎｃｅｃａｌｌｚａｔｉｏｎｆｏｒｍｏｂｉｌｅｒｏｂｏｔｂａｓｏｄａｎｄｔｉｍｅｄｉｆｆｅｒｅｎｃｅｆｅａｔｕｒｅＩｎｔｅｒｎａｔｉｏｎａｌＲｏｂｏｔｉｃｓ１７４２．Ａｕｔｏｍａｔｉｏｎ．Ｋｏｂｅ．Ｊａｐａｎ，２００９：１７３７－ｓｐａｃｅ酊ｄｍａｔｃｈｉｎｇ［Ｃ］／／ＩＥＥＥ／ＲＳＪｏｎＣｏｎｆｅｒｅｎｃｅＫ，ＬＡＵＲＥＮＳＴ。ＯＫＵＮＯＨＧ，ｅｔａ１．ＡｃｔｉｖｅＩｎｔｅｌｌｉｇｅｎｔＲｏｂｏｔｓａｎｄＳｙｓｔｅｍｓ．ＳａｎＦｒａｎ．［５８］ＮＡＫＡＤＡＩａｕｄｉｔｉｏｎｆｏｒｃｉｓｅｏ．ＵＳＡ。２０ｌ１：２８７９－２８８６．ｈｕｍａｎｏｉｄ［Ｃ］／／ｐｒｏｃｅｅｄｉｎｇｓｏｎｏｆｔｈｅ１７ｄｉＮａ・［６９］ＹＯＵＮＧＳＨ．ＳＣＡＮＬＯＮＭＶ．ＤｅｔｅｃｔｉｏｎａｎｄｌｏｃａｌｉｚａｔｉｏｎａｒｒａｙｏｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅ２０００：８３２－８３９．ＡｒｔｉｆｉｃｉａｌＩｎｔｅｌｌｉｇｅｎｃｅ．Ａｕｓｔｉｎ，ＵＳＡ，ｗｉｔｈ¨ａｃｏｕｓｔｉｃｓｍａｌｌｒｏｂｏｔｉｃｐｌａｔｆｏｒｍｉｎｕｒｂａｎｅｎｖｉｒｏｎｍｅｎｔｓ．ｔｅｃｈｎｉｃａｌｒｅｐｏｒｔＡＤＡ４１０４３２［Ｒ】．Ａｄｅｌｐｈｉ，ＵＳＡ：ＵＳ．ＡｒｍｙＲｅｓｅａｒｃｈＬａｂｏｒａｔｏｆｙ，２００３．［５９］ＡＮＤＥＲｓｓ０ＮｓＢ，ＨＡＮＤＺＥＬＡＡ．ＳＨＡＨＶ，ｅｔａ１．Ｒｏ－ｗｉｔｈｄｙｎａｍｉｃｓｏｕｎｄ一６０ｌｌｒｃｅｏｎｂｅｔｐｈｏｎｏｔａｘｉｓｌｏｃａｌｉｚａｔｉｏｎａｎｄＡｕ．［７０］ＳＵＮａｒｒａｙＨａｏ，ＹＡＮＧＰｅｎｇ，ＬＩＵＺｕｏｊｕｎ，ｅｔａ１．ＭｉｃｒｏｐｈｏｎｅｒＣｌ／／ＩＥＥＥＩｎｔｅｍａｔｉｏｎａｌＣｏｎｆｅｍｎｅｅｔｏｍａｔｉｏｎＲｏｂｏｔｉｃｓｂａｓｅｄａｕｄｉｔｏｒｙｌｏｃａｌｉｚａｔｉｏｎＣｏｎｔｒｏｌｆｏｒ㈣ｗｒｏｂｏｔ［Ｃ］／／Ｂａｒｃｅｌｏｎａ．Ｓｐａｉｎ，２００４：４８３３－４８３８．Ｅ，ＡＰＫＥＲｒｏｂｏｔｉｃＣｈｉｎｅｓｅａａｎｄＤｅｃｉｓｉｏｎＣｏｎｆｅｒｅｎｃｅ．Ｔａｉｙｕａｎ，Ｃｈｉ－［印］ＭＡＲＴＩＮＳＯＮｒｅｃｏｎｆｉ＃ｌｅＴ，ＢＵＧＭＳＫＡＭ．Ｏｐｔｉｍｉｚｉｎｇｎａ，２０１１：６０６－６０９ｍｉｃｒｏｐｈｏｎｅｏｎａｒｒａｙ［ｃ】／／ＩＥＥＥ／ＲＳＪＲｏｂｏｔｓａｎｄＳｙｓ—［７ｌ】ＬＵＯＲＣ，ＨＵＡＮＧＣＨ，ＬＩＮＴＴ．ＨｕｍａｎｔｒａｃｋｉｎｇａｎｄｕｓｉｎｇｓｏｕｎｄＩｎｔｅｍａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅＩｎｔｅｌｌｉｇｅｎｔｆｏｌｌｏｗｉｎｇｓｏｕｌ＇ｃｅｌｏｃａｌｉｚａｔｉｏｎｆｏｒｍｕｈｉｓｅｎｓｏｒｔｅｒｎｓ．ＳａｎＦｒａｎｃｉｓｃｏ，ＵＳＡ，２０１ｌ：１２５—１３０．ｂａｓｅｄｍｏｂｉｌｅａｓｓｉｓｔｉｖｅｃｏｍｐｎｉｏ．ｒｏｂｏｔ［Ｃ］／／ＩＥＥＥＣｏｎ—ｆｅｒｅｎｅｅｏｎ［６１］ＰＯＲＴＥＬＬＯＡ．ＡｃｏｕｓｔｉｃｍｏｄｅｌｓａｎｄＫａｌｍａｎｆｉｌｔｅｒｉｎｇｓｔｒａｔ－ｂｉｎａｕｒａｌｓｏｕｎｄＩｎｄｕｓｔｒｉａｌＥｌｅｃｔｒｏｎｉｃｓＳｏｃｉｅｔｙ．Ｇｌｅｎｄａｌｅ，ＵＳＡ，ｅｇｉｅｓｆｏｒａｃｔｉｖｅｌｏｃａｌｉｚａｔｉｏｎ［Ｃ］／／ＩＥＥＥ／２０１０：１５５２－１５５７．ＲｓＪＩｎｔｅｍａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＩｎｔｅｌｌｉｇｅｎｔＲｏｂｏｔｓａｎｄＳｙｓ－ｔｅｒｎｓ．Ｓａｎ作者筒介：李晓飞，男，１９８＂／年生，博士研究生Ｆｒａｎｃｉｓｃｏ．ＵＳＡ．２０１１：ｌ”－１４２．Ｙ．Ａｃｔｉｖｅｓｏｆｔｐｉｎｎａｅｆｏｒｏｎ［６２］ＫＵＭＯＮＭ。ＮＯＤＡｒｏｂｏｔｓ［Ｃ］／／Ｒｏｂｏｔｓ主要研究方向为语音识别、声源定位．ＩＥＥＥ／ＲＳＪＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅＩｎｔｅｌｌｉｇｅｎｔａｎｄＳｙｓｔｅｍｓ．ＳａｎＦｒａｎｃｉｓｃｏ．ＵｓＡ，２０１１：１１２－１１７．［６３］ＯＫＵＮＯｂｅｔＨＧ。ＮＡＫＡＤＡＩＫ，ＨＩＤＡＩＫ，ｅｔａ１．Ｈｕｍａｎ－ｎｉｎｔｅｒａｃｔｉｏｎｔｈｒｏｕＩｇｈｒｅａｌ－ｔｉｍｅａｕｄｉｔｏｒｙａｎｄｖｉｓｕａｌｍｕｌｔｉ・ｐｉｅ—ｔａｌｋｅｒｅｎｃｅｏｎｔｒａｃｋｉｎｇ［Ｃ］／／ＩＥＥＥ／ＲＳＪＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒ－ＩｎｔｅｌｌｉｇｅｎｔＲｏｂｏｔｓａｎｄＳｙｓｔｅｍｓ．Ｍａｕｉ，ＵＳＡ，２００ｌ：１４０２－１４０９［６４］ＯＫＵＮＯｌｉｏｎｏｆＨＣ．ＮＡＫＡＤＡＩＫ。ＫＩＴＡＮＯＫ．Ｓｏｃｉａｌｉｎｔｅｍｅ－ｈｉｕｎａｎｏｉｄｒｏｂｏｔｂａｓｅｄｏｎａｕｄｉｏ・ｖｉｓｕａｌｔｒａｃｋｉｎｇＥｎｇｉｎｅｅｒ－［Ｃ］／／ＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｉｎｇＡｐｐｌｉｃａｔｉｏｎｓｏｆＡｒｔｉｆｉｃｉａｌｏｎＩｎｄｕｓｔｒｉａｌａｎｄＩｎｔｅｌｌｉｇｅｎｃｅａｎｄＥｘｐｅｒｔＳｙｓ—ｔｅｍ．Ｃａｉｌｎｓ，Ａｕｓｔｒａｌｉａ．２００２：１．１０［６５］ＬｖＸｉａｏｌｉｎｇ，ＺＨＡＮＧｏｎＭｉｎｇｌｕ．ＳｏｕｎｄｓｏｕｒｃｅｌｏｃａｌｉｚａｔｉｏｎＣｏｎ——刘宏，男，１９６７年生，教授，博士生导师，中国人工智能学会常务理事、副秘书长、青年工作委员会主任，主要研究方向为智能机器人、计算机视听觉．先后承担国家自然科学基金项目７项，国家。８６３”、“９７３”计划课题项目５项．＆步奖．发表学术论文１００余篇，其中６０ｂａｓｅｄｒｏｂｏｔｈｅａｒｉｎｇａｎｄｖｉｓｉｏｎ［ｃ］／／Ｉｎｔｅｍａｔｉｎｎａｌ万方数据

因篇幅问题不能全部显示，请点此查看更多更全内容

查看全文