说话人识别的参量研究和语音库建设

北京大学学报（自然科学版）

说话人识别的参量研究和语音库建设

吴淑珍,吴阿华

北京大学无线电系，北京，100871

收稿日期:1994-09-23 出版日期:1995-05-20 发布日期:1995-05-20

A Study of Parameters on Speaker Recognition and Creation of Speech Database

WU Suzhen, WU Ahua

Department of Radio Electronics, Peking University, Beijing, 100871

Received:1994-09-23 Online:1995-05-20 Published:1995-05-20

摘要/Abstract

摘要： 本文对说话人识别中的几个基本问题进行了研究。语音参量是说话人识别的基础，用矢量量化方法，使用自建的语音库中的材料，研究了说话人识别中的各种参量的效果。实验表明，所采用的参量中，一种混合参量MC最好，倒谱系数CE次之。

关键词: 说话人识别, 语音参量, 矢量量化, 倒谱系数, 线性预测编码

Abstract: Describes briefly a study of a few fundamental problemson Speaker Recognition. Speech parameters are the base and a speech database is needful for speaker recognition. Our study used VQ technic and materiel of speech database which created by us. It is shown by experiments that in some introduced parameters a mixed parameter is the best, secondly is cepstral coefficient.

Key words: speaker recognition, speech parameter, VQ, cepstral coefficient, linear predictive coding

中图分类号:

TN912.34

吴淑珍,吴阿华. 说话人识别的参量研究和语音库建设[J]. 北京大学学报（自然科学版）.

WU Suzhen,WU Ahua. A Study of Parameters on Speaker Recognition and Creation of Speech Database[J]. Acta Scientiarum Naturalium Universitatis Pekinensis.

导出引用管理器 EndNote|Ris|BibTeX

链接本文: https://xbna.pku.edu.cn/CN/

https://xbna.pku.edu.cn/CN/Y1995/V31/I3/316

164

HTML			PDF

最新录用	在线预览	正式出版	最新录用	在线预览	正式出版
0	0	0	0	0	164

来源	本网站	其他网站

次数	10	154
比例	6%	94%

摘要

1287

最新录用	在线预览	正式出版

0	0	1287

来源	本网站	其他网站

次数	140	1147
比例	11%	89%

[1]	陈炜亮,孙晓. 基于MFCCG-PCA的语音情感识别[J]. 北京大学学报（自然科学版）, 2015, 51(2): 269-274.
[2]	邱洪,吴淑珍. 噪声补偿应用于与文本无关的说话人辨认研究[J]. 北京大学学报（自然科学版）, 2005, 41(1): 115-121.
[3]	段新, 黄新宇, 吴淑珍. 与文本无关的说话人辨认系统中一种新的使用基音周期方法研究[J]. 北京大学学报（自然科学版）, 2003, 39(5): 690-696.
[4]	甄斌,吴玺宏,刘志敏,迟惠生. 语音识别和说话人识别中各倒谱分量的相对重要性[J]. 北京大学学报（自然科学版）, 2001, 37(3): 371-378.
[5]	吴淑珍, 程乾生. 一种孤立词语音识别方法研究[J]. 北京大学学报（自然科学版）, 2001, 37(1): 67-70.
[6]	冯成林,吴淑珍. 一种噪声环境下的语音识别方法(线性预测误差法)的研究[J]. 北京大学学报（自然科学版）, 2000, 36(5): 665-671.
[7]	黄新宇,吴淑珍. 基于单边自相关线性预测噪声中汉语语音识别[J]. 北京大学学报（自然科学版）, 2000, 36(5): 672-680.