今天是: PRL发表声学研究所刘晓峻教授课题组最新研究成果   近代声学教育部重点实验室2015年度开放课题申请通知   程建春课题组在Appl. Phys. Lett.发表封面文章   AIP报道刘晓峻教授课题组在声学零密度材料方面的最新工   《自然·材料》发表我所刘晓峻教授课题组最新研究成果  
站内搜索:
 
  资源共享
  仪器共享
  科普活动
  资料下载
  资料下载
 您当前位置:南京大学声学研究所 >> 资源共享 >> 资料下载 >> 浏览文章
 
南京大学声学研究所语料库
发布人:佚名 信息来源:本站原创  发布时间:2012年08月08日 点击数量:

  • 资源名称:南京大学声学研究所语料库
  • 资源大小:0
  • 资源介绍:
    南京大学声学研究所汉语命令字词和数字串语料库说明
    【背景】 针对汉语自动语音拨号系统的研究
    【建立时间】 2011年3月下旬
    【人数】 由180人(80女/100男)参与录音;采用171人(77女/94男)
    【录音环境】 普通会议室,长 8.73m ,宽 6.46m ,高 3.75 m ;平均背景噪声 62.6 dB 。
    【录音设备】 M-AUDIO专业数字录音机
    【录音设置】 96 kHz采样率、16 位量化、立体声录音
    【录音内容】
    1.10条命令指令(电视开、电视关、频道一、频道二、频道三、CCTV、中央台、江苏台、音量调大、音量调小);
    2.十一个单个数字(0、1、2、3、4、5、6、7、8、9、yao);
    3.十一个随机生产的2位数字串;
    4.十一个随机生产的3位数字串;
    5.十一个随机生产的4位数字串;
    6.十一个随机生产的5位数字串;
    7.十一个随机生产的6位数字串;
    8.一个9位数字串(学号长度);
    9.一个11位数字串(手机号码长度);
    10.噪声(包括马路交通噪声、步行街交通噪声、公交车内噪声、地铁车厢内噪声、地铁车厢外噪声、超市和商场内的噪声、室内噪声、高斯噪声等)。
    【存取目录】
    1. corpus 文件夹,大小10.6 GB
    noise, data_0, data_1, data_2, data_3, data_4, data_5, data_6, data_7, data_8 子文件中分别存放各种噪声、命令指令、单个数字、2位数字串、3位数字串、4位数字串、5位数字串、6位数字串、9位数字串和11位数字串。addnoise 子文件夹中存放用于向语音信号中添加设定信噪比的噪声的MATLAB 源程序。所有文件夹中均存有一个ReadMe.txt 文件对该文件夹中所有音频文件的内容加以标注。每一个 .wav 格式的文件命名格式如下:
    201103_f_0001_2_01.wav
    其中:
    201103代表录制时间为2011年03月;
    f/m分别代表女声、男声;
    0001代表人数编号;
    2代表该音频文件内容为2位数字串(0代表命令指令,1代表单个数字,3、4、5、6、7、8分别代表3位数字、4位数字、5位数字、6位数字、9位数字和11位数字等);
    01代表十一个数字串中的第一个(9位数字串和11位数字串没有此项)。
    所有文件命名规则以此类推。
    2.corpus_8k 文件夹,大小691 MB
    降采样到8 kHz 的语音数据存放于此文件夹中,其它各子文件夹以及文件命名规则同上。
    降采样采用MATLAB 7.0 软件自带的resample() 函数。
     
    本数据库建立源自南京大学大学生创新训练计划(编号XY101028430)。
    创新训练小组成员:赵斯培、张潇鹏、郑洁东、俞鼎峰
    指导老师:邱小军
     
    【使用和版权事宜】
    我们努力使本语料库内容正确和信息完备,不含有病毒和其他有害程序和信息;但我们不能承担任何由于直接或者间接使用该语料库而导致的任何有害后果。本语料库版权归南京大学声学研究所拥有。非赢利的科学研究可以通过致谢或者声明的方式免费使用。但以赢利为目的的商业使用者请和南京大学声学研究所联系版权事宜。
    联系人:邱小军 所长
    邮箱:xjqiu@nju.edu.cn
    电话:025-83592919
     
    致谢:
    感谢南京大学电子科学与工程学院的张昊老师、吴信蕾老师、柏业超老师和裴玉老师提供他们的办公室作为我们的录音场所。感谢南京大学电子科学与工程学院青年志愿者协会的会长杨海燕同学和副会长管月同学以及“青协”的每一位参与录音的同学,他们为此次语料库的录制做出了很大的贡献!尤其要感谢郑洁东、张星、张潇鹏和郑载舟等同学对语料库进行切分、标注等所做的工作!
     
     
 
 上一篇文章:没有了 下一篇文章:没有了
 
联系我们 | 声学所简介 | 英才招聘 | 版权声明
Copyright 2003-2015 南京大学声学aa研究所 All Rights Reserved
地址:中国江苏 南京市汉口路22号  邮编:210093 Tel:025-83592385 Email:postsndi@nju.edu.cn