ICS 35.040 L 71 GB 中华人民共和国国家标准 GB/T21023—2007 中文语音识别系统通用技术规范 General specification for Chinese speech recognition system 2007-06-29发布 2007-11-01实施 中华人民共和国国家质量监督检验检疫总局 发布 中国国家标准化管理委员会 GB/T21023—2007 目 次 前言 III 范围 规范性引用文件 2 术语和定义 语音识别系统分类及表述 4. 1 基于用途的分类 4. 2 基于词汇量的分类 4. 3 基于所能识别的说话人群的分类 4.4 基于系统工作模式的分类 4.5 语音识别系统的应用环境 4.6 语音识别系统使用背景环境 语音识别系统表述规范 4.7 5语音识别系统性能指标 5. 1 概述 5.2 识别性能分类指标 5.3响应时间指标 5. 4 系统分类指标要求 6语音输人和识别输出 6. 1 语音识别输入准则 6.2语音识别输出准则 7 语音识别系统性能测试方法 7. 1 概述 7. 2 测试语料设计 7. 3 测试语音录制 7. 4 基于语音识别标准库的测试方法 7. 5 基于现场口呼的测试方法 7. 6 测试报告内容 8语音识别标准库及规范 8. 1 概述 8.2语音识别标准库语音特性的描述 8.3 语音识别标准库的标注 8 8. 4 语音识别标准库的来源 8.5语音识别标准库的数据转换 附录A(资料性附录)听写系统有关符号读法 附录B(资料性附录) 语音识别用无调汉语拼音表 11 参考文献 12 GB/T 21023—2007 前言 请注意本标准的某些内容有可能涉及专利。本标准的发布机构不承担识别这些专利的责任 本标准的附录A、附录B是资料性附录。 本标准由中华人民共和国信息产业部提出。 本标准由全国信息技术标准化技术委员会归口。 本标准由中国电子技术标准化研究所、中国科学院自动化研究所、清华大学、中国社会科学院语言 研究所起草。 本标准主要起草人:徐波、孙甲松、李爱军、徐明星、黄泰翼、鲍怀翘、尹波、吴志刚。 II GB/T21023—2007 中文语音识别系统通用技术规范 1范围 本标准规定了中文语音识别系统的基本术语、分类,技术指标、测试方法,输入/输出以及中文语音 识别标准库等。 本标准适用于各种计算机、网络和终端设备配置的中文语音识别系统。本标准的制定和实施主要 用于指导中文语音识别系统的研制、应用和测试。 2规范性引用文件 下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有 的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究 是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。 GB18030—2005信息技术中文编码字符集 3术语和定义 下列术语和定义适用于本标准。 3. 1 语音识别 speechrecognition 将人类的声音信号转化为文字或者指令的过程。 3. 2 语音识别系统 speech recognition system 具有语音识别功能的开发工具、软件、装置或应用。 3.3 词汇表 vocabulary list 语音识别系统所包含和处理的所有词汇。 3. 4 激活词汇 activeword 语音识别系统在某个时间点能同时识别的所有词汇。 3.5 发音utterance 用户输入的一个语音单位,可以是词、短语或句子。发音单元之间需有有意、明显停顿。 3. 6 孤立字语音isolatedwordspeech 以字为发音单元,字与字之间需有有意、明显停顿的语音。 3.7 连接词语音 connected word speech 以词为发音单元,词与词之间需有有意、明显停顿的语音 3.8 连续语音 continuous speech 词与词之间无需刻意停顿的自然发音语音。 注:包括朗读语音和自然语音。 GB/T21023—2007 3. 9 汉语通用语 Mandarin and its dialect variation 普通话以及普通话的地方变体。 注:为中国人跨地区交流时最常见之普通话。 3. 10 同构语音数据 isomorphic speech data 除说话人不同外,其他语音属性相同或基本相同的语音数据集合。 3. 11 语音识别工作模式 working modefor speechrecognition 语音识别系统对说话方式、内容以及句型等的限制。 3. 12 标准配置 standardconfiguration 正常运行语音识别所需要的基本计算机配置 注:如CPU、内存、网络、麦克风、A/D精度要求等,由生产厂家给出。 3.13 系统自适应 speaker adaption 语音识别系统通过用户发音完成对识别模型参数修改的自适应过程。 3.14 用户自适应 user adaption 用户熟悉应用系统、了解自动语音识别系统特性的学习过程 3.15 删除错误deletionerror 用户所发语音在语音识别结果中没有出现的错误。 3. 16 插入错误insertionerror 用户没有发的语音在识别结果中出现的错误。 3. 17 替换错误 substitution error 用户所发语音被识别成其他语音的语音识别错误。 3. 18 被测系统 system for testing 参加评估的语音识别系统。 3. 19 测试系统 testing system 对被测系统进行评估的系统和体系。 3.20 副语言学 paralinguistic feature 言语中非音段的语音特征以及种种非语音信号。 注:这些行为被充分用来对总的交际效应作出贡献 4语音识别系统分类及表述 语音识别系统可以基于不同的用途、不同的词汇量、所能适应的不同人群、不同的工作模式、不同的 应用平台进行分类。基本分类可以融合,例如某个系统可以是“基于PC平台的超天词汇量特定人群书 2

pdf文档 GB-T 21023-2007 中文语音识别系统通用技术规范

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
GB-T 21023-2007 中文语音识别系统通用技术规范 第 1 页 GB-T 21023-2007 中文语音识别系统通用技术规范 第 2 页 GB-T 21023-2007 中文语音识别系统通用技术规范 第 3 页
下载文档到电脑,方便使用
本文档由 思安 于 2023-02-21 17:30:58上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。