(计算机声音输入或输出入G06F 3/16;特别适用于处理自然语言数据的数字数据处理方法或设备入G06F 17/20;教授盲人、聋人或哑人或者与盲人、聋人、哑人通信入G09B 21/00;电话通信入H04M)〔4〕
G10L 11/00不限定于G10L 15/00至G10L 21/00中单独一组的语音特征的测定或检测〔7〕 G10L 11/02·检测有无语音信号(在两路扩音电话系统中利用声音频率实现的传输方向的转换入H04M 9/10)〔7〕 G10L 11/04·语音信号的音调测定〔7〕 G10L 11/06·语音信号的浊音和清音之间的鉴别(G10L 11/04优先)〔7〕
G10L 13/00语音合成;正文—语音合成系统(电声乐器入G10H)〔7〕 G10L 13/02·产生合成语音的方法;语音合成设备〔7〕 G10L 13/04··语音合成系统的技术细节,例如合成设备结构、存储器管理〔7〕 G10L 13/06·语音合成设备中使用的基本语音单位;级联规则〔7〕 G10L 13/08·正文分析或语音合成正文以外其他参数的产生,例如语义图翻译为音素、韵律产生、重音或声调测定〔7〕
G10L 15/00语音识别(G10L 17/00优先)〔7〕 G10L 15/02·语音识别的特征提取;识别单位的选择〔7〕 G10L 15/04·分段或字极限检测〔7〕 G10L 15/06·创建基准模板;训练语音识别系统,例如对说话者声音特征的适应(G10L 15/14优先)〔7〕 G10L 15/08·语音分类或检索(模式识别入G06K 9/00)〔7〕 G10L 15/10··利用未知语音与基准模板之间的距离测度或失真测度〔7〕 G10L 15/12··利用动态编程技术,例如动态时间偏差(DTW)技术〔7〕 G10L 15/14··利用统计模型,例如隐藏马尔科夫模型(HMM)(G10L 15/18优先)〔7〕 G10L 15/16··利用人工神经网络〔7〕 G10L 15/18··利用自然语言模型〔7〕 G10L 15/20· 特别适用于不利环境(例如,噪音环境)中增强语音强度的语音识别技术(G10L 21/02优先)〔7〕 G10L 15/22·在语音识别过程中(例如在人机对话过程中)使用的程序〔7〕 G10L 15/24·利用非声学特征,例如嘴唇位置进行语音识别〔7〕 G10L 15/26·语音—正文识别系统(G10L 15/08优先)〔7〕 G10L 15/28·语音识别系统的结构细节〔7〕
G10L 17/00讲话者辨认或验证〔7〕
G10L 19/00用于冗余度下降情形(例如在声码器中)的语音分析—合成技术;语音编码或解码〔7〕 G10L 19/02·利用频谱分析,例如变换声码器、子频带声码器〔7〕 G10L 19/04·利用预测技术〔7〕 G10L 19/06··例如短期预测系数的频谱特征的确定或编码〔7〕 G10L 19/08··激励函数的确定或编码;长期预测参数的确定或编码〔7〕 G10L 19/10···多脉冲激励的确定或编码〔7〕 G10L 19/12···例如代码激励线性预测(CELP)声码器中的代码激励的确定或编码〔7〕 G10L 19/14··未包括在G10L 19/06至G10L 19/12组中的细节,例如增益编码、后置滤波设计、声码器结构〔7〕
G10L 21/00为了改变语音信号的品质或其可理解性而处理语音信号以产生另一种可听的或非可听的信号,例如视觉信号、触觉信号(G10L 19/00优先)〔7〕 G10L 21/02·语音增强,例如降低噪声、消除回声(免提电话中的回声抑制入H04M 9/08;助听器入H04R 25/00)〔7〕 G10L 21/04·时间压缩或扩展〔7〕 G10L 21/06·将语音转换成非可听表达形式,例如语音可视化、辅助触觉的语音处理(G10L 15/26 优先)〔7〕
|