Skip to content

Latest commit

 

History

History
 
 

Speech

Folders and files

NameName
Last commit message
Last commit date

parent directory

..
 
 

Speech Automatic Speech Recognition,(ASR)

包含:

    语言识别ASR 
    语义理解ALU 
    文字转语言TTS  
    文字识别ocr 等

语音识别 RNN LSTM HMM GMM CTC The official repository of the Eesen project

语言识别ASR

语音识别(一)——概述 HMM -> GMM -> 深度学习RNN HTK CMU-Sphinx SPTK

语音识别(二)——基本框架, Microphone Array, 声源定位 信号处理和特征提取 MFCC、声学模型(gmm-hmm)、语言模型(Language Model, LM)和解码器(Decoder)()

语音识别(三)——声源定位、前端处理 语言模型 声学模型, 解码器技术

语音识别(四)——声音分割,DTW(时域,Dynamic Time Warping动态时间规整算法), Spectrogram(频域,FFT傅里叶变换,声谱图), Cepstrum Analysis, Mel-Frequency Analysis

语音识别(五)——FBank, 语音识别的评价指标, 声学模型进阶, 语言模型进阶, GMM-HMM高斯混合-隐马尔科夫模型

中文分词!!!!!!!

CTC(Connectionist Temporal Classifier)

一般译为联结主义时间分类器 ,
适合于输入特征和输出标签之间对齐关系不确定的时间序列问题,
CTC可以自动端到端地同时优化模型参数和对齐切分的边界。

LSTM-CTC 博客详解

Theano implementation of LSTM and CTC to recognize simple english sentence image

语义理解NLU

图灵NLU 在线语意理解

文字转语音TTS

科大讯飞 TTS

文字识别ocr 其实属于图像识别问题了

ocn代码示例

Use CTC + tensorflow to OCR

自然语言处理

自然语言处理算法与实战

chapter-3 中文分词技术
chapter-4 词性标注与命名实体识别
chapter-5 关键词提取
chapter-6 句法分析
chapter-7 文本向量化
chapter-8 情感分析
chapter-9 NLP中用到的机器学习算法
chapter-10 基于深度学习的NLP算法