一、 绪论
1、 模式识别的本质是分类:识别与认知的区别和联系;
2、 模式识别的依据是相似性;
3、 模式识别的两大问题:学习(训练)和分类(识别);
二、 基本概念
1、 样本、模式和类; 2、 特征及特征空间;
3、 有监督模式识别和无监督模式识别; 4、 模式识别系统的组成; 5、 紧致性要求:
三、 判别函数
1、 决策区域和判别函数;
2、 线性判别函数的形式和使用:两类情况,多类情况;
3、 广义线性判别函数:概念和简单的线性化;
四、 统计模式识别:
1、 统计模式识别的概念:什么是统计模式识别?确定性和随机性统计模式识别的区别;
2、 线性分类器的设计:基本思路,感知器算法,
3、 贝叶斯分类器的原理:贝叶斯公式及其意义,先验概率、后验概率和类条件概率密度,贝叶斯分类的原理,
4、 贝叶斯分类算法:最小错误率贝叶斯分类,最小风险贝叶斯分类(损失、获利的计算)
5、 贝叶斯分类器设计的原理:基本思路(估计先验概率和类条件概率密度),最大似然估计和贝叶斯估计,
6、 贝叶斯分类的错误率计算方法;
7、 正态分布条件下贝叶斯分类的特点:判别函数、决策区域和决策面,最小错误率
五、 数据聚类:
1、 定义和特点:无监督学习,聚类结果多样化,
2、 相似度的度量:样本间相似度,类间相
似度;
3、 聚类准则:紧致性准则,误差平方和准则;
4、 基于试探的聚类算法:最近邻规则算法,最大最小距离算法,
5、 层次聚类算法:基本思路,融合算法和分解算法各自的步骤、计算量;
6、 动态聚类算法:基本思路,k-均值算法的具体计算,ISODATA算法的原理,最优分类数的确定方法;
六、 特征提取和特征选择 1、 特征生成的目:降维、提高特征有效性; 2、 特征生成的方法:特征提取和特征选择,两者的特点、联系和区别;
3、 类别可分性准则函数:选取原则和构造方法,类内类间距离,概率距离,
4、 特征提取:使用类内类间距离进行特征提取的方法(J2准则);
5、 特征选择:算法,最优算法(穷举法、分支定界法),次优算法,
七、 模糊模式识别
1、 模糊集合的基本概念:隶属度函数,模糊子集(包括表示方法),α水平截集,模糊关系(模糊矩阵),模糊矩阵的运算, 2、 模糊模式识别算法:最大隶属度算法,择近原则算法(贴近度的概念和计算); 3、 模糊聚类:模糊等价关系的概念和验证,等价关系定理,利用等价关系定理完成层次聚类;
4、 模糊k-均值算法的具体计算;
八、 句法模式识别:
1、 结构模式识别:基元的概念,结构模式识别的概念;
2、 句法模式识别的概念:定义,句法和文法的概念(特点和相互联系),句法模式识别系统的组成,句法分析和文法推断 3、 形式语言理论:基本概念,4种类型文法的定义、特点;
4、 句法分析算法:基本思路,状态图法,填充树法,