模式识别【范例5篇】

网友 分享 时间:

【导言】此例“模式识别【范例5篇】”的范文资料由阿拉题库网友为您分享整理,以供您学习参考之用,希望这篇资料对您有所帮助,喜欢就复制下载支持吧!

模式识别范文【第一篇】

1.问题的提出

题1.某生产饮料的企业准备投入适当的广告费,对产品进行促销。在一年内,预计年销量Q(万件)与广告费x(万元)之间的函数关系为Q=(x≥0).已知生产此产品的年固定投入为3万元,每生产1万件此产品仍需要再投入32万元,若每件售价为“年平均每件成本的150%”与“年平均每件所占广告费的50%”之和。

(1)试将年利润W万元表示为年广告费x万元的函数;

(2)当年广告费投入多少万元时,企业年利润最大,最大年利润为多少?

从学生认知层面来说,解高中数学应用题难在如何将现实问题转化为学过的数学知识,即把现实问题“数学化”。这就说明高中数学应用题教学的核心在于如何引导学生“数学”地思考实际问题并把现实问题转化为纯数学问题的过程。

2.问题的思考

针对出现的这一问题,笔者认为应用题取材于生活,是一个简化了的实际问题,是“学数学,做数学,用数学”的有效载体,是现实问题与纯数学问题的必然联系和区别中的辩证统一关系,更重要的是应该使学生掌握解决高中数学应用题的有关方法,也就是要有一定的思考方向。本文试图用模式法教学法进行探究。

笔者同时也认为数学应用题的教学应分为两步教学:一是建模的教学;二是解模的教学。而《江苏省普通高中数学课程标准教学要求》明确提出:发展数学应用意识和创新意识,力求对现实世界中蕴涵的一些数学模式进行一定的思考和作出有效判断。

3.问题的解决

审题

在学生读题过程中,教师要引导学生找出条件是什么,问题是什么,把题中的重点词、句用线段画出,明确条件与问题有什么关系,并尽可能寻找出条件(已知)与问题(未知)的内在关系,将题目给定的信息经过分析、综合后,让学生尝试自己复述,学生在不经意中把现实问题“数学化”。在审题过程中,由于认知能力的差异,学生的感悟会有所不同,会存在一些疑点、难点,可以通过讨论让学生自己探究到问题的缘由。通过学生自己的阅读、理解、自主体验,实现“数学语言”的提炼,从而顺利实现了实际问题“数学化”。

模式化建模

通过“审题”学生大致可以知道:用已学过的哪些数学知识可以解决问题,解题有了基本明确的方向。这一过程也是培养学生“数学”地思考问题的最关键环节,这一过程我们不妨叫做“模式化建模”。其中高中常见的数学模型:函数模型、不等模型、数列模型、立体几何模型、三角模型、解析几何模型的应用题等。各类数学题型就是一个个数学模式,由于高考应用题都不是原始的实际问题,命题者对原始的材料,通过精心设计、加工、创作,就可将应用题化归为某个数学题型。学生识别出了题中的模式,就可将应用题化归为某个数学题型,也就找到了相应的解题途径。教师要帮助学生总结各类典型应用题的基本模式,构建相应的数学模型及识别模式的思维方法,保证学生在解高考应用题时能进行准确的模式识别。

解模

建模后,实际问题被转化学生比较熟悉的纯数学问题。到这个阶段,学生开始对“问题解决”有了初步的方法和策略,以下的教学就可以由学生自己完成,让学生发挥主体作用,增强学生解数学应用题的自信心。

4.案例分析

模式化教学课堂简录

以题1(函数型模型识别类)为例

教师:如何读懂题目?

学生:理清题目中量的关系。

教师:怎么理?

学生想不出来,期待老师……

教师:好,现在解决问题1,教大家一个处理信息的常见方法――列表。

教师继续讲:销售问题涉及几个量?

学生:价格、销售量、成本、利润。

教师:列表,关键怎样列?

几个学生列表后,上黑板,比较,大家一致认为下面一种表格比较好。

学生完善表格内容:

当x≥7时,w′0,w是的单调增函数;

当x=7时,w取得最小值。此时w=42.

教师展示:简解及评分标准(略).

通过一段时间模式识别法教学后,笔者发现其对帮助学生克服畏惧心理,增强学习数学的自信心,培养学生孜孜以求的探索精神,培养学生的应用意识和应用能力,有一定的帮助,这也是大众化数学的真正目的。正如著名数学家华罗庚所说:“宇宙之大,粒子之微,火箭之速,化工之巧,地球之变,生物之谜,日用之繁,无处不用数学。”

参考文献:

模式识别技术【第二篇】

关键词:行为模式识别;垃圾邮件;简单邮件传输协议

中图分类号:TP393 文献标识码:A文章编号:1009-3044(2007)04-10957-02

1 引言

垃圾邮件,即那些不请自来、匿名或嫁祸他人、对收件人造成骚扰又无法拒绝的邮件。现今,一些包含商业目的、政治目的、色情内容、病毒的垃圾邮件日益猖獗,严重占用了网络资源,阻碍了正常通信,所传播的不当信息对社会造成了极大的负面影响。如何有效地识别、过滤、拒绝这些垃圾邮件成为一个热点社会问题。

现有的反垃圾邮件技术大多是基于被动的接受分析处理模式,只是通过提升信噪比,以免垃圾邮件淹没正常邮件,但垃圾邮件仍占用大量带宽与存储资源,垃圾邮件的发送行为仍处于非受控状态。为此,本文引入行为模式识别技术,通过对发送垃圾邮件的的行为进行分类,进而在源头把垃圾邮件扼杀掉。

2 邮件传输原理

一个电子邮件系统应具有如图1所示的三个主要组成构件,即:MUA、MTA、MDA,其中:MUA(Mail User Agent,邮件用户)是邮件阅读、编辑、发送的程序,在邮件系统中用户只与MUA打交道,MUA将邮件系统的复杂性与用户分开;MTA(Mail Transfer Agent,邮件传输)是一个专用程序,类似于邮局,用于两台机器之间发送邮件,它决定邮件到达目的地的路径;MDA(Mail Delivery Agent,邮件递交),因为MTA并不完成最终的邮件发送,它要调用MDA来完成最后的投递服务[1]。一封电子邮件的发送和接受过程如图1所示。它采用SMTP技术。SMTP(Simple Mail Transfer Protocol,简单邮件传送协议)采用客户服务器方式,规定了两个相互通信的SMTP进程之间应如何交换信息。SMTP通信要经过同TCP传输相似的连接建立、邮件传送、连接释放三个阶段,本质上SMTP协议是带有邮件传输规范和命令的TCP协议。它缺乏必要的安全认证,由此引起垃圾邮件的泛滥。

图1 电子邮件系统示意图

3 传统的反垃圾邮件技术

首先是内容过滤技术,它根据开发人员认定的垃圾邮件特征词来扫描邮件内容,进而判定是否为垃圾邮件,并使用启发式语意学习技术。但该技术需要将邮件接收下来再进一步处理,没有节省流量和存储过程却增加了计算程度,同时关键词库需要不断更新维护,是一种被动的选择处理,最终过滤过程需要耗费大量系统资源,使邮件系统效率低下。

其次是黑白名单技术,黑名单中的发件人发送的任何邮件都认为是垃圾邮件,白名单中的发件人发送的任何邮件都认为是合法邮件。该技术需要不断维护IP地址清单,且在IP地址被公布十已发送了大量邮件,所以该方法也是一种亡羊补牢之举;同时缺乏公正,且打击范围大,误判范围广。

还有Yahoo提出的DomainKey技术,它的核心思想是每个域名(Domain Name)都申请一个PKI证书,然后把公匙(公共密码)存储在DNS服务器中。发件服务器对每一封使用这台服务器私匙(私人密码)的电子邮件进行签名,收件服务器验证发件服务器签名是否有效。该技术需要对现在所有的邮件服务器进行升级改造,需要业界的共同行动。对于大公司的专利垄断行为有悖于邮件系统的开放性原则。

4 基于行为模式识别的反垃圾邮件技术

结合邮件传输原理及传统反垃圾邮件技术的弊病和局限性,作者认为,垃圾邮件的处理应该从原理上入手,分析邮件传输的过程及SMTP(或TCP)的建立阶段,从截获样本、解析特征、生成规则、规则下发、邮件过滤的被动方式中解脱出来,做到主动性防御。根据对垃圾邮件发送行为规律的总结,发现其有IP固定性、发送频率大、时间集中、借用邮件服务器漏洞、发信地址不明、路由地址不明、服务器不明和TCP会话异常等特点,在此基础上,建立了基于行为识别技术的反垃圾邮件模型。

模型建立

垃圾邮件在发送阶段处于活跃的状态,其行为特征远比内容特征要明显,经过对大量垃圾邮件搜集、分类,对各种垃圾邮件的发送行为、方式、邮件特征等进行统计学研究,构建了垃圾邮件“行为识别模型”(如图2)。该模型全面加入了各类行为相关因素,包含了邮件发送过程中的各类行为要素,如:时间、频度、发送IP、服务器特征等。

图2 垃圾邮件行为模式识别模型示意图

垃圾邮件行为分类及防范策略

通过对发送垃圾邮件行为的统计分析,垃圾邮件行为主要可分为四类:1)滥发邮件行为。贪婪,数量巨大是垃圾邮件的最本质特征,为此垃圾邮件发送者进行联机查询或投递邮件,通过各种方式投递邮件。因此,发送主机会有异常变动等行为。2)匿名邮件行为。垃圾邮件发送者刻意隐匿发送人、收件人、发件主机或邮件路由等信息。3)非法邮件行为。发送者利用其它邮件服务器的漏洞,借用Open Relay或Open-Proxy来发送垃圾邮件。4)伪造邮件行为。刻意伪造邮件头干扰信息,使发件人、收件人、发件主机或邮件路由等信息不属实。

针对这四种发送垃圾邮件行为,特提出四种相应防范策略:(1)防范滥发邮件行为。深入追踪邮件原始发送数据,取得TCP连接建立时所需的IP地址及SMTP连接建立的域名,以此来统计在一特定时间段内发送的邮件数量,做出是否垃圾邮件的判断。(2)防范匿名邮件行为。深入追踪邮件原始发送数据,一旦发现发件人声明的邮件传输记录信息不真实,而是以匿名方式投递或是发件人的邮件传输信息具有异常变化,就会将其判断为具有匿名行为的垃圾邮件。(3)防范非法邮件行为。深入追踪邮件原始发送数据,检查其原始发送地址,如果发现其发送地址不固定或改变频率高,则说明它在利用其它的邮件服务器进行转发,符合常见垃圾邮件发送行为,从而把它归为垃圾邮件。(4)防范伪造邮件行为。通过深入追踪邮件原始发送数据,如果发现发送人声明域名与实际来源IP不符合,发件人伪造成无反向解析域名记录的主机,发件人以答复邮件格式伪造电子邮件,发件人的邮件传输值多处变化、信息不一等,就会将其判断为具有伪造行为的垃圾邮件。

邮件处理流程

行为模式识别技术以插件形式布置与服务器,利用现有资源,无需更新。如图3所示,当有新邮件到达时,根据其IP传输信息、SMIP会话信息、邮件头信息等,逐层提取,逐渐验证,逐次识别,由符合上述行为的特征来断定垃圾邮件,从而做到了最大限度的低漏判误判率,适合大规模邮件服务器。

在部署服务器的同时,主要用到四种技术来处理垃圾邮件。(1)频率限制技术:限制同一IP或网段单位时间发来的邮件数量;限制同一IP或网段单位时间发来的同一主题的邮件数量;限制同一IP或网段单位时间发来的同一发件人的邮件数量;限制同一IP或网段单位时间发来的相同大小的邮件数量等;(2)可变陌生访问限制(Variable Strange Visiting Limit,VSVL):是一种控制垃圾邮件发送的技术,但不是一种单纯的发送端控制技术,而是一个需要邮件发送到接收处理各个环节共同参与的体系,该体系通过设定发信限额规则、限额设定规则、限额调整规则,做到自动拒收、处理、反馈垃圾邮件;(3)重复模式检测技术(Repeat Pattern Detect,RPT):通过检测发件人发送行为的大量重复过程,来对垃圾邮件做出最初判断;(4)域名解析与反解析技术:即通过TCP/IP协议与域名服务器通信,根据域名获得服务器地址或根据IP地址获得域名。

图3 邮件处理流程图

5 存在的问题及以后的研究方向

作者通过对垃圾邮件处理的一些探索,提出了基于行为模式识别的反垃圾邮件新机制。在此技术的研究上,还存在一些问题:

(1)本文着重是在原理方法上的分析,行为识别模型也是简要设计,因此今后的研究重点应该是如何把方法模型付诸于实际运用;

(2)在行为识别的层次上,从浅层的识别到深层的追踪还要很好的结合,即如何把浅层的发送时间、频率、IP等行为与深层的邮件通讯行为追踪相结合。

参考文献:

[1]谢希仁。计算机网络(第四版)[M].电子工业出版社,2003(6):292.

[2]反垃圾邮件技术概述[EB/OL].ChinaUnix技术沙龙,.

[3]Henry Ho-Shing Hsieh,Henry Ker-Chang Chang,Jin Cherng Lin. The Mechanism of Interceptive E-mail Detection System,[J] 2000.

[4]潘文锋。基于内容的垃圾邮件过滤研究[D].中国科学院研究生院硕士学位论文,2004(7).

[5]2005年第三次中国反垃圾邮件状况调查报告[C].中国互联网协会反垃圾邮件中心,2005(11).

[6]叶豪,反垃圾邮件概述[C].中国反垃圾邮件技术研讨会,2004(10).

[7]Vapnik V,Drucker H,,Support Vectpor Machines for Spam Categorization[J],IE Transactions on Neural Network,1999(10).

模式识别技术【第三篇】

关键词:语音识别;信息技术;发展趋势

中图分类号: 文献标识码:A 文章编号:1007-9599 (2012) 19-0000-02

近年来,随着科学技术的进步,语音识别技术的发展,通过语言操纵机器的梦想正在逐步变为现实。语音识别是语音信号处理的一个重要的研究方向,经过50多年的积累研究,尤其是近20年来,语音识别技术取得了显著进步,并且广泛应用于商业,比如苹果的siri系统。本文从语音识别的发展历史、发展方向来着重分析未来语音识别技术的发展趋势。

1 语音识别技术的发展历史

语音识别技术在国际的发展

早在三四十年前,美国的一些大学和实验室就开始了语音识别技术的研究,50年代的AT& T Bell实验室研发的Audry系统第一个实现了可识别十个英文数字。60和70年代,提出了线性预测分析技术(LP)等相关理论并深入研究,创造出可以实现特定人孤立语音识别系统;80年代和90年代是语音识别技术应用研究方向的高潮,HMM模型和人工神经元网络(ANN)的成功应用,使得语音识别系统的性能比以往更优异;伴随着多媒体时代的来临,微软,Apple等著名公司都研发出相当成功的商业应用语音识别系统,比如,Apple的Siri系统,微软的Phone Query (电话语音识别)引擎等。

语音识别技术在国内的发展

我国的语音识别研究工作虽然起步较晚,但由于国家的重视,研究工作进展顺利,相关研究紧跟国际水平。由于中国有不可忽视的庞大市场,国外对中国的语音识别技术也非常重视,汉语语音语义的特殊性也使得中文语音识别技术的研究更具有挑战。但是,国内研究机构在进行理论研究的同时,应注重语音识别系统在商业中的应用,加快从实验室演示系统到商品的转化。

现如今,许多用户已经能享受到语音识别技术带来的方便,比如智能手机的语音操作等。但是,这与实现真正的人机交流还有相当遥远的距离。目前,计算机对用户语音的识别程度不高,人机交互上还存在一定的问题,语音识别技术还有很长的一段路要走,必须取得突破性的进展,才能做到更好的商业应用,这也是未来语音识别技术的发展方向。

2 语音识别技术的技术实现及困难

语音识别技术的实现方式是声音通过转换装置进入机器,而机器配有“语音辨识”程序,程序将得到的声音样本与数据库存储的样本进行比对,输出最匹配的结果,转化为机器语言,进而执行命令。真正建立辨识率高的语音辨识程序组,是非常困难而专业的,专家学者们研究出许多破解这个问题的方法,如傅立叶转换、倒频谱参数等,使目前的语音辨识系统已达到一个可接受的程度,并具有较高辨识度。

语音识别的技术实现方式

语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面,其中,最基础的就是语音识别单元的选取。

(1)语音识别单元的选取。语音识别研究的基础是选择语音识别单元。语音识别单元有单词(句)、音节和音素三种,具体选择哪一种语音识别单元由具体研究任务的类型决定:

单词(句)单元在中小词汇语音识别系统中应用广泛,但由于模型库过于庞大,模型匹配算法复杂,实时性不强,所以不适合大词汇系统;

音节单元主要应用于汉语语音识别,因为汉语是单音节结构的语言,虽然有大约1300个音节,但无调音节共408个,相对较少,所以音节单元在中、大词汇量的汉语语音识别系统上是可行的。

音素单元之前曾广泛应用于英语语音识别,也越来越多的应用于中、大词汇量汉语语音识别系统中。原因在于汉语音节仅由22个声母和28个韵母构成,把声母细化,虽然增加了模型数量,但是提高了易混淆音节的区分能力

(2)特征参数提取技术。特征提取就是对语音信号进行分析处理,把丰富的语音信息中的冗余信息去除,获得对语音识别有用的信息。这是一个对语音信号进行信息压缩的过程,目前经常采用的特征参数提取技术是线性预测(LP)分析技术。基于LP技术提取的倒谱参数再加上Mel参数和基于感知线性预测(PLP)分析提取的感知线性预测倒谱对人耳处理声音的模拟,进一步提高了语音识别系统的性能。

(3)模式匹配及模型训练技术。早期的语音识别应用的模式匹配和模型训练技术是动态时间归正技术(DTW),它在孤立词语音识别中获得了良好性能,但是由于对大词汇量以及连续语音识别的不准确,目前已经被隐马尔可夫模型(HMM)和人工神经元网络(ANN)所取代。

语音识别遇到的困难

目前,语音识别研究工作进展缓慢,困难具体表现在:

(一)语音识别系统对环境敏感,采集到的语音训练系统只能应用于与之对应的环境,而且当用户输入错误时不能正确响应,应用起来相对困难;(二)必须采取新的新号处理方法来处理人在高噪声环境下的发音变化的问题;(三)语言模型、语法及词法模型在中、大词汇量连续语音识别中无法正确、合理的运用,需要有效地利用语言学、心理学及生理学等方面的研究成果;现阶段的科学技术对人类生理学诸如听觉系统分析理解功能、大脑神经系统的控制功能等还不够,更无法应用于语音识别;语音识别系统从实验室演示系统向商品的转化过程中还有许多具体细节技术问题需要解决。

3 语音识别技术的发展趋势

进一步提高可靠性

目前语音识别系统很难做到排除各种声学环境因素的影响,而人类语言在日常生活中的随意性和不确定性给语音识别系统造成极大的识别困难。所以,要应用现代技术智能化语音识别系统,以达到更好的识别效果;

增加词汇量

目前语音识别系统使用的声学模型和语音模型过于局限,需要通过改进系统建模方法、提高搜索算法的效率来做到词汇量无限制和多重语言混合,减少词汇量对语音识别系统的限制;

微型化并降低成本

语音识别系统在商业上的用途相当广泛,利用先进的微电子技术,将具有先进功能和性能的语音识别应用系统固化到更加微小的芯片或模块上,可以缩减成本,更方便的推广和使用。语音识别系统和微电子芯片技术的发展将引领信息技术革命到一个新的台阶。语音识别系统使人沟通更加自由,使人可以方便地享受到更多的社会信息资源和现代化服务。这必然会成为语音识别技术研究和应用的重要发展趋势。

4 结束语

21世纪,信息和网络飞速发展,信息和网络的时代已经来临,人与人之间的距离随着Internet和移动电话网的连接和普及变得越来越近,信息资源扩散的越来越迅速,人与机器的交互显得尤为重要。语音识别技术的研究和应用可以让人无论何时何地都可以通过语音交互的方式实现任何事,可以使人更方便的享受更多的社会信息资源和现代化服务,所以,如何将这一技术可靠的、低成本的应用于商业和日常生活,是语音识别技术的发展方向和趋势。

参考文献:

[1]刘钰。语音识别技术概述[J].计算机光盘软件与应用,2010:14-17.

[2]盛青。语音自动识别技术及其软件实时实现[J].西北工业大学,2001:45-47.

[3]廖锎。浅析语音识别技术的发展及趋势[J].科技传播,2010:34-36.

[4]陈方,高升。语音识别技术及发展。CIO时代论坛,2009:67.

模式识别技术范文【第四篇】

关键词 车辆牌照 识别技术 模块

中图分类号:U491 文献标识码:A

0引言

随着智能化交通管理的不断发展,电子收费等就成了具体要解决的难题,尤其是车辆牌照的自动识别技术更成了智能化交通管理发展的瓶颈。

车辆牌照识别技术指的是一个专用的计算机模拟视觉系统,从特定目标中获取出车牌的图像,并通过分割字符等技术,对车辆牌照进行识别,涉及到模式识别技术、人工智能等,可以实时监控出车牌的数字以及字母等,通过电脑算法给出以数据形式的运行结果,实现车辆牌照自动识别。

车辆牌照识别技术全面的应用了图像处理技术,模式识别方法和人工智能技术。主要处理监测动态的视频信息中包含车牌的图像,并针对复杂情况的车牌实现定位和识别。

1国内外发展现状

国外一些发达国家对于迅猛发展的现代交通产业的适应性进步,源于上个世纪的80年代,发达国家就已经开始把图像处理相关技术应用到公路交通等的自动化管理体系中,继而开始了对车辆牌照的识别研究。其中包括车速检测方向、车流量检测方向、车外观检测方向和车牌牌照识别的检测以及车辆的事故处理检测等。

最早的交通系统管理中应用的图像处理相关技术比较单一,就是利用不含有车辆的一副图像做为参照图像,对获取的图像与参照图像进行分析和比较图像的灰度,再采用差分的方式,对车辆区域进行计算。这样可以大略的得出车辆的即时车速,单位时间通过的车流量统计以及道路的承载力等。

车辆牌照识别技术经过多年的不断发展完善,在许多国家已经有了很多电子收费系统、自动识别系统都应用了该技术,比如optasia公司和亚洲视角公司的产品,不过这些产品都是针对英文和数字进行识别,不能识别出汉字。近些年,我国也有一些车辆牌照识别系统的应用,比如汉王公司的系统,取得了一定的突破,技术和算法都相对完善。

2车辆牌照识别技术

车辆牌照识别系统主要可以分为:图像采集模块、图像处理模块、车牌定位模块、字符切分模块和字符识别模块。如图所示:

图 车辆牌照识别技术流程

(1)图像采集模块。该模块通过对交通主管部门指定的摄像机与图像采集卡或者与笔记本电脑等实施连接记性图像采集,把图像模拟信号转变成数字信号。

(2)图像处理模块。该模块是对图像采集模块获取到的图像进行图像的增强化、恢复以及变换等电脑处理,用以把车牌特征明显化,使得车牌区域更容易被提取。

(3)车牌定位模块。该模块是以人眼睛的视觉方式,依据车牌上的字符区域的具体特征,利用二值化图像提取出相关的特点,定位出最吻合的牌照特征的目标区域。由于图像采集中的噪声和复杂的背景图案都能对定位进行干扰,所以说,车牌定位模块是整个车辆牌照识别技术中的难点和关键点。

(4)字符分割模块。该模块是从获取到的牌照信息的特定区域中分隔出单个的字符,用于接下来的字符识别模块。车牌上的信息除了一个汉字之外,所有的都是数字和字母,那么每个字符都是独立并且单独相连,所以可以用特殊的计算方法进行字符的分割功能。

(5)字符识别模块。该模块是利用分割完成的字符,进行文本形式转化,并储存到数据库中或者直接通过客户终端显示出来的功能。

3小结

本文对车辆牌照识别技术进行了分析与研究,从车辆牌照识别技术的概念,主要研究内容进行了阐述,对国内外的发展情况进行了阐述,同时对车辆牌照的识别相关技术进行了全面的流程化分析。为今后车辆牌照识别技术的进一步应用和研究提供了理论保证。

参考文献

[1] 黎绍发,陈智斌。车牌自动识别技术的研究[J].机电工程技术,2003,18(l):55-57.

[2] 徐建闺,贺敬凯。车型与车牌自动识别技术分析[M].交通与计算机,2002,20(2):7-12.

[3] 张苗,妇匕明海,顾勤龙。车辆牌照识别系统的一个新的实现方法[J].控制工程,2003,10(1):59-61.

模式识别范文【第五篇】

关键词:模式识别;本科教学;教学实践;教学改革

随着电子信息技术的迅速发展和信息处理自动化需求的不断扩大,模式识别方法和技术在信息处理领域中的重要性越来越受到重视。在吸引了众多研究者投身到模式识别研究领域的同时,模式识别的教学也从研究生教学逐渐延伸到了本科教学。模式识别作为计算机、电子信息技术等专业的专业基础课程,已经在越来越多的高等院校开设。本科模式识别课程主要讨论以统计学为基础的模式识别理论和方法,内容包括:贝叶斯决策理论以及参数估计方法、以误差函数最小化为原则的线性和非线性判别、近邻规则、特征提取和选择、聚类分析、神经网络、支撑矢量机、随机方法、非度量方法、独立于算法的机器学习等内容[1]。由于模式识别研究领域的广泛性,模式识别本科教学的内容和侧重点的安排目前尚处于探索阶段。模式识别领域的发展日新月异,这就要求教师在授业解惑的同时能够与时俱进地介绍该领域的发展前沿,从而培养学生主动探索知识的兴趣。

本文将结合本科模式识别教学的实践,分析该课程在内容设置方面面临的问题并给出相应的解决问题的建议;结合模式识别课程的特点,提出了以应用实例为先导的教学方法,以提高学生的学习兴趣;针对不同类型的学生,提出了如何培养学生实践能力和科研兴趣的方法。

1模式识别教学内容的层次划分和讲授方法

模式识别是一门理论与实践紧密结合的学科,其理论基础涉及高等数学、线性代数、数理统计、矩阵论、随机过程、工程优化方法、小样本统计学习理论、模糊数学等学科[2]。然而除了高等数学、线性代数和数理统计,其他课程都是研究生阶段才会开设的数学基础课。这就使得本科的模式识别教学面临着尴尬的局面:既不能花过多的时间讲数学基础知识,又要把以这些数学知识为基础的内容讲清楚。面对这一难题,我们在教学实践中总结出了一套办法,具体做法是将教学内容划分为基础型、前沿型两类;并采用弱化公式推导,强调数学表达式物理含义的方法进行讲授。

基础型教学指的是已经发展完善的模式识别原理和方法。基础型内容包括:贝叶斯决策理论、概率密度函数估计、线性判别、近邻规则、独立于算法的机器学习等内容。贝叶斯决策理论和概率密度函数估计是以数理统计为基础的[3],这一部分也是模式识别的重点内容。线性判别是以高等数学和线性代数为基础,同时涉及工程优化方法课程的部分内容。在这部分内容中,公式推导占据了相当大的篇幅,而且推导过程是学生可以理解和掌握的。对于基础型的内容,可以采取理论推导和实际例子相结合的讲授方式。在公式推导的过程中,尤其要强调公式的物理含义,同时给出几个有趣的例子,在增强记忆加深理解的同时提高学生的学习兴趣。

前沿型教学指的是正在发展中的模式识别原理和方法。前沿型内容包括:特征提取和选择、聚类分析、神经网络、支撑矢量机、随机方法等内容。这部分内容或者是数学基础超出了本科生的能力范围,或者处于发展前沿,很多内容正处于探讨阶段。对于前沿型的内容,可以忽略公式推导过程,直接讲授推导的结论以及结论的物理含义,同样结合实际例子加深学生的理解。对于发展中的模式识别方法可以适当介绍该领域的发展前沿,在开拓视野的同时激发学生的科研兴趣,引导部分学生从事感兴趣的科学领域的研究。

2实例先导的教学方法

模式识别方法是为了解决信息处理中面临的识别问题而提出的。在讲授方法之前,首先要明确将要介绍的模式识别方法的应用背景和使用范围,而不是像我们通常做的那样,先介绍方法的理论基础和流程,最后再给出一个例子,或者通过课后练习和作业的形式让学生掌握课程介绍的理论和方法的应用。针对本科模式识别课程的特点,我们在教学实践中摸索出了一套以实例为先导的教学方法,并与上机实验和课程设计相结合,大大提高了学生的学习兴趣和动手能力,取得了良好的教学效果。

实例先导的教学方法是在介绍每一章或者相关的几章内容之前首先用一个实际的例子引出要学习的内容,在相关内容的学习结束之后给出解决实例问题的模式识别方法。例如:在讲授贝叶斯决策理论之前,给出根据长度和光泽度等数值特征识别鲑鱼和鲈鱼的例子[4];在讲授决策树之前,给出根据颜色,形状、尺寸等非度量特征识别水果的例子等等。通过学习,找到了解决这类问题的一般方法,同时学生也通过实例记住并理解了该方法的适用范围。又例如在讲授特征的选择与提取这一章时,先不讲特征空间的映射和变换,而是从几个实例出发,说明并不是特征越多越好,而是要选择合适的特征向量;特征的组合变换可以使复杂的分类问题转化为简单的问题等。从而让学生更好地理解特征选择和提取的目的和重要性。

在接触到实际的模式识别问题时,会引发学生的思考。在授课过程中,教师可以针对具体问题组织学生进行讨论,看是否能够利用已学过的模式识别方法解决该问题。若可以解决,则引导学生分析用已学方法解决该问题时存在的不足,从而引出下面将要介绍的新方法。这样,在介绍新方法的同时,学生会很自然地将新方法与旧的方法进行比较,分析各种方法的优劣,有利于学生对教学内容的深入理解和掌握。这种方法在讲授解决同一类模式识别问题的不同方法时是适用的。如在讲授贝叶斯决策时,可以通过对比的方式介绍几种决策规则的特点,又如在讲授线性判别方法中各种形式的感知器算法时,也可以对比学习各种算法的优劣。若该模式识别问题不能用已学的方法解决,则引导学生分析该模式识别问题的特点,思考为何必须引入新的模式识别方法来解决该问题,学生是否能够提出自己的解决方案。在分析和思考之后,教师再将解决该问题的思路引入到下面将要介绍的新方法上。这种方法在讲授解决不同类型的模式识别问题时是适用的。如在讲授非度量模式识别方法时,面对非度量语义属性的模式识别问题是前面介绍的方法无法解决的,要引入非度量模式识别方法加以解决。

因此我们建议在教材的编写上可以尝试采用实例先导的方法。首先在引言部分给出一个实际例子,然后在介绍方法的部分结合理论分析给出解决实例问题的方法。这种方法有利于提高学生的学习兴趣,增强记忆,加深理解。

3实践能力和科研兴趣的培养

模式识别是一门理论和实践紧密结合的科学,该学科的发展日新月异,在计算机和信息处理领域的地位越来越重要。因此,在模式识别课程的教学过程中要注重学生实践能力和科研兴趣的培养。在教学实践中,我们采用了上机实验和科学报告相结合的教学方式。

掌握各种模式识别方法的原理和流程是本科模式识别教学的第一个阶段。在此基础上,我们要求学生在计算机上实现模式识别方法并用于解决实际的模式识别问题。在上机实现的过程中,学生不仅需要掌握模式识别问题在计算机中的表示方法和识别结果的展示形式,尤其重要的是学生需要对模式识别方法的每一个细节都要深入理解和掌握才能将算法实现。在上机教学中,我们采用了Matlab编程环境实现课程中介绍的模式识别方法。Matlab的编程语言简单高效,而且提供了功能强大的图形展示功能[5]。例如在贝叶斯决策和线性分类器的上机实验中,学生可以利用画图函数用不同的颜色和符合标记不同类别的样本,可以轻松地画出决策面,这种可视化的分类结果展示形式不仅提高了学生的学习兴趣,而且加深了学生对模式识别方法及其特点的理解。

在学生成绩考核中,除了笔试成绩我们还增设了上机作业成绩和科学报告成绩两个部分。上机作业的内容是要求学生从若干个上机题目中选择有兴趣的实现一个简单的模式识别系统。例如设计实现贝叶斯分类器、线性分类器、神经网络分类器、决策树等。科学报告可以有两种形式,要求学生或者在模式识别领域的主流英文期刊上选择感兴趣的英文文献,将其翻译为中文;或者就模式识别领域的一个感兴趣的话题谈谈自己的看法和主张。通过上机作业和科学报告的形式,学生的动手能力得到了良好的锻炼。不仅提高了学生的学习热情,而且引导学生积极思考,不少同学在科学报告中提出了自己的学术看法和主张,有些内容颇具独到的见解。

在学生成绩考核中,除了笔试成绩我们还增设了上机作业成绩和科学报告成绩两个部分。上机作业的内容是要求学生从若干个上机题目中选择有兴趣的实现一个简单的模式识别系统。例如设计实现贝叶斯分类器、线性分类器、神经网络分类器、决策树等。科学报告可以有两种形式,要求学生或者在模式识别领域的主流英文期刊上选择感兴趣的英文文献,将其翻译为中文;或者就模式识别领域的一个感兴趣的话题谈谈自己的看法和主张。通过上机作业和科学报告的形式,学生的动手能力得到了良好的锻炼。不仅提高了学生的学习热情,而且引导学生积极思考,不少同学在科学报告中提出了自己的学术看法和主张,有些内容颇独到的见解。

4结语

本科模式识别教学由于学生的数学基础有限而面临着两难的境地。既要把原理和方法讲清楚,又不能过多的涉及复杂的数学推导,这给教学带来很大困难。在教学实践中,我们把教学内容划分为基础型、前沿型两类,并提出了弱化公式推导,强调公式的物理含义,以及结合实例增强记忆的教学方法。为了提高学生的学习兴趣,加深理解,我们提出了实例先导的教学方法。用实际例子引导学生思考,加深学生对模式识别方法应用背景和适用范围的理解。模式识别是实践性很强的科学,并且该学科的发展十分迅速。在教学实践中,我们十分重视学生动手能力和科研兴趣的培养。通过上机作业和科学报告的形式引导学生积极动手,积极思考。

参考文献:

[1] 边肇祺,张学工。 模式识别[M]. 2版。 北京:清华大学出版社。 ,2002:9-303.

[2] 顾波。 模式识别本科教学方法浅谈[J]. 中国科教创新导刊。,2010(4):68.

[3] Andrew R. Webb. 统计模式识别[M]. 2版。 王萍,等,译。 北京:电子工业出版社,2004:1-10.

[4] Richard O. Duda,Peter E. Hart,David G. Stork. 模式分类[M]. 2版。 李宏东,姚天翔,等,译。 北京:机械工业出版社。 ,2003.

[5] 杨淑莹。 模式识别与智能计算:Matlab技术实现[M]. 北京:电子工业出版社,2008:1-300.

Teaching Practices on Undergraduate Patten Recognition Course andCurriculum Reforming

QI Yu-tao1,2, LIU Fang 1,2, JIAO Li-cheng 2

(1. School of Computer Science and Technology, Xidian University, Xi’an 710071, China; 2. Institute of Intelligent Information Processing, Xidian University, Xi’an 710071, China)

48 626075
");