数据挖掘论文精选4篇

网友 分享 时间:

【路引】由阿拉题库网美丽的网友为您整理分享的“数据挖掘论文精选4篇”文档资料,以供您学习参考之用,希望这篇范文对您有所帮助,喜欢就复制下载支持吧!

数据挖掘论文【第一篇】

摘 要:数据挖掘技术在各行业都有广泛运用,是一种新兴信息技术。而在线考试系统中存在着很多的数据信息,数据挖掘技在在线考试系统有着重要的意义,和良好的应用前景,从而在众多技术中脱颖而出。本文从对数据挖掘技术的初步了解,简述数据挖掘技术在在线考试系统中成绩分析,以及配合成绩分析,完善教学。

关键词:数据挖掘技术;在线考试;成绩分析 ;完善教学

随着计算机网络技术的快速发展,计算机辅助教育的不断普及,在线考试是一种利用网络技术的重要辅助教育手段,其改革有着重要的意义。数据挖掘技术作为一种新兴的信息技术,其包括了人工智能、数据库、统计学等学科的内容,是一门综合性的技术。这种技术的主要特点是对数据库中大量的数据进行抽取、转换和分析,从中提取出能够对教师有作用的关键性数据。将其运用于在线考试系统中,能够很好的处理在线考试中涉及到的数据,让在线考试的实用性和高效性得到进一步的增强,帮助教师更加快速、完整的统计考试信息,完善教学。

1.初步了解数据挖掘技术

数据挖掘技术是从大量数据中"挖掘"出对使用者有用的知识,即从大量的、随机的、有噪声的、模糊的、不完全的实际应用数据中,"挖掘"出隐含在其中但人们事先却不知道的,而又是对人们潜在有用的信息与知识的整个过程。

目前主要的商业数据挖掘系统有SAS公司的Enterprise Miner,SPSS公司的Clementine,Sybas公司的Warehouse Studio,MinerSGI公司的Mineset,RuleQuest Research公司的See5,IBM公司的Intelligent,还有 CoverStory, Knowledge Discovery,Quest,EXPLORA, DBMiner,Workbench等。

2.数据挖掘在在线考试中的主要任务

数据分类

数据挖掘技术通过对数据库中的数据进行分析,把数据按照相似性归纳成若干类别,然后做出分类,并能够为每一个类别都做出一个准确的描述,挖掘出分类的规则或建立一个分类模型。

数据关联分析

数据库中的数据关联是一项非常重要,并可以发现的知识。数据关联就是两组或两组以上的数据之间有着某种规律性的联系。数据关联分析的作用就是找出数据库中隐藏的联系,从中得到一些对学校教学工作管理者有用的信息。就像是在购物中,就可以通过顾客的购买物品的联系,从中得到顾客的购买习惯。

预测

预测是根据已经得到的数据,从而对未来的情况做出一个可能性的分析。数据挖掘技术能自动在大型的数据库中做出一个较为准确的分析。就像是在市场投资中,可以通过各种商品促销的数据来做出一个未来商品的促销走势。从而在投资中得到最大的回报。

3.数据挖掘的方法

数据挖掘技术融合了多个学科、多个领域的知识与技术,因此数据挖掘的方法也呈现出很多种类的形式。就目前的统计分析类的数据挖掘技术的角度来讲,光统计分析技术中所用到的数据挖掘模型就回归分析、逻辑回归分析、有线性分析、非线性分析、单变量分析、多变量分析、最近邻算法、最近序列分析、聚类分析和时间序列分析等多种方法。数据挖掘技术利用这些方法对那些异常形式的数据进行检查,然后通过各种数据模型和统计模型对这些数据来进行解释,并从这些数据中找出隐藏在其中的商业机会和市场规律。另外还有知识发现类数据挖掘技术,这种和统计分析类的数据挖掘技术完全不同,其中包括了支持向量机、人工神经元网络、遗传算法、决策树、粗糙集、关联顺序和规则发现等多种方法。

4.数据挖掘在考试成绩分析中的几点应用

运用关联规则分析教师的年龄对学生考试成绩的影响

数据挖掘技术中的关联分析在教学分析中,是一种使用频繁,行之有效的方法,它能挖掘出大量数据中项集之间之间有意义的关联联系,帮助知道教师的教学过程。例如在如今的一些高职院校中,就往往会把学生的英语四六级过级率,计算机等级等,以这些为依据来评价教师的教学效果。将数据挖掘技术中的关联规则运用于考试的成绩分析当中,就能够挖掘出一些对学生过级率产生影响的因素,对教师的教学过程进行重要的指导,让教师的教学效率更高,作用更强。

还可以通过关联规则算法,先设定一个最小可信度和支持度,得到初步的关联规则,根据相关规则,分析出教师的组成结构和过级率的影响,从来进行教师队伍的结构调整,让教师队伍更加合理。

采用分类算法探讨对考试成绩有影响的因素

数据挖掘技术中的分类算法就是对一组对象或一个事件进行归类,然后通过这些数据,可以进行分类模型的建立和未来的预测。分类算法可以进行考试中得到的数据进行分类,然后通过学生的一些基本情况进行探讨一些对考试成绩有影响的因素。分类算法可以用一下步骤实施:

数据采集

这种方法首先要进行数据采集,需要这几方面的数据,学生基本信息(姓名、性别、学号、籍贯、所属院系、专业、班级等)、学生调查信息(比如学习前的知识掌握情况、学习兴趣、课堂学习效果、课后复习时间量等)、成绩(学生平常学习成绩,平常考试成绩,各种大型考试成绩等)、学生多次考试中出现的易错点(本次考试中出现的易错点,以往考试中出现的易错点)

数据预处理

(1)数据集成。把数据采集过程中得到的多种信息,利用数据挖掘技术中的数据库技术生产相应的学生考试成绩分析基本数据库。(2)数据清理。在学生成绩分析数据库中,肯定会出现一些情况缺失,对于这些空缺处,就需要使用数据清理技术来进行这些数据库中数据的填补遗漏。例如,可以采用忽略元组的方法来删除那些没有参加考试的学生考试数据已经在学生填写的调查数据中村中的空缺项。(3)数据转换。数据转换主要功能是进行进行数据的离散化操作。在这个过程中可以根据实际需要进行分类,比如把考试成绩从0~59的分到较差的一类,将60到80分为中等类,81到100分为优秀等。(4)数据消减。数据消减的功能就是把所需挖掘的数据库,在消减的过程又不能影响到最终的数据挖掘结果。比如在分析学生的基本学习情况的影响因素情况中,学生信息表中中出现的字段很多,可以选择性的删除班别、籍贯等引述,形成一份新的学生基本成绩分析数据表。

利用数据挖掘技术,得出结论

通过数据挖掘技术在在线考试中的应用,得出这些学生数据的相关分析,比如说学生考试中的易错点在什么地方,学生考试成绩的自身原因,学生考试成绩的环境原因,教师队伍的搭配情况等等,从中得出如何调整学校教学资源,教师的教学方案调整等等,从而完善学校对学生的教学。

5.结语

数据挖掘技术在社会各行各业中都有一定程度的使用,基于其在数据组织、分析能力、知识发现和信息深层次挖掘的能力,在使用中取得了显著的成效,但数据挖掘技术中还存在着一些问题,例如数据的挖掘算法、预处理、可视化问题、模式识别和解释等等。对于这些问题,学校教学管理工作者要清醒的认识,在在线考试系统中对数据挖掘信息做出合理的使用,让数字挖掘技术在在线考试系统中能够更加有效的发挥其长处,避免其在在线考试系统中的的缺陷。

参考文献:

[1]胡玉荣。基于粗糙集理论的数据挖掘技术在高校学生成绩分析中的作用[J]。荆门职业技术学院学报,20xx,12(22):12.

[2][加]韩家炜,堪博(Kam ber M.) 。数据挖掘:概念与技术(第2版)[M]范明,译。北京:机械工业出版社,20xx.

[3]王洁。《在线考试系统的设计与开发》[J]。山西师范大学学报,20xx(2)。

[4] 王长娥。数据挖掘技术在教育中的应用[J]。计算机与信息技术,20xx(11)

数据挖掘论文【第二篇】

摘要:中医临床理论多是由著名医家的经验升华形成的,反映了临床上不同学术派系以及不同学科的优势特征,但这其中不免掺杂了个人主观经验,因此本文就中医临床理论研究中医病案为基础,对应用病案数据挖掘结果来总结和重建中医临床理论的方式进行了探讨,认为该方法可为完善中医临床理论提供客观的数据支持,使中医临床理论的来源更具有科学性。

关键词:病案;数据挖掘;中医临床理论;转化医学;临床

科研一体化中医临床理论决定着中医临床学科的发展水平,是中医临床发展的动力。从古至今,中医名医名家辈出,他们的临床经验和学术思想不断提炼升华,逐步形成了传统的中医临床理论。新中国成立以来,中医不断汲取最新的科技成果,进行了大量临床实践,而中医临床理论发展缓慢,己经成为制约当代中医学术发展的瓶颈,对如何开拓中医临床理论的研究,可谓见仁见智,但各种新的临床理论常常裹挟着“各家学说”。在当今大数据和信息技术发达的背景下,运用数据挖掘技术对中医病案进行大数据分析,客观揭示当前中医临床理论的本来面目,尽可能减少个人见解的偏倚,对于推动中医临床理论发展具有重要的现实意义,本文就基于病案数据挖掘的中医临床理论重建进行探讨如下。

1传统中医临床理论的构建框架

中医古典文献是传统中医临床理论的基础

众所周知,中医之所以能够屹立千年不倒,很大一部分原因是因为其有独特的理论体系,而在这其中,中医古典文献做出的贡献应该是第一位的。因为这些古典文献的记载和流传,为后世的医家提供了参考和借鉴,使得我们从前人的思维上不断创新,与临床进行有机结合,不断研究出新的适合于当前时代的临床理论。例如,中医学无论在理论研究还是在临床治疗方面的丰富,许多根本性的理论都是源自于《内经》。该书创立了藏象、经络、诊法等各方面的理论[1],勾画了中医理论的雏形,构建了中医理论体系的基本框架。到后期东汉时期张仲景的《伤寒论》则是创造了以六经辨证和脏腑辨证为主的局面,其所倡导的“观其脉证,知犯何逆,随证治之”使得辨证论治登上新的高度。到了金元时期,就是百家争鸣的时代,这期间以金元四大家为主的学派开始萌生,留下了许多可供后世医家参考的古典文献并创建了不同的临床理论,而明清时期以叶天士和吴鞠通为首确立的卫气营血和三焦辨证,使温病学的辨证理论逐步趋于完善,至今仍是指导临床治疗温热病的理论依据。总之,传统中医临床理论的构建和完善,离不开前人的摸索与贡献,也得益于著名医学家创建的传统中医理论,使得我们现在的中医体系不断的饱满和充实。

当代著名中医的临床经验不断提升为中医临床理论

传统中医的临床理论,在很大程度上展示着著名医家的临床经验。在中医理论与实践发展的相互促进过程中,当代医家通过读书、临证、心悟将实践经验不断总结并升华为理论,又在实践中不断完善既有的理论,成为中医理论发展的重要途径和模式,而当代中医理论的发展则需要将传统理论与现代实践相互融合起来。例如上世纪60年代时,面对中医基础理论中新的思想相对匮乏的这一局面,邓铁涛结合其治疗的临床经验,首次提出了“五脏相关学说”。尽管当时的理论准备并不完善,但是这一理论的提出,在很大程度上完善并且取代了“五行学说”中某些模糊性和不确定性,并且随着时代的发展,逐渐验证了邓老的这一经验的正确性,也成为指导中医临床理论的一大重要体系[2]。又如,脑出血这一现代疾病在古代名为中风,多数是“从风而治”,认为肝脏与中风的关系最为密切。随着时代的推进,自20世纪80年代以来,许多学者根据微观辨证和中医理论“离经之血便是瘀”,提出急性出血中风属中医血证,瘀血阻滞是急性期脑出血的最基本病机,是治疗的关键所在[3]。故现代中医临床治疗上多以活血化瘀法治疗脑出血、脑梗塞这一系列疾病。若是仔细研读传统中医临床理论后,我们不难得出其构成和完善离不开当代著名医家的临床经验,它是在历经岁月的洗礼下不断塑造成型的。

传统中医临床理论不断将现代医学相关内容中医化

传统中医临床理论不断吸收现代医学的理论,将其相关内容不断中医化,将病人的各种证型通过五脏辨证、阴阳五行辨证以及八纲辨证划分得越来越细化,以提供病人在中医临床上治疗的理论依据。中医吸取了现代医学理论后正在不断壮大其内容,现代医学相关内容中医化在许多难治疾病的辨证治疗中都起到了良好的指导作用[4]。如艾滋病是古代传统中医辨证论治的空白,通过对艾滋病中医病因病机、证候规律、治法方药的系统研究,提出了“艾毒伤元”“脾为枢机”“气虚为本”的病因病机学说,确立了艾滋病“培元解毒”“益气健脾”的治疗原则,为中医药防治艾滋病奠定了理论基础,为进一步提高艾滋病的中医药临床诊疗效果提供理论依据[5]。

2当前中医临床理论发展存在的不足

中医主流理论不突出且与时俱进力度不够

不可否认的是,当代的中医临床理论发展也是存在诸多不足的,中医理论的完善和发展是中华五千年来集体智慧的结晶,个别医家提出的临床理论可能各有千秋,其所立的角度和思维也不尽相同。例如,同是治疗输卵管阻塞这一疾病时,朱南孙教授认为多是由于湿蕴冲任所致,其用自拟的清热利湿方来进行治疗;而李广文教授则认为这一疾病多是由于瘀血阻络为主,治疗上以活血祛瘀为法,拟通任种子汤进行治疗[6]。又如对于“和解法”这一治疗方法的理解,当代名医蒲辅周老先生认为“寒热并用,补泻合剂,表里双解,苦辛分消,调和气血,皆谓和解”。而方和谦教授则认为“在治法上扶正祛邪,表里兼顾,此法就为和解法”。不同的医家在面对不同的疾病,甚至是不同的理法方药时,所持的看法常常是“各家学说”,这就导致了当前中医临床理论发展比较混乱,不能全面地体现中国五千年来发展过程中的中医主流理论。目前中医基础理论还存在一个缺陷就是它的与时俱进力度还不够,很多古代经典方药的主治病症,在当今时代已经不再多见了。比如蛔虫导致的蛔厥这一致病因素在现代已经不再常见,对应的乌梅丸的主要适应病症也不再是蛔厥;在针对没有明显临床表现的疾病如乙肝时,按传统中医往往体现出“无证可治”的状态;传统的诊断与现代检查相结合的力度也不够,中医临床基础理论在某些程度上忽略了其与生化、B超、X光、CT等现代检查结果的结合,并没有用中医理论对其做一合理的陈述;且现在临床上很多中药的药理作用、性味归经的研究作用还不够深入、细致,其作用不能在微观上得以解释。这些都导致了临床上很多情况没有从中医理论来认识中医,不是“以中解中”,而是“以西解中”,形成了临床抛弃中医理论的状态[7]。由于中医学是一门实践性很强的学科,它是在哲学辨证的思想指导下,与临床经验不断结合,这与西医知识体系相比较,难免存在一定的滞后性,这都会使得中医临床理论发展相对的落后。

部分中医理论带有权威专家的“个人学说”偏见

传统中医强调个人经验和学说,以中医内科学为例,第八版中的脑系疾病在第九版中已经删除,其涉及到的各种脑系疾病大多数归属于心系疾病与肝系疾病。根据其版本的不同,我们可以明显看出其凸显的中心内容及其思想不同,其多是体现编著者的理论思想,在一定程度上并没有客观地揭示疾病的本质,治疗理论也不够完善,一部分内容与最新研究得出的论文理论不符,这使得当代中医临床理论在某些程度上,带有权威专家的“个人学说”色彩。由于现代西方先进的科技文化流入,使得中医在一定程度上备受质疑,而正是因为人们对于中医理论的一些偏见,才使得中医长期让人诟病。

3新的时代背景下中医临床理论发展方向

临床理论应具有真实性与系统性

中医临床理论的发展方形应当是建立在客观并且真实的临床实践基础上,从一次次临床实践中得出。由于历史时代的原因以及假设推理、模式建设的广泛使用,当代中医临床理论中理论与假说并存的现象较为普遍,如中医的五运六气学说对现代疫病预测和人体各经络脏腑在时间上对于人体治病效果的不同等,就需要我们在扎实的文献与临床实践基础上,对医案进行认真总结,利用科学的方法深入挖掘,开展中医理论的去伪存真研究,以促进中医理论的科学与健康发展。另外,传统的中医临床治疗上所用的理法方药,多是根据个人经验所进行的。随着科技的不断发展与时代的不断进步,当代的中医临床理论应该在成功的中医医案上进行系统的总结,不断挖掘和研究其微观的结构,并随着年月的更迭不断更新,不断完善,使其具有科学性和理论依据。同时,对近年来兴起的传染性非典型肺炎、艾滋病、禽流感等古人所没有经历过的疾病的诊治,中医就其病因病机的认识以及探究相应的诊疗方法,无疑也是一种理论上的创新[8]。通过对其进行深一层次的研究和发现,归纳出合适的治则治法,找到针对这一疾病的理法方药,使其更具有系统性,使得临床上中医治病可以循序渐进,注重整体,也是当代临床理论的一大发展方向。

临床理论具有信息化的特点并可持续拓展

随着时代的进步,当代的中医临床理论可以通过网络等方式进行共享,在大数据的这一时代背景下,随着病案的不断报道与积累,可以将各类成功的中医医案进行统计和挖掘,其结果也会不断进行更新和发展。不同的医家对于某一疾病的认识角度可能不同,其表现在病位、病性、病势和证候的判断标准也不一样,因此方药规律也不一样。而通过统计某一中医或西医疾病的较大样本病例,并对其进行数据挖掘,可以得出整个中医群体对于这一疾病诊治的证候分布、治则治法、处方用药等的规律,甚至可以根据统计的结果探索出新的方药,分析他们的共同点和所在差异。将中医临床理论具有信息化的这一特点不断地拓展下去,通过计算机等客观科学的手段进行分析,与主观的名老中医传承模式相比,更具客观性,更容易被临床医生接受,对各种疾病的中医临床用药也更具有指导价值。

4基于病案数据挖掘的中医临床理论重建

病案研究是中医理论发展的重要基础

在当今大数据的时代背景下,中医固有的传统整体论科学特征有了越来越多的可供改变的空间。这种变化既为其按照自身特有的规律发展特点带来了机遇,也给未来中医理论的发展提出了挑战。同时,学习医案研究也是中医学相关大学生们应该学习的一项内容。阅读医案是必要的训练,也是中医入门的方法之一。医案的故事性引人入胜,在自然而然中接受中医思维方法和传统文化知识,同时医案中所呈现的名医风范,医德对学生起到潜移默化的影响,并培养对专业的热爱[9]。病案客观、真实地直接记录疾病诊断和治疗过程,医案研究作为中医理论发展过程中至关重要的一环,是中医理论发展的重要基础,以研究病案为基础,对于中医理论的形成和临床上中医积累经验,都起到了一定的辅助提升作用。

数据挖掘方法是中医理论发展的现代技术手段

利用多种数据挖掘技术对中医病案中的有关信息行进行归纳、整理,是近年来传承中医临床经验的重要方法之一[10]。通过对同一种疾病的病案进行数据挖掘以分析医者的思路和探索其用药的。方法,对中医临床病案进行规范化的整理,能够深入总结其临床经验,挖掘隐藏在大量病案背后的诊治规律,甚至探索出新的方药配伍,为中医理论的发展提供一定的科学依据的同时,使得中医理论的发展越来越现代化,不仅仅只是停留在以前的靠读书和个人经验的结合,也为广大的中医在日后的临床治疗上提供了新的思路和方向。

临床实践推动理论发展,赋予转化医学新的内涵

目前,我们通过并按数据挖掘来总结一些中医对于治疗同一种疾病所采取的诊断和用药,可以获得新的思路,并且为完善我们现有的中医理论基础可以提供可靠的理论支持。采用数据挖掘技术对中医学术思想和临证经验进行研究,可以全面解析其中的规律,分析中医个体化诊疗信息特征,提炼出临证经验中蕴藏的新理论、新力法,可以实现经验的有效总结与传承[11]。与此同时,要求我们用发展的眼光将现代的科技手段整合加入到传统的中医学理论中去,推陈出新,通过临床实践与基础理论的不断结合,不断完善,推动祖国医学现代化,谱写有关于中医学在转化医学上新的篇章。

参考文献

[1]刘向哲。中医理论创新与发展的基础和机遇[J].中医学报,2010,25(5):884-885.

[2]邱仕君,吴玉生。在基础理论与临床医学之间———对邓铁涛教授五脏相关学说的理论思考[J].湖北民族学院学报(医学版),2005,22(2):36-39.

[3]顾宁,周仲英。通下法治疗急性脑出血研究进展[J].中国中医急诊,2000,9(5):227.

[4]靳士英。邓铁涛教授学术成就管[J].现代医院,2004(9):1-6.

[5]许前磊,徐立然,郭会军,等。艾滋病发病与防治中医理论的初步构建[J].中医杂志,2015,56(11):909-911.

[6]张少聪,周伟生。名老中医验方治疗输卵管阻塞性不孕症概况[J].中华中医药学刊,2010(3):489-491.

[7]孟静岩,应森林。试论中医基础理论指导临床研究的思考与途径[J].上海中医药大学学报,2009(3):3-5.

[8]邢玉瑞。新形势下中医理论发展的思考[J].中医杂志,2016,57(18):1540-1542.

[9]卢峰,聂达荣,彭美玉,等。中医内科学应用名老中医病案教学法的探索[J].中国中医药现代远程教育,2014(18):80-82.

[10]郭军。基于数据挖掘分析前名老中医病案整理的思路与方法[J].中医药信息,2011,28(2):49-50.

[11]吴嘉瑞,唐仕欢,郭位先,等。基于数据挖掘的名老中医经验传承研究述评[J].中国中药杂志,2014,39(4):614-617.

数据挖掘论文【第三篇】

摘要:本文简述如何将数据挖掘技术应用于图书馆各部门管理中,帮助图书馆管理者依据数据挖掘技术更好地为读者提供科学化和人性化的服务,促进图书馆事业的创新与发展。

关键词:高校图书馆;数据挖掘;创新;发展。

随着网络技术、计算机技术的快速发展,高校图书馆事业也顺应时变,不断向高科技、高水平领域进展,尤其是当今处于数字信息发展的时代。如果利用图书馆现有以及收集的数据资源,通过数据挖掘技术来分析、筛选对图书馆有用的数据信息,依据提炼的数据资源来指导、推进图书馆事业的创新与发展,是当今信息时代图书馆亟待研究、探讨的一个问题。本文将简述如何将数据挖掘技术应用于图书馆各部门管理之中,帮助图书馆管理者依据数据挖掘技术更好地为读者提供科学化和人性化的服务,促进图书馆的事业创新与发展。

一、数据挖掘技术综述。

数据挖掘定义。数据挖掘(Data Mining,DM)是一种新的信息处理技术,其主要特点是对单位、企业数据库中的大量业务数据进行抽取、转换分析和其他模型化处理,以从中提取辅助管理决策的关键性数据。数据挖掘就是从大量的、不完全的、有噪声的、模糊的和随机的数据中,提取隐含在其中的、人们事先不知道的但又是潜在有用的信息和知识的过程。换句话说,数据挖掘技术就是从收集的大量、繁杂的数据中挖掘出其隐含的、未知的、对决策有潜在价值的关系、模式和趋势,并用这些知识和规则建立用于决策支持的模型,提供预测性决策支持的方法、工具和过程。

数据挖掘的意义。在当今的竞争时代社会中,随着计算机的飞速发展,计算机强大的数据处理能力、内存储存容量和网络宽带等价格的持续快速下降,因此大型的数据分析、提取技术不再是一个障碍。面对图书馆每天接收的庞大数据源,管理者必须学会从所拥有的大量数据信息源中提取并利用隐含在这些数据中的有用价值以及有用新信息,从而获取对图书馆事业研究领域的本质认知和未来认知,帮助图书馆管理者从传统的经验管理、主观管理提升为理性管理和科学管理。

数据挖掘的应用分类。目前较常用的一般有分类与回归、关联规则、聚类分析、时序模式等。

二、数据挖掘技术对图书馆事业创新与发展的影响。

面对大量数据,如何去存储和收集数据,如何利用数据挖掘技术将图书馆海量信息数据中提取供管理者决策的有价值的数据,提取并利用隐藏在这些数据中的有用知识的能力变得越来越重要。运用数据挖掘技术从数据中获得有用的知识,这在图书馆管理方面显得尤为重要,本文将简述如何将数据挖掘技术应用于图书馆各部门工作,为今后各部门的创新与发展提供策略分析。

流通部门。流通部门作为图书馆的一线服务岗位,对图书馆功能的发挥起着举足轻重的作用。作为窗口形象岗位,直接体现了图书馆的整体工作状态。

要实现从以往的经验管理、主观管理提升为科学管理和理性管理,数据挖掘技术将利用现代技术展现其独天得厚的优势。图书馆每天都会产生大量的图书流通数据,这些数据包含进、出馆读者人数,借、还书数量,检索查询次数以及网上咨询等大量繁杂的数据。在流通部门最为常用的数据就是借书、还书量,通过借书、还书数据的统计,可获取读者信息行为、借阅书兴趣导向,充分利用数据挖掘技术如关联规则、分类、聚类、时间序列分析等,对图书馆蕴含的大量丰富的用户行为进行建模,从而挖掘出有用的或有兴趣的信息和知识。如可利用这些有价值的信息,借鉴“啤酒与尿布”的经典商业案例,尝试在流通部开辟一块试验田地――搭档书架,即通过借、还书数据挖掘,将读者感兴趣、组合搭档频率高的书籍挑选出来,开辟一块搭档书架,方便读者在借用专业书籍的同时顺便也借阅自己感兴趣的图书,既学习了自己的专业知识,同时也顺便阅读了自己感兴趣的书籍,充分实现了图书馆“第二课堂”的育人价值。

采编部门。传统的采编部门在采集书籍时大多数情况是依据采集经验或是依据各院系、读者反馈的需求书籍进行征订。大部分购买的图书还是比较适合读者所用的`,但也会存在一些盲目性,有时会造成采集的偏差,这是采编部门一直比较困惑的问题。如何既将购书经费合理利用好,同时又能满足读者借阅所需,是采编部门长期探索、研究的问题。如果将数据挖掘技术运用到采编部门,通过一线的文献借阅数据,分析、挖掘、提炼读者借、还书的信息量,且一直追踪这些信息数源的变化,即可获得可被部门利用的有价值数据,并汇总出读者借、还书的规律。依据这些一线信息数源的价值,加之网上荐购及读者书面荐购等信息,汇总出哪些是读者专业常用书籍,哪些是读者感兴趣的书籍,哪些又是常年被冷落的书籍,从中提炼出书籍采集的方向;合理化的采集方案继续延用,不合理的采集要进行科学化的数据分析,及时理清思路,尽可能做到书籍采集的合理化、科学化。

技术部门。在信息飞速发展的时代,作为图书馆负责信息网络技术的部门,其肩上的重量显得格外沉重。技术部门不但肩负着网络技术的责任,当今也要肩负起图书馆所有数据的收集、存储、挖掘及分析技术。数据挖掘及分析技术在技术部十分重要,技术部应将图书馆各部门所产生的相关数据进行长期性、系统性的收集和科学分析,并将研究数据的挖掘及分析作为当前和今后技术部研究及发展的方向,承担起“数据监护员”的角色,通过实践为图书馆提供数据监护操作技能及策略。注意将可获得的数据及时进行收集,并通过收集数据使用案例,分析并总结用户需求及使用规律,为数据监护提供基础资料。

学科部门。学科部门作为一个新兴的部门,目前已在全国各高校图书馆广泛推广运用。学科馆员的主要任务是派专人与对口院系或学科专业搭建合作、交流平台,并利用图书馆信息检索的技术优势,为研究者开展长期追踪、收集、传递文献信息的科技服务。当前大部分学科馆员关注的是如何为院系教学提供良好的信息传递帮助,而忽略了在当前信息飞速发展的时代,科研与教学走向数字化的趋势。学者所做的所有工作,包括教案、论文、实验、毕业设计等等工作,基本上都是以电子信息的方式进行编辑、存储的。虽然极大地方便了学者们的工作,但同时也面临这些电子数据的丢失风险,一旦电子数据丢失,其损失的学术价值是不可估量的。为尽量避免这些事件的发生,学科部门可依托技术部门的支撑,利用数据挖掘技术,开展学者数据监护服务,保存这些非纸质信息。这样学科部门不仅为学者提供了科研信息的前沿追踪,同时也提供了科学数据保存平台;既为学者科研开辟道路,也为学者预防丢失科研数据提供保障,可谓双保险。数据挖掘技术还可以帮助学科部通过数据挖掘、分析出读者关注以及咨询较多的问题,从中归纳出重点并分门别类,作为图书馆工作的重要依据。

三、结语。

数据挖掘技术在当今大数据时代,已成为一个相对成熟的学科,融入到社会的各行各业。利用数据挖掘技术对图书馆数据库进行数据挖掘已经成为图书馆需要开展的一项重要工作。图书馆事业已全部进入电子信息化,由此产生的大量业务数据和信息资源是图书馆行业的一笔宝贵财富,它较真实地反映了读者对图书馆事业运作以及提供的服务是否到位。因此,通过数据挖掘分析,能够帮助图书馆管理者分析并发现现有管理的不足之处,通过已知的现象预测未来的发展趋势。数据挖掘技术已成为今后图书馆事业保持竞争力的必备法宝。

参考文献:

1顾倩。数据挖掘应用于高校图书馆个性化服务的探讨[J].图书馆杂志,20xx,8:63-65.。

2王伟。基于数据挖掘的图书馆用户行为分析与偏好研究情报科学,20xx,30(3):391-394.。

3杨海燕。大数据时代的图书馆服务浅析[J].图书与情报。

4程莲娟。美国高校图书馆数据监护的实践及其启示[J].图书馆杂志,20xx,1(31):76-78.。

数据挖掘论文【第四篇】

1理论研究

客户关系管理

客户关系管理的目标是依靠高效优质的服务吸引客户,同时通过对业务流程的全面优化和管理,控制企业运行成本。客户关系管理是一种管理理念,将企业客户视作企业发展最重要的企业资源,采用企业服务优化等手段来管理客户关系。客户关系管理并不是单纯的信息技术或者管理技术,而是一种企业生物战略,通过对企业客户的分段充足,强化客户满意的行为,优化企业可盈利性,将客户处理工作上升到企业级别,不同部门负责与客户进行交互,但是整个企业都需要向客户负责,在信息技术的支持下实现企业和客户连接环节的自动化管理。

客户细分

客户细分由美国学者温德尔史密斯在20世纪50年代提出,认为客户细分是根据客户属性将客户分成集合。现代营销学中的客户细分是按照客户特征和共性将客户群分为不同等级或者子群体,寻找相同要素,对不同类别客户心理与需求急性研究和评估,从而指导进行企业服务资源的分配,是企业获得客户价值的一种理论与方法。因此我们注意到,客户细分其实是一个分类问题,但是却有着显著的特点。

客户细分是动态的企业不断发展变化,用户数据不断积累,市场因素的变化,都会造成客户细分的变化。所以客户细分工作需要根据客户情况的变化进行动态调整,

减少错误分类,提高多次细分中至少有一次是正确分类的可能性。

受众多因素影响

随着时间的推移,客户行为和心理会发生变化,所以不同时间的数据会反映出不同的规律,客户细分方法需要在变化过程中准确掌握客户行为的规律性。

客户细分有不同的分类标准

一般分类问题强调准确性,客户关系管理则强调有用性,讲求在特定限制条件下实现特定目标。

数据挖掘

数据挖掘就是从大型数据库数据中提取有价值的、隐含的、事前未知的潜在有用信息。数据挖掘技术不断发展,挖掘对象不再是单一数据库,已经逐渐发展到文件系统、数据集合以及数据仓库的挖掘分析。

2客户细分的数据挖掘

逻辑模型

客户数据中有着若干离散客户属性和连续客户属性,每个客户属性为一个维度,客户作为空间点,全部客户都能够形成多为空间,作为客户的属性空间,假设A={A1,A2,…Am}是一组客户属性,属性可以是连续的,也可以离散型,这些属性就形成了客户m维属性空间。同时设g是一个描述客户属性的一个指标,f(g)是符合该指标的客户集合,即为概率外延,则任一确定时刻都是n个互不相交集合。在客户价值概念维度上,可分为“有价值客户”“潜在价值客户”“无价值客户”三种类型,定义RB如下:(1)显然RB是一个等价关系,经RB可分类属性空间为若干等价类,每个等价类都是一个概念类,建立客户细分,就是客户属性空间和概念空间映射关系的建立过程。

客户细分数据挖掘实施

通过数据库已知概念类客户数据进行样本学习和数据挖掘,进行客户属性空间与概念空间映射的自动归纳。首先确定一组概念类已知客户集合。首先确定一个映射:p:C→L,使,如果,则。,求p(c)确定所属概念类。数据部分有客户数据存储和概念维数据构成,客户数据存储有企业全部内在属性、外在属性以及行为属性等数据,方法则主要有关联规则分析、深井网络分类、决策树、实例学习等数据挖掘方法,通过对客户数据存储数据学习算法来建立客户数据和概念维之间的映射关系。

客户细分数据分析

建立客户动态行为描述模型,满足客户行为非确定性和非一致性要求,客户中心的管理体制下,客户细分影响企业战术和战略级别决策的生成,所以数据挖掘要能够弥补传统数据分析方法在可靠性方面的缺陷。

客户外在属性

外在属性有客户地理分布、客户组织归属情况和客户产品拥有情况等。客户的组织归属是客户社会组织类型,客户产品拥有情况是客户是否拥有或者拥有哪些与其他企业或者其他企业相关产品。

内在属性

内在属性有人口因素和心理因素等,人口因素是消费者市场细分的重要变量。相比其他变量,人口因素更加容易测量。心理因素则主要有客户爱好、性格、信用情况以及价值取向等因素。

消费行为

消费行为属性则重点关注客户购买前对产品的了解情况,是客户细分中最客观和重要的因素。

数据挖掘算法

聚类算法

按照客户价值标记聚类结果,通过分类功能,建立客户特征模型,准确描述高价值客户的一些特有特征,使得企业在之后的市场活动中能够迅速发现并抓住类似的高价值客户,全面提高客户的整体价值水平。通常都采用中心算法进行客户的聚类分析,分析涉及的字段主要有客户的基本信息以及与客户相关业务信息,企业采用中心算法,按照企业自身的行业性质以及商务环境,选择不同的聚类分析策略,有主属性聚类分析和全属性聚类分析两类。主属性聚类分析是企业根据在企业标度变量中选择主要弧形作为聚类分析变量。通常区间标度变量选用的度量单位会对聚类分析结果产生很大影响,选择的度量单位越小,就会获得越大的可能值域,对聚类结果的影响也就越大。

客户分析预测

行业竞争愈加激烈,新客户的获得成本越来越高,在保持原有工作价值的同时,客户的流失也受到了企业的重视。为了控制客户流失,就需要对流失客户的数据进行认真分析,找寻流失客户的根本原因,防止客户的持续流失。数据挖掘聚类功能同样能够利用在客户流失数据分析工作中,建立基于流失客户数据样本库的分类函数以及分类模式,通过模型分析客户流失因素,能够获得一个最有可能流失的客户群体,同时编制一个有针对性的挽留方案。之后对数据进行分析并利用各种数据挖掘技术和方法在多个可供选择的模型中找出最佳模型。初始阶段,模型的拟合程度可能不理想,但是随着模型的不断更换和优化,最终就有可能找出合适的模型进行数据描述并挖掘出流失数据规律。通常模拟模型都通过数据分析专业和业务专家协作完成,采用决策树、贝叶斯网络、神经网络等流失分析模型,实现客户行为的预测分析。

3结语

从工业营销中的客户细分观点出发,在数据挖掘、客户关系管理等理论基础上,采用统计学、运筹学和数据挖掘技术,对客户细分的数据挖掘方法进行了研究,建立了基于决策树的客户细分模型,是一种效率很高的管理工具。

作者:区嘉良 吕淑仪 单位:中国石化广东石油分公司

23 383415
");