1数据挖掘技术在医院管理中的应用戴怡妍中山大学附属第一医院教学科广东广州摘要在医院管理当中常用的传统统计分析技术无法对数量较大的数据进行准确而有效的分析而这种技术又能够使得医院的高层在管理以及决策方面能够得到强而有力的支持本文当中对于类描述聚类分析关联分析预测分类时序模式等技术在医院管理当中的运用进行介绍将对数据挖掘技术进行深层次剖析使其能够在医院管理当中发挥更为显著的作用关键词数据挖掘医院管理电子化数据数据库管理中图分类号文献标识码文章编号在我国目前的经济活动当中数据挖掘已经成为电信金融以及公共管理等多个领域当中的重要技术支持手段在临床医学当中的应用也随着时间的推移而逐渐增多但是却并未真正应用于医院管理方面但是在目前的经济环境当中由于信息化发展所带来的巨大冲击力使得医院信息系统在数据资料方面形成了大量的积累而这些电子化的数据资料通过传统的统计分析技术无法满足人们越来越多的需要传统的数据库管理系统也因此逐渐失去了重要的作用数据挖掘技术的概述2在上世纪年代的初期数据挖掘技术基于数据统计理论以及机器学习开始逐渐形成数据库当中的知识发现为数据挖掘技术的另一个名称指的是从海量的数据当中将可信有效新颖的数据加以提炼并且将这些能够被人所理解的信息进行深层次的高级处理而这些信息通常会隐藏在大型数据库信息库以及数据流当中数据挖掘技术的分析方法极其丰富本文当中将列举五条最为重要以及常用的方法进行具体分析这些方法将有效应用于医院管理工作当中类描述由于数据库当中经常会蕴藏着数量较多的细节数据而通过类描述的分析方法能够将这些数量较多但是信息较为丰富的相关数据通过研究类别的划分而进行汇总而进行汇总的方法则分为数据区分以及数据特征化前者指的是将目标分析数据存在的一般特征与对比数据进行比较后者则指的是以研究的项目作为标准将符合研究特征的数据进行汇总聚类分析在数据挖掘技术当中聚类分析指的是将研究的目标数据遵循将类之间的相似性最小化将类内部的相似性最大化的原则对所有的数据进行分组换一种说法那就是将同一种目标数据之间的距离尽可能的缩小或者同一类的数据当中相似性尽可能放大不同类别的数据个体之间则尽可能扩大距离或尽可能缩小相似性见图3关联分析这种分析方法主要是通过对关联规则的利用在对数据库进行操作的细节当中将频繁出现的模式进行有效抽取这种分析的目的是在繁杂的数据当中发现将相关联的信息并且通过量化之后的数字描述对象之间出现的可行性进行判定与评估时序模式这种分析方法指的是以时间序列作为分析的标准将数据当中重复发生并且重复率较高的信息进行筛取并且通过已经筛选出来的数据对目标值进行分析这种分析方法内容当中包含了相似度搜索以及趋势分析等概念分类和预测对数据进行分类以后对其进行分析这种方法的基础是在训练数据集当中将分类的模型进行初步筛选随后按照模型的整体预测对未分类的对象进行类别的划分聚类分析与这种方法本质上的区别在于训练数据集的数据是否为已知数据而预测则是按照已知的数据进行连续值函数模型的建立对空缺或未知的数据值进行预测因此其中所用到的回归分析为最常用的数值预测方法之一数据挖掘技术对于医院管理的重要性随着信息化技术在各个领域当中应用后都取得了显著的成果各个医院当中所应用的信息系统当中也蕴含了丰富的临床以及管理方面的大量数据例如医院的人事财务设备药物患者的治疗信息4社会特征等数据这些信息不仅将医院的日常管理细节进行详尽的记录还能够对医院进行历史状态的描述在目前我国的大多数医院当中在信息处理方面主要是依靠信息系统所带来的简单查询功能等操作性较为有限的功能进行常规事务的处理只能对工作流程进行有限的简化虽然在一定程度上会提高工作效率但是在实际的应用当中对于操作性要求较强的事务处理工作将无法满足进行数据预测等较为高级的数据分析这将导致医院在进行大型数据信息处理时依然达不到理想的目的与传统的统计分析相比数据挖掘技术能够更好的发现信息量较为丰富的数据更加侧重于应用多种方法对模式进行有效的联系和匹配通过一些专用的算法对数据之间所存在的联系进行描述而医院的管理人员则可以通过这些方法将很多有效信息从海量的数据当中筛选出来从中获取到自己能够进行充分利用的数据并且通过专业技术人员的指导能够对这些数据进行深层次分析将能够对决策有利用的价值进行选择应用数据挖掘技术能够利用上文当中提到的多种分析方法将数据当中存在的联系进行解释与分析并将其转化为与医院管理相关的信息从另一个角度来说数据挖掘技术是利用数据进行模型的构建随后再通过数据对模型进行分析与验证而在模型的建立过程当中则是从无到有从特殊到一般的归纳与总结过程因此通过这样的分析之后得到的客观结果则更具有利用价值在信息系统当中很大一部分的数据均存在明显的质量缺陷这种情况无法避免但是传统的统计分5析方法将这些无用的数据默认为有用的数据因此在分析的结果当中将造成决策的误导而数据挖掘技术则可以通过预处理的方式使得数据当中的缺陷进行有效补充对其中的无用数据进行清理将有用的数据进行显著的突出进而提高数据的真实性与可靠性同时数据挖掘技术还能够在执行系统当中将数据筛选出来在减少不必要的信息浪费的基础上还能够完成一系列的连接转换通过结构的改变以及聚集的处理从数量繁多信息庞杂的信息流当中进行分辨归类提取整理挖掘将有用的信息归纳出来使得医院管理人员能够应用在决策当中数据挖掘技术在医院管理应用中的实施在大多数的医院管理当中数据挖掘技术具有一定程度的实用性其实施的过程可以通过以下流程进行简单的描述需求确定按照医院管理方向内容以及所要达到的目标进行要求的确立对管理需求的问题进行准确描述并将这些问题转化为需要进行数据挖掘的问题数据的理解及准备参照数据挖掘的相关问题首先要将目标数据进行确定并从医院的数据库或信息系统当中将适用于挖掘的大量数据进行筛选并且对数据的质量问题进行初步评估对于相关的数据进行提取无关的数据进行清理建模及数据挖掘6针对任务目标的类别划分对于将要采用数据挖掘的分析方法类别进行确定例如选择聚类分析或者是描述或者是关联规则等方法随后选择一种最为直接有效的数据挖掘算法将数学分析的模型通过数据进行建立与完善模型评价在进行模型评价时需要通过有效数据对模型进行解释与结果数据的挖掘并且要经过多次的测试与评价后才能够对信息的可信度及有效性进行判定在评价当中所采用的数据分析方法将按照数据挖掘的技术选择而选择在通常情况下会使用到可视化的数据挖掘技术在对模型进行建立解释评价验证的过程当中需要进行多次反复的验证一个有效的数据模型并不是一次性就能够成功的因此要在数据模型建立后通过将其他数据进行带入后将分析所得到的结果对模型进行评价如果得到的结果无法令人满意则可以通过反馈机制进行再一次的数据挖掘重新进行上述流程以得到有效的模型为止结果发布按照管理人员对于信息以及数据的管理要求对于数据挖掘后所获得的知识进行重新组织并采用简单易懂的方式呈现给管理人员进而能够使其在工作当中充分利用并能够敏锐地发现相关知识每一位患者在入院就诊后将资料档案登录至数据库当中将患者的基本资料病情检查结果确定后的治疗方案治疗方法以及恢复情况进行详细记录并由此建立完整的患者资料库将每位患者的所7有信息制作成列表方便日后查询对患者资料的查询可通过主治医师病情就诊时间姓名或其他等一系列方法进行查找而对一个范围内的患者进行统计的话也可以通过主治医师病情就诊时间或其他条件进行数据统计这样做的结果就是将所有的患者诊治资料形成具体的数据化在患者进行复诊复查以及其他需要时能够方便快捷地查阅患者以往的就诊资料方便后续治疗同样方便医院管理层对整体数据的了解与控制见图结语在对数据挖掘技术进行学习之前要充分了解机器学习数据库原理以及传统的统计分析方法在对静态的数据模型进行建立并完善后通过对数据库当中蕴含的大量信息进行分析并将数据模型进行反复验证进而能够帮助医院管理人员对医院信息系统当中的大量电子数据进行归纳与总结提高数据资源的利用程度与可用性通过这种方法能够对医院管理工作的强度进行进一步的提高并加强医院服务质量利用科学的方法进行有效的管理参考文献王新军胡曼数据挖掘技术在寿险业交叉销售中的应用保险研究于长春贺佳范思昌等数据挖掘技术在医院管理中的应用第二军医大学学报谢邦昌数据挖掘应用实务北京机械工业出8版社朱世俊鲍玉荣刘爱民等北京地区医院付费和临床路径应用研究中华医院管理杂志王炯夏宏斌浅析数据挖掘技术在医院信息化平台建设中的应用策略网络与信息田霞徐道芳数据仓库和数据挖掘在医院管理中的应用医学信息上旬刊收稿日期