试论基于数据挖掘的数字档案信息管理研究的论文随着社会主义现代化的发展计算机技术的进步信息技术在社会发展的各个领域都扮演着极其重要的角色本文对数据挖掘的功能深入阐述和探讨信息化建设更是被我国列为经济社会发展的首要内容网页档案化管理包括文档文字翻译转换图片资料声像资料多媒体远程会议等尤其是大学档案馆更侧重教学与科研网页档案化管理是必然的趋势在信息化发展的今天图书馆特别是大学图书馆不仅要对信息进行简单的数字转换和管理更要对新兴事物网络进行档案化管理和归档包括文档文字翻译转换图片资料声像资料多媒体远程会议等所谓数据挖掘就是从大量的不完全的有噪声的模糊的随机的数据中提取隐含在其中的人们事先不知道的但又是潜在有用的信息和知识的过程这些数据可以是结构化的如关系数据库中的数据也可以是半结构化的如文本图形图像数据甚至是分布在网络上的异构型数据发现知识的方法可以是数学的也可以是非数学的可以是演绎的也可以是归纳的发现了的知识可以被用于信息管理查询优化决策支持过程控制等还可以进行数据自身的维护数据挖掘借助了多年来数理统计技术和人工智能以及知识工程等领域的研究成果构建自己的理论体系是涉及数据库人工智能数理统计机