当前位置:首页 > 计算机 > 计算机应用 >

分析计算机数据库的发现和挖掘

分享到:
作者:管理员。 TAGS:挖掘,发现,数据库,计算机,分析,
   随着经济的发展,我们的生活在不断的变化,伴随着这种变化,计算机的应用应运而生,它成为了我们生活中不必可少的帮手。它在各个领域中充当着主角的角色。数据库的发现和挖掘为信息数据的处理起到了辅助的作用,有了他们的帮助,信息数据处理将会变得更加快速,更加准确。现在我将对计算机数据库的发现和挖掘进行分析。  
;      
一、数据库与数据挖掘的关系     
  数据库是以一定的组织形式存放在计算机存储介质上的相互关联的数据的集合,它用
  于描述事物本身和事物之间的联系。并且它是由作为商业数据计算机化管理的早期方法而产生的。而数据的挖掘是数据库应用和研究的一个新领域。它是将海量的信息数据进行挖掘,筛选出所需要的知识,这些知识是未先知的,有效的,能够帮助人们解决问题的。并且它是以通过对历史数据的分析统计得出用户感兴趣的结果为目标,进而对人类的行为决策作出影响。它以数据库为铺垫,进行多学科领域的交叉研究。     
二、数据挖掘与传统分析方法的区别     
  数据挖掘与传统的数据分析方法的本质区别是,数据挖掘是在没有在明确假设的前提下,对信息进行深入挖掘,发现知识。它挖掘后得到的信息应是具有先未知、有效和可实用性三个特征。     
三、数据挖掘成为数据处理中的主导地位     
  近年来,数据挖掘引起了信息产业界的极大关注。由于经济的迅速崛起,信息产业不断扩大,现在的计算机数据存储容量已经超过了人们使用该数据存储和使用其中数据的能力,这就引发了计算机行业的又一次革新,这次革新的产物便是数据挖掘,数据挖掘,在人工智能领域,习惯上又称为数据库中的知识发现(KDD),也有人把数据挖掘视为数据库中知识发现过程中的一个基本步骤。知识的发现过程,分为以下三个步骤:(1)数据准备、(2)数据挖掘、(3)结果表达和解释。数据挖掘与机器学习相结合,它们的技术提供了推动KDD过程的算法,并成为了KDD核心,被运用在各个领域之中。
  随着数据挖掘技术的发展,其功能的发现更是用于指定数据挖掘任务中要找的重要模式类型。数据挖掘工作的任务一般可以分为两类,即描述类与预测式。描述性的挖掘任务是用来刻划数据库中的数据的一般特性,而预测性挖掘任务则是根据当前的数据进行推断,进而预测新的数据。这两种任务既是数据
[论文网 lunwen.nangxue.com]挖掘工作中的首要任务,又是数据挖掘工作能够更好完成的基石。
  数据挖掘的产生为企业,为人类生活作出了很大的贡献。下面我将以贝尔大西洋和美国万国宝通银行为例进行说明。
  (1)贝尔大西洋公司是一家以电话电报为主营业务的公司,当它面对报告电话问题时,它会采用一些方法进行应对。随着时代的变迁,它们所采用的方法也在改变。而促使它改变的理由就是潜伏在它商业背后的巨大利润。1991年,贝尔大西洋公司采用的是专家系统做此决定,在1999年,公司改变策略,专家系统被数据挖掘创建的一组规则取代,这些与机器学习相结合所得到的规则每年为公司节省了1000多万美元。
  (2)美国万国宝通银行,在二十世纪八十年代时,使用的是统计学的方法将贷款申请分为三类,肯定接受的申请,肯定拒绝的申请和需专家判定的申请。专家预测申请者是否会拖延还款时间的准确率只有百分之五十,而使用数据挖掘与机器学习产生的规则预测的准确率达到了百分之七十。
  由此可见,数据挖掘的研究是成功的,它为企业获得了更大的利益,更为员工操作的烦琐提供了简洁。并且在信息处理领域中,占据了主导的地位。     
四、数据挖掘的技术与工具     
 伴随着越来越多的软件供应商加入数据挖掘的这一行列,使得现有的挖掘工具的性能得到了近一步的增强,这也使得其价格的门槛迅速降低,为应用的普及带来了可能。为了使数据挖掘更加普遍,使用者在使用时对其在技术与工具上的了解也成为了很重要的一部分。下面我将向大家介绍一下数据挖掘工作中的数据挖掘技术与工具。
(一)数据挖掘的技术方法分为三种:决策树、神经网络及规则归纳。
  (1)决策树的核心是某种归纳算法,它是先利用训练集生成一个测试函数,然后在根据不同的取值建立分支,形成一个决策树,最后在将它转化为规则。使用者利用这些规则对新事例进行分类。
  (2)神经网络,它是建立在可以自学的数学模型基础之上的,在结构上模仿生物神经网络,是一类非线性的,通过训练达
  • 共2页:
  • 上一页
  • 1
  • 2
  • 下一页