数据挖掘和数据仓库之间的区别

  • 数据挖掘和数据仓库之间的区别已关闭评论
  • A+
所属分类:商业

数据挖掘数据仓库

术语“数据挖掘”和“数据仓库”与数据管理领域有关。这些是数据收集程序,主要用于研究和分析海量数据中的统计、模式和维度。

数据挖掘

术语“数据挖掘”用于涉及从各种角度分析数据并将该数据总结为有用信息的过程。数据挖掘软件处理信息,以便在削减成本或增加收入或两者兼而有之方面对数据进行规范。

数据挖掘程序通过基于用户生成的数据和查询识别特定趋势来进行深入研究和信息收集。数据挖掘软件的主要目标是识别异常模式,特别是发现与财务相关的欺诈,并生成引导程序以加强营销。

由于收集的数据量很大,所以主要使用数据挖掘软件。数据通过扫描仪、直接邮件响应、ATM 机、Web 服务器日志、人口统计数据、闭路摄像机、信用卡交易和许多其他来源涌入。在进行任何分析之前,必须验证和汇总所有这些信息。这个过程被归类为数据仓库。下一步是通过集成在数据挖掘下的各种程序来整理这些信息。

数据挖掘软件利用了各种步骤。第一步是数据的预处理,包括:数据的选择、数据的清洗、噪声的去除和数据的转换。创建这些公共信息单元后,将生成新字段。下一步是构建数据挖掘模型。这里生成了一个前瞻性模型来总结有用的信息。最后一步是对数据挖掘模型的评估。

数据挖掘目前是必要的,主要是由于商业竞争日益激烈。两家公司在服务、个性化、安全性和实时企业方面展开竞争。

数据仓库

数据仓库是收集和存储数据的过程,这些数据可以在以后进行分析以进行数据挖掘。数据仓库是一个具有大存储容量的精心设计的计算机系统。来自所有来源的数据被定向到这个来源,在那里数据被清理以去除冲突和冗余信息。数据仓库的过程使集中数据访问成为可能。

精细复杂的数据捕获和处理技术是组织建立有效和高效的数据仓库设施的主要来源。这些是公司保持盈利能力、效率和竞争优势的重要资产。收集的数据通过一个称为数据生命周期管理的过程。

数据仓库利用相关数据库管理系统的技术,如提取、加载、转换和关系在线应用程序处理。数据仓库技术有四个特点。它们是:基于主题的设计、与数据的集成、状态的非易失性图像、数据和数据的时变视图。

概括:

  1. 数据挖掘和数据仓库技术是数据管理系统的一部分。
  2. 数据仓库主要涉及数据的收集,而数据挖掘涉及分析和总结组织的重要信息。
  3. 数据挖掘和数据仓库过程的技术是不同的。

 

分博士