随着信息时代的到来市场经济的变化,企业之间的竞争愈演愈烈,企业要想获得生存,就必须对自身进行信息资源的优化和整合,以便于企业增强自身的管理水平和任务分工的细化。但是,在某种程度上企业并没有完全实现着一种高效的管理方式,例如:
1)一些部门之间计算机使用着不同的操作系统,那么在数据传输的过程中就会出现不兼容现象,从而导致信息难以共享。2)有些部门的某些环节还在采用人工处理的方式,那么就会使整个生产环节的工作效率低下。因此,ERP系统就应运而生。同时,为了满足企业不断提高的信息化程度,数据集成则显得格外重要,故大多数企业都选择了数据仓库以避免数据信息孤岛现象的出现,从而使得ERP真正实现了内部联系和信息共享。下面我们就从五个方面来了解ERP中的数据仓库。
1 什么是数据仓库
数据仓库是决策支持系统(dss)和联机分析应用数据源的结构化数据环境。数据仓库通常都有四个组成部分:1)数据源:数据源既是系统的数据源泉又是数据仓库的基础,它既可以包含整个企业的内部信息(各种文档数据信息和业务处理数据等)又可以包含企业的外部信息(竞争对手的信息、法律法规和市场综合信息等)。2)数据的存储与管理:数据仓库的核心点在于对数据信息的存储与管理,它的组织与管理方式的优化程度决定了系统的效率,并且不同的方式也决定着不同的数据表示方式,至于最终采用什么样的技术和产品来建立数据仓库,则需要根据不同数据仓库技术特点进行具体分析。数据仓库在组织与管理方面还有一个较大的优势,它可以把整个系统中的不同数据库进行数据综合、归纳、抽取和清理,并按照一定的主题进行优化组织。因此,数据仓库就有了等级之分,例如部门级数据仓库、企业级数据仓库等。3)OLAP(联机分析处理)服务器:OLAP服务器可以对基础数据进行多角度和多层次的总结和分析,并归纳出相应的发展态势,这种功能的实现主要有三个方面:HOLAP(混合型线上分析处理)、ROLAP(关系型在线分析处理)和MOLAP(多维在线分析处理)。4)前端工具:它多趋向于辅助工具,例如查询工具、数据挖掘工具、报表工具、数据分析工具和应用开发工具等。
2 ERP中数据仓库与数据库的区别
在ERP的设计中总是会带有各种各样的数据库,那么我们为什么还要设计数据仓库呢?
下面就从以下几个方面来了解数据仓库和数据库的区别。
1)数据仓库和数据库的出发点不同。数据仓库的主要面向点是主题而数据库的主要面向点是事务。数据仓库不仅可以处理各种不同的事务任务而且可以使不同的业务系统之问相对独立。数据仓库总是将数据按照不同的主题进行相应的划分并把其组织在一起,虽然主题和数据库的面向应用相对应,但是主题是整个企业在一定层次上对数据进行的综合、归类和分析的抽象概念,它带有一定宏观领域的分析性。数据仓库还可以把对决策性无用的数据进行相应的排除,并把其结果显示在一些简单易懂的视图上。
2)数据仓库和数据库记录的数据方式不同。数据仓库在存储数据时总是会将其相应的历史信息记录在案,例如:数据仓库可以记录企业在不同的发展阶段所有的历史信息,企业可以通过这些信息对过去进行总结和分析,对未来进行决策,而数据库在这方面却显得尤为不足。
3)数据仓库和数据库对冗余的处理方式不同。数据仓库既然要记录所有阶段的历史信息,那么它就会积极的引入冗余,在设计时一般会采用反范式的方式。而数据库则会积极的去避免冗余,在设计时通常采用范式的方式对数据进行规范化。
从以上的对比可以看出数据仓库是为了分析数据而产生的,而数据库仅是一种数据的辅助设计。
3 数据仓库弥补ERP的缺陷
面向事务在处理数据时一般面对的都是及时数据和细节数据,要求能够高速的处理这些数据,并能够完成快速查询和统计的功能。而面向分析则是要求能够对历史数据信息、抽样数据信息、汇总数据信息等进行归纳、总结和分析,这些信息可能是几个月的数据信息也可能是几年的数据信息,可能是局部的数据信息也可能是整个企业的数据信息,数据量之大是难以想象的。对于一个ERP系统来说面向事务和面向分析具有同样重要的作用,只有将两者更好的结合起来,才能够使ERP系统更好的管理企业的日常运作,通过对数据的汇总和归纳企业才能够对未来发展做出决策性的分析。而数据仓库在决策性分析中一直充当着领头羊的作用,它可以对所有分散的数据库中的数据进行整体数据抽取和数据清理,然后再通过归纳、汇总和分析消除不一致的数据,最后存储到数据仓库中,以保证全局信息的一致性。除此之外,它还能提供较高的稳定性,当数据被数据仓库收录后,此数据将被长期保留下来,以便于为企业做决策性分析提供基础数据。因此,一个好的数据仓库可以弥补ERP系统在面向分析方面的缺陷。
4 在ERP中创建数据仓库
数据仓库的建立是以解决问题的主题为基础,而问题主题的产生是以用户决策性问题为基础,故在建立数据仓库时会从决策性问题入手。一般情况下,数据仓库的建立有以下几个步骤:
1)收集并分析终端客户的需求,为数据仓库选择合适的主题并以主题为中心为其存储数据建立数据模型。该数据模型要求能够完整清晰的看到整个企业的信息描述。
2)剖析数据源,以终端客户的需求和重点主题为基础,设计数据结构的维表和事实表,以完成数据仓库中数据的物理存储结构。
3)设计数据仓库中数据模型和数据源之间的转化,综合逻辑,主要包括:①哪些数据需要转化/综合。②转化/综合数据量的大小。③转化,综合数据的频率。
4)生成相应的元数据,以便于描述数据仓库中的数据模型和数据转化/综合逻辑。
5)获取各种源系统中数据并加载到数据仓库中。
5 数据仓库在ERP系统中的实例
ERP系统多种多样,在ERP系统中的数据仓库也层出不穷,下面通过一个机械制造企业的进销存系统来进一步了解ERP系统中的数据仓库。
进销存系统是以传统的数据库系统为基础,在数据库系统中所包含的重要表有:客户基本信息表、销售厂商表、零件供货商表、库存表和产品信息表等,这些表的存在有利的解决了面向交易的处理系统,与此同时也给联机分析处理系统提供了基础数据,例如零件供应商查询、客户信息查询、产品信息查询等,但是这些信息却不能够对企业制定长远发展计划提供更多的帮助,因此建立适用的数据仓库对原有的数据库中的数据进行过滤、归纳和分析得出综合的结论,这样才能够更好的服务于企业的长期发展。
在整个数据仓库建立的过程中,首先要做的是对原有的数据库中的数据进行透彻的分析,然后将数据库中的分散数据进行清洗、抽取和分类,在这里我们将它分成以下几类:零件供应商类(包含原数据库中供应商所有的信息)、进销存账目类(包含原数据库中进货、销货和存货的所有账目明细)、客户信息类(包含原数据库中所有的客户基本信息和客户与企业之间的来往账目明细)等,重新划分原数据库中的数据可以把原数据库中的分散数据有效的结合在一起,可以使联机分析处理系统发挥更好的效能,而且还可以为系统的二次开发提供良好的基础,避免了牵一发而动全身的恶果。其次是数据仓库中物理结构和数据模型的设计,在目前有很多公司都已经推出了有自身特色的数据仓库解决方案,例如:Microsoft、IBM、BO等,由于在数据层本系统采用的是SQL Server 2000,因此在此进销存系统中主要选择了Microsoft的SQL Server 2005来进行数据仓库的建立,这样可以更好的实现数据源与数据仓库之间的数据转换/综合。最后将转换/综合的数据信息加载到数据仓库中,并采用DOTNET平台开发相应的应用程序来辅助联机分析处理系统。这样整个ERP中的数据仓库也就建立完成了。
6 结束语
数据仓库在整个ERP系统中已经占据了十分重要的地位,只有更加优化的数据仓库才能使ERP系统的作用更加突显,才能给企业制定好的战略方针提供更加真实有效的信息。
7/25/2012
|