在未来的云计算中心里,信息分层、价值评估和高效查找是信息管理的三大关键。
按照现在最普遍的理解,云计算被叙述为一种通用基础设施服务,海量数据、高性能/高访问量以及低成本是其不可忽视的重要特征。然而不能回避的问题是,只有这些数据被有效组织和管理后,它们才具有真正的价值。因此,在云计算背后,如何有效管理信息是个关键问题。
对于这个道理,有个形象的比喻:我们每个人都希望拥有一个大车库,但是如果车库里东西太多又杂乱无章地放置,要找某个工具却又偏偏找不着,那就不得不去买个新的,这个车库的价值也就大打折扣。
信息分层
信息同样如此。如果我们能对存储在数据中心的信息进行有效的组织和管理,提供对信息无所不及的访问能力,那么这些信息的价值将大大增加。
在所谓的云计算中心里,信息管理的第一个要求就是确定哪些信息是需要保存的。Mark Lewis认为,如果数据本身价值超过了保存它们所需要的代价,那么留下它们就是划算的。苹果的iTune就是一个合适的例子。那些一年只有一次下载量的歌曲都值得被保存在服务器上,因为每首这样的歌曲能够提供98美分的利润。
当然,保存数据有不同的代价,通过分层的数据存储架构,那些价值较低需要保存多年的数据可以被转移到相对便宜的存储当中。
价值评估
信息管理需要解决的第二个问题就是信息的价值评估,即如何将需要保存的数据按照其价值分级。价值评估通常要受到公司政策和国家法规的影响,需要提供基于策略的信息管理。
对于信息的重要性和价值,公司通常有很多复杂的策略。有些公司认为访问频繁的数据更有价值,有些公司认为数据的创造者表明了其价值,比如技术公司的CTO创建的文档就可能比其他人的文档更重要。
不同的公司往往根据其业务性质而采用不同的策略。类似的,有些国家对企业数据有严格的法律规定。比如美国规定如果消费者订阅了某种服务,相应的记录必须保存多年,北欧的国家规定如果客户取消了他在某家企业的账户,那么企业必须保证删除他的个人数据。
又比如Data Islandia,冰岛的一家数据保存服务商用物理隔离的方法来保证来自不同国家的数据不被混在一起。该公司业务是保留用户硬盘,分布于全球用户的磁盘在被空运到冰岛的路上就被装入不同的集装箱,有美国集装箱、欧洲集装箱等,种种规定不一而足。
除此之外,如果数据在多个应用之间共享,那么在不同应用中其价值可能差别很大。因此,数据本身和它的价值评估策略必须区分开来,数据本身必须是自描述,除了安全上的考虑,数据本身不能强加任何限制策略。只有这样,整个数据存储架构才能适应多方面的需求。这个过程可能是长期的,公司的利益考虑和国家法律都会成为设计灵活数据存储架构的动力。
依靠元数据搜索
当实施了信息分层和价值评估后,如何高效找到需要的信息也是信息管理的关键。要高效找到某条记录,必须依靠它的元数据。使用XML等格式来标注信息是非常必要的,要标注大量已有数据通常需要大量的人力物力财力,有些数据甚至都不是电子版的。
在一些跨国企业中,元数据很可能需要用多种语言标注。一种简单的策略是只标注那些被用到的数据,至于其它的数据,还是让它们过期吧。有了元数据,用户就可以对数据进行多维的检索。
比如在药品行业,你可以通过药品名称,适应症等多种维度来检索需要的药品,这往往比传统的关键词检索更有效率。元数据相比数据本身的另一个优势是,元数据是可以移动的。根据某些国家的规定,数据本身不能转移,而在某种情况下,企业需要对数据进行全盘的管理。这时候元数据就可以代替数据,被移动到需要的位置。
上述问题,是企业在云环境下进行用户信息管理所需解决的一般性问题。如果这些用户本身就是企业的职员,问题则会更加复杂。因为在这种情况下,企业不仅需要管理用户的信息,还需要提供一个帮助用户分享资源、协同工作的环境。
3/3/2009
|