我们需要怎样的OLAP?
|
商业智能一般分成为报表、分析、挖掘三个阶段,而OLAP方法是当前在线分析的主要手段。 其实OLAP这个词本身就是在线分析的意思,但现在已经被狭义化了,说到OLAP,只是指基于多维数据立方体的钻取、聚合、旋转等操作。 然而,这种OLAP并不能提供我们需要的在线分析功能。它只能针对事先已建立好的数据立方体(即某个单一主题)作分析,无法对全业务数据进行多主题混合分析。国内行业业务变化迅速,基本上没可能事先把所有的主题想清楚(事实上大部分想不清楚),而由业务人员(最需要做分析的人)自己临时建立主题立方体简直就是天方夜谭,所以这种OLAP也就是花哨,实际上有没有都差不多。 那么我们现在需要的OLAP应当是什么样的? 我们来分析一下在线分析的应用过程。任何一个经营性行业中有多年工作经验的从业人员一般都会对自己从事的业务产生一些猜测,如股票分析师会猜测满足某种条件的股票容易上涨,航空公司的业务人员会猜测何种人群习惯于购买哪类航班,超市经营者也会猜测何种价位的商品更适应周边的人群,…。这些猜测正是预测的基础。而一个机构建设好的业务系统运行一段时间后也都会积累大批的数据,业务人员的猜测很可能已可由这些积累的数据去验证,证实了则可以用于预测,证伪则再重新猜测。 需要注意的是,这些猜测都是由有经验的业务人员做出的,而不是计算机系统做出的!需要计算机系统做的就是辅助业务人员针对已有数据去证实或证伪猜测,也就是查询数据(包括一定的汇总运算),这就是在线分析的应用过程。之所以需要在线,是由于许多猜测都是业务人员看到了某个中间结果后临时想出来的。整个过程中不可能也不需要事先建模,而由于其临时性,业务人员在验证猜测时也无法依赖技术人员的配合。 从技术上讲,我们需要的在线分析其实是一个针对业务数据库的多表即时查询系统,注意一定是多表查询,绝大多数有意义的业务查询都不是单表能够解决的(如查出曾在某机构工作过三年以上的员工、超市下午五点时断档的商品、一段时期内有连续N天涨停记录的股票等),而当前的OLAP方法是个单表工具,解决不了我们的问题。 对于技术人员而言,多表查询本身并不太困难,使用SQL或编写程序都可以完成,虽不很轻松但也可以应付。然而,对于更需要这个功能的业务人员就不那么简单了,一个两层嵌套的三表叉乘SQL或一段10行以上带有条件跳转的代码都是他们不可能完成的事情。 这才是我们需要的在线分析:在不建模的前提下,让不懂技术的业务人员能够用某种手段自由地完成自己临时想做的各种查询,特别是多表查询。 这当然不是件容易的事,但也不是做不到的事情。当然,现代狭义的OLAP是搞不定的。 引自:http://www.blog.com.cn/user8/22628/archives/2005/69845.shtml 作者:老贼 |
一共有 1 条评论
发表评论