面向商务智能的人力资源数据仓库设计与实现
用的数据全部抽取,已抽的数据会重复抽取,这种方式适用于数据量较小的情况;另一种方式是增量抽取,只抽取上次抽完后增删改过的数据,已抽的数据不会再次抽取,这种方式适用于大数据量的情况。人事数据仓库的数据源如人事管理和培训活动管理使用全量抽数,时间管理和工资核算使用增量抽数。这里需注意,因为人事涉及的增量数据源使用附加镜像(ADD),第一层DSO关键值转换规则不能是覆盖只能是合计。此外,尽管采用全量抽数的人事数据源的数据量相比后勤和财务等模块的数据量为小,但是实际项目中仍然有可能很庞大,用户不愿意接受每次低效的重复抽数,可以采用“假增量”的抽取模式,既只抽取距今一个时间段的数据,规定用户超过该时间段的数据不能增删和修改。该时间段内的数据其实还是全量抽取,但是也仅抽取这个时间段的数据量,如此大大降低了从业务系统抽数的负载。4.2 性能优化数据仓库中信息立方体蕴含的多维度海量数据使得实时查询成为奢望,一般情况是
<<上一页 下一页>>
广州市越秀区图书馆版权所有。
联系电话:020-87673002
本站访问人数: