笔趣阁

手机浏览器扫描二维码访问

第290章 牛肉河粉(第3页)

Y是指每次抽取前先删除目标表

数据Y抽取时全新加载数据该方式实际上将增量抽取等同于全量

抽取对于数据量不大Y全量抽取的时间代价小于执行增量抽取的

算法和条件代价时Y可以采用该方式。

这种方式的优点是对已有系统表结构不产生影响Y不需要修改业务

操作程序Y所有抽取规则由ETL完成Y管理维护统一Y可以实现数

据的递增加载Y没有风险

缺点是ETL比对较复杂Y设计较为复杂Y速度较慢与触发器和时

间戳方式中的主动通知不同Y全表比对方式是被动的进行全表数据

的比对Y性能较差当表中没有主键或唯一列且含有重复记录时Y

全表比对方式的准确性较差。

日志比对的方式是通过获取数据库层面的日志来捕获到变化的数据Y

不需要改变源业务系统数据库相关表结构Y数据同步的效率比较高Y

同步的及时性也比较快Y最大的问题就是不同数据库的日志文件结

构存在较大的差异性Y实施分析起来难度比较大Y同时Y需要具备

访问源业务库日志表文件的权限Y存在一定的风险性Y所以这种方

式有很大的局限性。

日志比对方式中比较成熟的技术是CDC(ChangeDataCapture)技术Y

作用同样是能够捕获到上一次抽取之后产生的相关变化数据Y当

CDC对源业务表进行新增更新和删除等相关操作的时就可以捕获

到相关变化的数据Y相对于增量字段方式YCDC方式能够较好地捕

获到删除数据Y并写入相关数据库日志表Y然后再通过视图或者别

的某种可操作的方式将捕获到的变化同步到数据仓库当中去。

这种方式的优点是ETL同步效率较高Y不需要修改业务系统表结构Y

可以实现数据的递增加载缺点是业务系统数据库版本与产品不统

一Y难以统一实现Y实现过程相对复杂Y并且需深入研究方能实现

这种方式也通过第三方工具实现Y但是Y一般都是商业软件Y费用

较高。

喜欢离语请大家收藏:()离语

热门小说推荐
1908远东狂人

1908远东狂人

他回到了清朝末年,以一己之力扭转历史的乾坤,写下一段远东狂人的传奇...

重生我的时代

重生我的时代

人的一生要靠自我奋斗,当然也要考虑历史的进程!克格勃对外情报总局,332362665克格勃国内防谍总局,533461647...

重生之嫡女大翻身

重生之嫡女大翻身

重生之嫡女大翻身上一世她在愤恨中离世,眼看着自己的一双儿女失去性命,却无能为力。奈何上天让她重活一世,这次誓将那些人踩在脚下。...

萌妻甜甜圈:亿万暖婚第7天

萌妻甜甜圈:亿万暖婚第7天

三岁定终身,十岁献初吻,二十岁做他大总裁的贴身保镖,这样竹马还能被别人骑跑,她这些年武学生涯算毛?看她一枝青梅压竹马!可悲催的是,从头到尾被压迫的都是她五年后。妈咪!为什么可爱的小白没有爹地?...

一世强龙秦楠

一世强龙秦楠

身为全球顶级富豪继承人的他,原本只想拥有一段美丽的爱情,因此遭到了家族的反对,取消了一切生活来源。本以为爱情握在了手里,却没想到在爱慕虚荣的女友眼里,自己只是一场笑料!既然你如此唾弃,我就恢复本来面目,让你看看我这张狂的世界,到底多么精彩!…...

绝武神医

绝武神医

十年前,家族全家被害,只剩他一人幸存。十年之后,秦君身怀盖世医术绝世武功。重回都市,神医之威再无人能挡。...

每日热搜小说推荐