February 2012
M T W T F S S
« Aug    
 12345
6789101112
13141516171819
20212223242526
272829  

ACOUG 7月活动关于Exadata的分享

Kaya 发表于 os2ora.com 这是7月30号在北京远洋光华中心ACOUG所组织的一次技术活动。我的分享主题是《Exadata下的数据并行加载、并行卸载及性能监控》。另一位作者是邢海捷,早在几年前,就深深地拜读了他在《Oracle数据库性能优化》对锁的深入浅出的描述。 北京还是挺有技术氛围的,自愿自觉地参加,又能办得红红火火,很成功的组织。 和Eygle和yangtingkun的一张合影(左起:Kaya, Eygle,Yangtingkun)。我觉得这张图片很有意义。 更多图片,猛击http://www.douban.com/photos/album/54076276/ 下面是演讲的PPT。 Exadata下的数据并行加载、并行卸载及性能监控 当然, 给大家留下深刻印象的,其实是里面的两个Live Demo, Eygle和Yangtingkun的blog/weibo里也不约而同地也提到了(一台满配的X2-2机器): 加载1TB数据,用时10分钟,全表扫描读取这些数据用时 7 秒。总数据量行数在 76 亿左右。 卸载1TB数据,用时17分钟,同时实现把文件压缩成gzip格式。

史上最快,最具可扩展性的文本导出方法

这个题目有点吓人,不过既然这么说,当然有其强有力的后台做支撑。如果说一句谎言必须用更多的谎言来圆的话,一句真话恐怕也要用更多的真话来阐述,呵呵,且让我慢慢道来。

Oracle上的技术,其实是相当开放的,这里提到的这种文本导出方法,其实在网上已经有人做了很好的论述和实现。只不过本着独乐乐不如众乐乐的想法,在这里再推广一把罢了。

首先明确一点,文本导入到数据库中,或者把数据从数据库中导出为文本格式,这都是极其消耗CPU的操作。所以,导出速度首先取决于系统CPU的运算能力。基于大数据量处理的系统一般都是多节点的RAC系统,于是,文本导出的一个主要议题就是:如何利用起所有RAC节点的所有CPU的运算能力……