博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
性能优化技巧 - 程序游标
阅读量:7002 次
发布时间:2019-06-27

本文共 862 字,大约阅读时间需要 2 分钟。

很多算法都会产生落地的中间结果,从而影响性能,尤其是数据量较大的时候。这种情况下通常可用程序游标来避免数据落地,下面举例说明。

前半排序

计算目标:订单表原来已按时间排序,需要将数据按日期、产品去除重复,再统计记录条数。

由于去重后结果集较大,内存放不下,因此一般会用groupx去重,SPL脚本如下:

1
A2:循环订单表。由于数据已按时间排序,因此每次取日期相同的一批数。

B2:按产品去重。注意,全量数据虽大,但按天取数相对较少,内存可以放下,所以这里用id去重。

B3:返回本批次的去重结果。注意,程序游标并非一次性返回所有数据,而是每次循环之后,先等待调用者的请求,如果调用者继续要数据,程序游标才会进行下一次循环,期间数据不落地。

主程序可通过cursor函数调用程序游标,用法与普通游标类似:

2
  可以看到,程序游标可减少数据落地,从而提升计算性能。

 集合运算

数据库进行集合运算时要先排序,如果数据量太大,则排序会耗费大量时间,迟迟不能输出结果。在这种情况下,适合用程序游标生成不落地的有序中间结果集,从而实现快速输出。

比如两张结构相同表:callRecordA、callRecordB。两张表在时间字段callTime上建立了索引,每秒数据量万级,现在对2015-01-01这一天的数据做并集运算,需要快速输出前500条(比如在报表上快速呈现)。

这次将程序游标和调用代码写在同一个脚本中,如下:

3
A1:用func定义程序游标,相应的调用语法为cursor@c。

B2:循环一天中的每一秒。

C3:从数据库查询一秒的数据,因为是按索引取数,所以速度很快,而且对数据库影响很小。注意A1是表名变量,程序游标既可以从callRecordA取数,也可以从callRecordB取数。

C4:对一秒数据进行内存排序,以便形成有序结果集。由于数据在同一秒,所以只需对其他字段排序。

A7A8:以表名为参数,取出2个程序游标。

A9:对两个游标进行有序归并,@u表示取并集。类似地,可以用@i和@d分别进行并交集、差集运算。

转载地址:http://uervl.baihongyu.com/

你可能感兴趣的文章
IOS-Storyboard全解析-第二部分
查看>>
WEKA,一个开源java的数据挖掘工具
查看>>
Linux 查看设置系统语言
查看>>
阿里云物联网平台体验(NetGadgeteer+C#篇)
查看>>
mongdb开始标记
查看>>
linux内核源码结构
查看>>
CCM加密学习
查看>>
ZigBee profile
查看>>
127.0.0.1\SQLEXPRESS连接异常
查看>>
在linux上安装psycopg2出错--Error: pg_config executable not found.
查看>>
6款强大的 jQuery 网页布局创建及优化插件
查看>>
圆珠笔芯为什么那么细
查看>>
What is NetApp's Cluster File System?
查看>>
poj1184 聪明的打字员(BFS剪枝)
查看>>
xmlhelper (把实体对象转成xml文档)
查看>>
WPS Word表格转成文字或文字制成表格的快捷方法
查看>>
PHP开发:架构师详解PHP抓取程序逻辑代码,创造编程逻辑思维
查看>>
ROG冰川散热架构 如何让游戏本释放猛兽性能?
查看>>
Apache Kafka:大数据的实时处理时代
查看>>
一代神机华为MateRS专为保时捷跑车70周年量身定制
查看>>