1.DQL数据集查询

DQL(Dataset Query Language)数据集查询是类SQL查询语句,对多数据源进行过滤、关联、聚合等流式分布并发计算

数据集关联查询
DQL是对数据集进行再次查询,例如数据集ds1、ds2, ds1与ds2是数据库SQL查询生成的数据集,ds1与ds2来源不同数据库查询

DQL将数据集ds1与ds2按名称字段NAME进行关联 DQL语句: select * from ds1 t1 join ds2 t2 on t1.NAME=t2.NAME 或是 select * from ds1 t1, ds2 t2 where t1.NAME=t2.NAME

数据集过滤
DQL是对数据集进行再次过滤查询,过滤参数为name
DQL语句: select * from ds1 t1, ds2 t2 where t1.NAME=t2.NAME and t1.NAME=:name

数据集分组求和
数据库SQL查询生成数据集名称为groupby

DQL对数据集groupby进行分组求和查询,按AREA_NAME,CITY_PRO,CITY_NAME 字段分组求和
DQL语句:select AREA_NAME,CITY_PRO,CITY_NAME, sum(SALE_PRICE) SALE_PRICE from groupby GROUP by AREA_NAME,CITY_PRO,CITY_NAME

分步计算
DQL也支持对DQL生成的数据集再次查询计算,如上DQL语句:
select AREA_NAME,CITY_PRO,CITY_NAME, sum(SALE_PRICE) SALE_PRICE from groupby GROUP by AREA_NAME,CITY_PRO,CITY_NAME 生成数据名称为dqlgroup的数据集

可以对dql生成的数据集再次计算,如DQL语句:select sum(SALE_PRICE) AS TOTAL from dqlgroup