掌握 SQL 基础(一)
Sixdegree Lab
2022-11-10 17:14
订阅此专栏
收藏此文章

基础概念


1、数据仓库是什么?


说人话就是说就是出于数据统计的需要,把一些数据分门别类地存储起来,存储的载体是【数据表】。针对某一个或者一些主题的一系列【数据表】合在一起就是数据仓库。

注意: 这里的数据可以是结果数据 ( 比如 Uniswap 上线以来某个交易对每天的交易量统计 ) 也可以是过程数据 (Uniswap 上线以来某个交易对发生的每一条交易记录明细:谁发起的,用 A 换 B,交易时间,tx_hash,交易数量….)。


2、SQL 是什么?


假设你想吃脆香米巧克力,但是你这会儿出不了门,你就叫个跑腿说:我需要一盒巧克力,他的牌子是脆香米。跑腿去了趟超市把巧克力买来送到你家。 类比过来 SQL 就是你说的那句话,Dune Analytics 就是个跑腿儿,他可以让你可以跟数据仓库对话,并且将数据仓库里的数据给你搬出来给你。SQL 最基本的结构或者语法就 3 个模块,几乎所有的 SQL 都会包含这 3 个部分:


  • select: 取哪个字段?
  • from:从哪个表里取?
  • where:限制条件是什么?


3、数据表长什么样?


你可以认为表就是一个一个的 Excel 表,每一个 Excel 表里存的不同的数据。以 ethereum.transactions( 以太坊上的 transactions 记录 ) 为例:



顺便说下表里用比较多的几个字段


  • block_time:交易被打包的时间
  • block_number:交易被打包的区块高度
  • value:转出了多少 ETH( 需要除以 power(10,18) 来换算精度 )
  • from:ETH 从哪个钱包转出的
  • to: ETH 转到了哪个钱包
  • hash:这个 transaction 的 tx hash
  • success:transaction 是否成功


常见语法以及使用案例


1.基础结构·运算符·排序


案例 1:我想看看孙哥钱包 (0x3DdfA8eC3052539b6C9549F12cEA2C295cfF5296) 在 2022 年 1 月份以来的每一笔 ETH 的大额转出 (>1000ETH) 是在什么时候以及具体的转出数量




Dune Query URL


​https://dune.com/queries/1523799​


语法说明


SELECT


SELECT 后边跟着,需要查询的字段,多个字段用英文逗号隔开


FROM


FROM 后边跟着数据来源的表


WHERE


WHERE 后跟着对数据的筛选条件


  • 运算符:and / or
  • 如果筛选条件条件有多个,可以用运算符来连接
  • and:多个条件取并集
  • or:多个条件取交集
  • 排序:order by [字段 A] ,按照字段 A 升序排列,如果需要按照降序排列就在末尾加上 desc
  • 幂乘计算:用于换算 Value 的精度,函数是 Power(Number,Power),其中 number 表示底数;power 表示指数
  • 字符串中字母换算大小写
  • lower():字符串中的字母统一换成小写
  • upper():字符串中的字母统一换成大写


2.聚合函数


案例 2:表里都是明细数据,我不想看细节,我只想通过一些统计数据去了解概况


SQL




Dune Query URL


​https://dune.com/queries/1525555​


语法说明


聚合函数


  • count():计数,统计有多少个;如果需要去重计数,括号内加 distinct
  • sum():求和
  • min():求最小值
  • max():求最大值
  • avg():求平均


3.日期时间函数·分组聚合


案例 3:我不想只看一个单独的数字,想分小时 / 天 / 周来看一下趋势


3.1 把时间戳转化成小时 / 天 / 周的格式,方便进一步做聚合统计


SQL




Dune Query URL


​https://dune.com/queries/1527740​


语法说明


DATE_TRUNC('datepart', timestamp)


时间戳的截断函数


根据 datepart 参数的不同会得到不同的效果


  • minute:将输入时间戳截断至分钟
  • hour:将输入时间戳截断至小时
  • day:将输入时间戳截断至天
  • week:将输入时间戳截断至某周的星期一
  • year:将输入时间戳截断至一年的第一天


3.2 基于之前得到的处理后的时间字段,使用 group by + sum 完成分组聚合


SQL




Dune Query URL


​https://dune.com/queries/1525668​


语法说明


分组聚合 (group by)


分组聚合的语法是 group by。分组聚合顾名思义就是先分组后聚合,需要配合聚合函数一起使用。



假设上边表格是一个家庭 (3 个人 )2020 年前 2 个月的生活开销明细,如果你只用简单的 sum,那你只能得到总计的 12900;如果你想的到右边 2 种统计数据,那就需要用到分组聚合 group by(按照【人员】分组聚合或者按照【月份】分组聚合)


4.联表查询·子查询


案例 4:我想从转出 ETH 的 USD 金额的角度去看孙哥的转出行为


4.1 转出数据看到的都是 ETH 的量,我想看下每次转出价值多少 USD


SQL





Dune Query URL


​https://dune.com/queries/1528027​


语法说明


联表查询


  • 大部分情况下我们需要的数据不是在同一张表里,比如 transaction 表存储的就是只有 transaction 数据,没有价格数据。如果我们希望能够计算出 transaction 对应 USD 价值,那就需要用联表查询把价格数据给关联进来
  • 联表查询可以理解为把两个表通过一定的条件关联起来形成一张虚拟的表,你可以方便地对这虚拟表做更多处理。


联表查询有 2 个部分构成


  • 联表方式 (join,left join ,right join ,cross join,full join)
  • 关联条件 (on)


用得最多的联表方式是 join 跟 left join,以这 2 个为例子去解释下具体的用法



join:把两个表按照关联条件 (on) 关联在一起,取交集


  • Table A 跟 Table B 通过姓名关联,其中交集是小红和小明,因为 join 是取交集,因此最终结果里姓名就只有小明和小红
  • 两表中所有符合要求的数据都需要关联,因为 Table B 中小明有 2 条记录,所以关联的结果中小明也有两条数据


left join:以左表为主,把右表按照关联条件 (on) 往左表去关联,如果关联不到就用 null 填充


  • Table A 跟 Table B 通过姓名关联,因为是以左表为主,所以尽管左表中小兰和小绿在右表中没有符合关联条件的数据,但是小兰和小绿也会出现在结果中,右表那部分因为关联不到数据,因此都用 null 填充


4.2 我想把 4.1 的明细数据按照天去分组聚合,但是不想写嵌套太多层的 sql


SQL




Dune Query URL


​https://dune.com/queries/1528564​


语法说明


子查询 (with as )


  • 通过 with as 可以构建一个子查询,把一段 SQL 的结果变成一个'虚拟表'(可类比为一个视图或者子查询),接下来的 SQL 中可以直接从这个'虚拟表'中取数据
  • 通过 with as 可以比较好地提高 SQL 的逻辑的可读性,也可以避免多重嵌套

【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

相关Wiki
Sixdegree Lab
数据请求中
查看更多

推荐专栏

数据请求中
在 App 打开