在项目开发当中,经常要实现分页功能,在面试时也会经常被问到:什么是分页。这是因为在一个页面上能够显示的数据是有限的,而存放在数据库中的数据往往很多,我们必须将这些数据安放到不同的页面中去。

一、分页

1. 什么是分页

一般在客户端实现分页功能的时候,要显示当前页的数据、当前所在页数、临近页面的按钮以及总页数等等。这些数据随着翻页的进行能够动态的变化,为了实现这样的效果,一般会采取两种办法:真分页假分页。这样的划分方式是从与数据库的交互方式出发的,是每次翻页时都进行查询还是一次性查出所有的数据。

2. 真分页

真分页指的是每次在进行翻页时都只查询出当前页面的数据,特点就是与数据库的交互次数较多,但是每次查询的数据量较少,数据也不需要一直保存在内存中。适用于数据量比较大的场景,数据不适合全量查出的情况。

3. 假分页

假分页指的是对于要显示的数据一次性全部查出,一直存在在服务端或客户端,在前端进行分页或由服务端控制分页。将根据当前所在页来计算应该显示的数据所在下标,用循环取出目标数据。只有当会话断开或页面关闭,相应的资源才会被释放。

4. 缓存层

真分页和假分页都要和数据库进行交互,对于真分页来说不需要担心数据同步的问题,因为每次都是查询出最新的,但是数据库的负担会很重,尤其是用户量大的情况下。

假分页可以在一定程度上减轻数据库的压力,但是数据不能及时得到同步,除非重新请求或页面刷新。

一般在企业中会有缓存层的存在,既能有效降低数据库的压力,又能及时的进行数据同步。在对数据库中的数据进行修改后,要将变更后的数据及时同步到缓存层,在进行数据查询时从缓存层获取。

二、mysql实现分页

本文将介绍如何通过真分页的方式,每次取出所需数据。对于不同的数据,实现分页有不同的方式,在mysql中可以使用limit来限制查询出的数据。

1. limit用法

limit出现在查询语句的最后,可以使用一个参数或两个参数来限制取出的数据。其中第一个参数代表偏移量:offset(可选参数),第二个参数代表取出的数据条数:rows。

  • 单参数用法

当指定一个参数时,默认省略了偏移量,即偏移量为0,从第一行数据开始取,一共取rows条。

/* 查询前5条数据 */
select * from student limit 5;
  • 双参数用法

当指定两个参数时,需要注意偏移量的取值是从0开始的,此时可以有两种写法:

/* 查询第1-10条数据 */
select * from student limit 0,10;
/* 查询第11-20条数据 */
select * from student limit 10 offset 10;

2. 分页公式

  • 总页数计算

在进行分页之前,我们需要先根据数据总量来得出总页数,这需要用到count函数和向上取整函数ceil,sql如下:

/* 获得数据总条数 */
select count(*) from student;
/* 假设每页显示10条,则直接进行除法运算,然后向上取整 */
select ceil(count(*) / 10) as pagetotal from student;
  • 核心信息
    • 当前页:pagenumber
    • 每页数据量:pagesize

在实际操作中,我们能够得到的信息有当前所在页以及每页的数据量,同时要注意一下是否超出了最大页数。以每页10条为例,则前三页的数据应为:

  • 第1页:第1~10条,sql写法:limit 0,10
  • 第2页:第11~20条,sql写法:limit 10,10
  • 第3页:第21~30条,sql写法:limit 20,10

据此我们可以总结出,limit所需要的两个参数计算公式如下:

  • offset:(pagenumber – 1) * pagesize
  • rows:pagesize

8种mysql分页方法总结

方法1: 直接使用数据库提供的sql语句

—语句样式: mysql中,可用如下方法: select * from 表名称 limit m,n。

—适应场景: 适用于数据量较少的情况(元组百/千级)。

—原因/缺点: 全表扫描,速度会很慢 且 有的数据库结果集返回不稳定(如某次返回1,2,3,另外的一次返回2,1,3)。limit限制的是从结果集的m位置处取出n条输出,其余抛弃。

方法2: 建立主键或唯一索引, 利用索引(假设每页10条)

—语句样式: mysql中,可用如下方法:

代码如下:

select * from 表名称 where id_pk > (pagenum*10) limit m

—适应场景: 适用于数据量多的情况(元组数上万)。

—原因: 索引扫描,速度会很快。有朋友提出因为数据查询出来并不是按照pk_id排序的,所以会有漏掉数据的情况,只能方法3。

方法3: 基于索引再排序

—语句样式: mysql中,可用如下方法: select * from 表名称 where id_pk > (pagenum*10) order by id_pk asc limit m。

—适应场景: 适用于数据量多的情况(元组数上万). 最好order by后的列对象是主键或唯一所以,使得orderby操作能利用索引被消除但结果集是稳定的(稳定的含义,参见方法1)。

—原因: 索引扫描,速度会很快. 但mysql的排序操作,只有asc没有desc(desc是假的,未来会做真正的desc,期待)。

方法4: 基于索引使用prepare

(第一个问号表示pagenum,第二个?表示每页元组数)

—语句样式: mysql中,可用如下方法:

代码如下:

prepare stmt_name from select * from 表名称 where id_pk > (?* ?) order by id_pk
asc limit m

—适应场景: 大数据量。

—原因: 索引扫描,速度会很快. prepare语句又比一般的查询语句快一点。

方法5:利用mysql支持order操作可以利用索引快速定位部分元组,避免全表扫描

—比如: 读第1000到1019行元组(pk是主键/唯一键)。

代码如下:

—select * from your_table where pk>=1000 order by pk asc limit 0,20

方法6: 利用”子查询/连接+索引”快速定位元组的位置,然后再读取元组. 道理同方法5

—如(id是主键/唯一键,蓝色字体时变量):

利用子查询示例:

代码如下:

select* fromyour_table whereid <=
(selectid fromyour_table order
byid desclimit (p a g e − 1 ) ∗ page-1)*page−1)∗pagesize orderbyid desc
limit $pagesize

利用连接示例:

代码如下:

select* fromyour_table ast1
join(selectid fromyour_table orderby
id desclimit (p a g e − 1 ) ∗ page-1)*page−1)∗pagesize ast2
where
t1.id <= t2.id orderbyt1.id desclimit $pagesize;

方法7: 存储过程类(最好融合上述方法5/6)

—语句样式: 不再给出

—适应场景: 大数据量. 作者推荐的方法

—原因: 把操作封装在服务器,相对更快一些。

方法8: 反面方法

—网上有人写使用 sql_calc_found_rows。 没有道理,勿模仿 。

基本上,可以推广到所有数据库,道理是一样的。但方法5未必能推广到其他数据库,推广的前提是,其他数据库支持order by操作可以利用索引直接完成排序。 

以上为个人经验,希望能给大家一个参考,也希望大家多多支持。