一、前言

在前段工作中,曾几次收到超级话题积分漏记的用户反馈。通过源码的阅读分析后,发现问题出在高并发分布式场景下的计数器上。计数器的值会影响用户当前行为所获得积分的大小。比如,当用户在某超级话题下连续第 n(n 即计数器的值)次进行转发帖子时,将会获得与 n 相关的分数。然而,在第一次改进后问题依然存在。所以,这次在之前的基础上,通过使用 MySQL 变量的途径来解决该问题。

二、到底 MySQL 的变量分哪几类?

MySQL变量一共分为两大类:用户自定义变量和系统变量。如下:

  • 用户自定义变量
    • 局部变量
    • 会话变量
  • 系统变量
    • 会话变量
    • 全局变量

本文涉及的内容为用户自定义会话变量,若对其他分类无感,请点击这里

PS:用户定义的会话变量和系统定义的会话变量有什么区别?

局部变量

局部变量一般用于 SQL 的语句块中,比如存储过程中的 begin 和 end 语句块。其作用域仅限于该语句块内。生命周期也仅限于该存储过程的调用期间。

DROP PROCEDURE IF EXISTS ADD;

CREATE PROCEDURE add (IN a INT,
                      IN b INT)
begin
  DECLARE c INT DEFAULT 0;

  SET c = a + b;

  SELECT c AS c;
end; 

上述存储过程中定义的变量 c 就是局部变量。

会话变量

会话变量即为服务器为每个客户端连接维护的变量。在客户端连接时,使用相应全局变量的当前值对客户端的回话变量进行初始化。设置会话变量不需要特殊权限,但客户端只能更改自己的会话变量。其作用域与生命周期均限于当前客户端连接。

会话变量的赋值:

set session var_name = value;
set @@session.var_name = value;
set var_name = value;

会话变量的查询:

select @@var_name;
select @@session.var_name;
show session variables like "%var%";

全局变量

全局变量影响服务器整体操作。当服务器启动时,它将所有全局变量初始化为默认值。这些默认值可以在选项文件中或在命令行中指定的选项进行更改。要想更改全局变量,必须具有 SUPER 权限。全局变量作用于 server 的整个生命周期,但是不能跨重启。即重启后所有设置的全局变量均失效。要想让全局变量重启后继续生效,需要更改相应的配置文件。

全局变量的设置:

set global var_name = value; //注意:此处的global不能省略。根据手册,set命令设置变量时若不指定GLOBAL、SESSION或者LOCAL,默认使用SESSION
set @@global.var_name = value; //同上

全局变量的查询:

select @@global.var_name;
show global variables like "%var%";

三、MySQL用户自定义变量详解

你可以利用 SQL 语句将值存储在用户自定义变量中,然后再利用另一条 SQL 语句来查询用户自定义变量。这样以来,可以再不同的 SQL 间传递值。

用户自定义变量的声明方法形如:@var_name,其中变量名称由字母、数字、“.”、“_”和“$”组成。当然,在以字符串或者标识符引用时也可以包含其他字符(例如:@’my-var’,@”my-var”,或者@`my-var`)。

用户自定义变量是会话级别的变量。其变量的作用域仅限于声明其的客户端链接。当这个客户端断开时,其所有的会话变量将会被释放。

用户自定义变量是不区分大小写的。

使用 SET 语句来声明用户自定义变量:

SET @var_name = expr[, @var_name = expr] ...

在使用 SET 设置变量时,可以使用“=”或者“:=”操作符进行赋值。

当然,除了 SET 语句还有其他赋值的方式。比如下面这个例子,但是赋值操作符只能使用“:=”。因为“=”操作符将会被认为是比较操作符。

mysql> SET @t1=1, @t2=2, @t3:=4;
mysql> SELECT @t1, @t2, @t3, @t4 := @t1+@t2+@t3;
+------+------+------+--------------------+
| @t1  | @t2  | @t3  | @t4 := @t1+@t2+@t3 |
+------+------+------+--------------------+
|    1 |    2 |    4 |                  7 |
+------+------+------+--------------------+

用户变量的类型仅限于:整形、浮点型、二进制与非二进制串和 NULL。在赋值浮点数时,系统不会保留精度。其他类型的值将会被转成相应的上述类型。比如:一个包含时间或者空间数据类型(temporal or spatial data type)的值将会转换成一个二进制串。

如果用户自定义变量的值以结果集形式返回,系统会将其转换成字符串形式。

如果查询一个没有初始化的变量,将会以字符串类型返回 NULL。

不要在同一个非 SET 语句中同时赋值并使用同一个用户自定义变量

用户自定义变量可以用于很多上下文中。但是目前并不包括那些显式使用常量的表达式中,比如 SELECT 中的 LIMIT 子句,或者 LOAD DATA 中的 IGNORE N LINES 的字句中。

通常来说,除了在 SET 语句中,不要再同一个 SQL 语句中同时赋值并使用同一个用户自定义变量。举个变量自增的例子,下面的是没问题的:

SET @a = @a + 1;

对于其他语句,比如 SELECT,也许会得到期望的效果,但这真心不靠谱。比如下面的语句,也许你自然地会认为 MySQL 会先执行 @a 的值,然后再进行赋值操作:

SELECT @a, @a:=@a+1, ...;

然而,用户自定义变量表达式的计算顺序还没有定义呢。

除此之外,还有另一个问题。变量的默认返回类型由语句开始时的类型决定的,正如下面的例子:

mysql> SET @a='test';
mysql> SELECT @a,(@a:=20) FROM tbl_name;

上述的 SELECT 语句中,MySQL 会报告给客户端第一列的字段类型为字符串,同时将所有对 @a 变量的使用均转换为字符串处理,尽管在 SELECT 语句中将 @a 变量设置为数字类型。在 SELECT 语句执行后,@a 变量才会在下一个语句中识别为数字类型。

为了避免上述问题的发生,要么不在同一个语句中同时赋值并使用变量,要么在使用之前,将变量设置为0,0.0,或者”,以确定它的数据类型。

变量的值是在 SQL 发送到客户端后才计算的

在 SELECT 语句中,在每一个 select 表达式被发送给客户端后,才会进行计算。这就意味着,在形如 HAVING,GROUP BY 和 ORDER BY 只句中有使用在当前 select 表达式定义的变量的情况下,该语句将不会得到如期的效果。

mysql> SELECT (@aa:=id) AS a, (@aa+3) AS b FROM tbl_name HAVING b=5;

上述在 HAVING 只句中使用了在当前的 select 列表中定义的别名 b,其使用了变量 @aa。这条语句并不会得到如期的效果:@aa 变量为上一次 SQL 语句执行的结果集中的 ID 值,并非当前的。

四、MySQL 用户自定义变量的实际应用举例

项目

超级话题积分系统

术语

积分行为:如转发、评论超级话题下的帖子、签到某超级话题或者帖子被其他人回复等行为。

积分行为次数:产生积分行为的累计次数。

业务场景

用户在某超级话题下,第 N 次产生累计积分的行为,如转发微博,会增加该用户在该超级话题下的积分总数。具体的积分规则见长文章

问题

曾有用户反馈说超级话题积分有漏记的情况:为什么我评论了却没有加分;为什么转发了超级话题帖子没有加分等等。随后,我们立即通过查询后台的积分记录发现,会看到转发行为在第 5 次时,积分的增加却为 0。这显然是不正常的。

首先,排除了根据积分行为的次数来计算积分值的问题。比如第 5 次转发微博应增加 6 分。这块的规则,利用二分法写死在程序里面,也做过单元测试,不会有问题。那么,问题就锁定在这个积分行为的次数。

首先来看看积分次数的获取:

public static function find($uid, $aid, $status) {
    $sql = 'SELECT * FROM '.self::table($aid).' WHERE uid = ? AND aid = ? AND status = ?';
    return Comm_Db::d(Comm_Db::DB_BASIC)->fetchRow($sql, array($uid, $aid, $status));
}

然后,利用上述 find() 方法来取得该用户在某超级话题下的某积分行为的累计次数。这是有问题的,在于读于从库,但并不保证从库的值是最新的,所以导致当前获取的积分行为次数并不一定是正确的(小于等于实际的值)。

随后,程序会根据当前的次数计算积分值,并分别更新积分值和该行为的积分行为次数值。

所以,这次利用 MySQL 的用户自定义会话变量的方式,来解决上述问题。

public static function incCounter($uid, $aid, $status) {
    $db = Comm_Db::d(Comm_Db::DB_BASIC);
    $sql = "UPDATE ". self::table($aid) ." SET `ctn_counter`=@ctn_counter:=`ctn_counter`+1 WHERE `uid` = ? AND `aid` = ? AND `status` = ?";
    $db->execute($sql, array($uid, $aid, $status));
    $sql = "SELECT @ctn_counter";
    $rs = $db->fetchOne($sql, null, true);
    return $rs;
}

改进后,如上述函数,程序将先进行调用 incCounter() 函数,将当前的积分行为次数自增,并将值存入当前变量中。随后,立即将其读取并返回给 PHP 进行积分处理。这样一来,就保证了积分行为次数的正确性。

五、关于 MySQL 用户自定义变量的结束语

在这次的“填坑”过程中,使用了 MySQL 变量解决了 MySQL 主从服务同步延迟的问题。这篇文章也算是对于 MySQL 用户自定义变量深入学习的记载。

除此之外,仍有个问题,用户自定义的会话变量是存在进程内存中的。但是,是存在客户端进程中还是服务端进程中的呢?


参考文章:

文章来源:深入 MySQL 用户自定义变量:使用详解及其使用场景案例

转载请注明出处,违者必究!

Share:

2 comments

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.