数据查询

查询语法

SELECT {DATABASE() | CLIENT_VERSION() | SERVER_VERSION() | SERVER_STATUS() | NOW() | TODAY() | TIMEZONE() | CURRENT_USER() | USER() }

SELECT [hints] [DISTINCT] [TAGS] select_list
    from_clause
    [WHERE condition]
    [partition_by_clause]
    [interp_clause]
    [window_clause]
    [group_by_clause]
    [order_by_clasue]
    [SLIMIT limit_val [SOFFSET offset_val]]
    [LIMIT limit_val [OFFSET offset_val]]
    [>> export_file]

hints: /*+ [hint([hint_param_list])] [hint([hint_param_list])] */

hint:
    BATCH_SCAN | NO_BATCH_SCAN | SORT_FOR_GROUP | PARTITION_FIRST | PARA_TABLES_SORT | SMALLDATA_TS_SORT

select_list:
    select_expr [, select_expr] ...

select_expr: {
    *
  | query_name.*
  | [schema_name.] {table_name | view_name} .*
  | t_alias.*
  | expr [[AS] c_alias]
}

from_clause: {
    table_reference [, table_reference] ...
  | table_reference join_clause [, join_clause] ...
}

table_reference:
    table_expr t_alias

table_expr: {
    table_name
  | view_name
  | ( subquery )
}

join_clause:
    [INNER|LEFT|RIGHT|FULL] [OUTER|SEMI|ANTI|ASOF|WINDOW] JOIN table_reference [ON condition] [WINDOW_OFFSET(start_offset, end_offset)] [JLIMIT jlimit_num]

window_clause: {
    SESSION(ts_col, tol_val)
  | STATE_WINDOW(col [, extend[, zeroth_state]]) [TRUE_FOR(true_for_expr)]
  | INTERVAL(interval_val [, interval_offset]) [SLIDING (sliding_val)] [fill_clause]
  | EVENT_WINDOW START WITH start_trigger_condition END WITH end_trigger_condition [TRUE_FOR(true_for_expr)]
  | COUNT_WINDOW(count_val[, sliding_val][, col_name ...])
}

interp_clause:
    RANGE(ts_val [, ts_val]) EVERY(every_val) fill_clause

fill_clause:
    FILL(fill_mode_and_val) [SURROUND(surrounding_time_val [, fill_vals])]

fill_mode_and_val:
    NONE
  | NULL|NULL_F
  | VALUE|VALUE_F [, fill_vals]
  | PREV|NEXT|NEAR
  | LINEAR
 
group_by_clause:
    GROUP BY group_by_expr [, group_by_expr] ... HAVING condition
                                                    
group_by_expr:
    {expr | position | c_alias}

partition_by_clause:
    PARTITION BY partition_by_expr [, partition_by_expr] ...

partition_by_expr:
    {expr | position | c_alias}

order_by_clasue:
    ORDER BY order_expr [, order_expr] ...

order_expr:
    {expr | position | c_alias} [DESC | ASC] [NULLS FIRST | NULLS LAST]

true_for_expr: {
    duration_time
  | COUNT count_val
  | duration_time AND COUNT count_val
  | duration_time OR COUNT count_val
}

部分字段语法说明

select_expr: 选择列表达式，可以为常量、列、运算、函数以及它们的混合运算，不支持聚合函数的嵌套。
from_clause: 指定查询的数据源，可以是单个表（超级表、子表、普通表、虚拟表），也可以是视图，也支持多表关联查询。
table_reference: 指定单个表（含视图）的名称，可选指定表的别名。
table_expr: 指定查询数据源，可以为表名，视图名，子查询。
join_clause: 连接查询，支持在子表、普通表、超级表以及子查询间进行，在窗口连接中 WINDOW_OFFSET 使用 start_offset、end_offset 分别指定窗口左右边界相对于左右表主键的偏移量，两者之间无大小关联，为必填项，精度可选 1n（纳秒）、1u（微妙）、1a（毫秒）、1s（秒）、1m（分）、1h（小时）、1d（天）、1w（周），如 window_offset(-1a,1a)。JLIMIT 限制单行匹配最大行数，默认值为 1，取值范围为[0,1024]。更多详细信息可以参阅关联查询章节 TDengine TSDB 关联查询。
window_clause: 指定数据按照窗口进行切分并进行聚合，是时序数据库特色查询。详细信息可参阅特色查询章节 TDengine TSDB 特色查询。
- SESSION: 会话窗口，ts_col 指定时间戳主键列，tol_val 指定时间间隔，正值，时间精度可选 1n、1u、1a、1s、1m、1h、1d、1w，如 SESSION(ts, 12s)。
- STATE_WINDOW: 状态窗口，extend 指定窗口在开始结束时的扩展策略，可选值为 0（默认值）、1、2，分别代表无扩展、向后扩展、向前扩展；zeroth state 指定"零状态"，状态列为此状态的窗口将不会被计算和输出，输入必须是整型、布尔型或字符串常量；TRUE_FOR 指定窗口过滤条件，支持以下四种模式：
  - TRUE_FOR(duration_time)：仅基于持续时长过滤，窗口持续时长必须大于等于 duration_time。
  - TRUE_FOR(COUNT n)：仅基于数据行数过滤，窗口数据行数必须大于等于 n。
  - TRUE_FOR(duration_time AND COUNT n)：同时满足持续时长和数据行数条件。
  - TRUE_FOR(duration_time OR COUNT n)：满足持续时长或数据行数条件之一即可。
  其中 duration_time 为时间范围正值，精度可选 1n（纳秒）、1u（微秒）、1a（毫秒）、1s（秒）、1m（分）、1h（小时）、1d（天）、1w（周），如 TRUE_FOR(1a)、TRUE_FOR(COUNT 100)、TRUE_FOR(10m AND COUNT 50)、TRUE_FOR(5m OR COUNT 20)。
- INTERVAL: 时间窗口，interval_val 指定窗口大小，sliding_val 指定窗口滑动时间，大小限制在 interval_val 范围内，interval_val 和 sliding_val 时间范围为正值，精度可选 1n、1u、1a、1s、1m、1h、1d、1w，如 interval_val(2d)、SLIDING(1d)。
- EVENT_WINDOW: 事件窗口，使用 start_trigger_condition、end_trigger_condition 指定开始结束条件，支持任意表达式，可以指定不同的列。TRUE_FOR 指定窗口过滤条件，支持以下四种模式：
  - TRUE_FOR(duration_time)：仅基于持续时长过滤，窗口持续时长必须大于等于 duration_time。
  - TRUE_FOR(COUNT n)：仅基于数据行数过滤，窗口数据行数必须大于等于 n。
  - TRUE_FOR(duration_time AND COUNT n)：同时满足持续时长和数据行数条件。
  - TRUE_FOR(duration_time OR COUNT n)：满足持续时长或数据行数条件之一即可。
  其中 duration_time 为时间范围正值，精度可选 1n（纳秒）、1u（微秒）、1a（毫秒）、1s（秒）、1m（分）、1h（小时）、1d（天）、1w（周）。示例：TRUE_FOR(10m)、TRUE_FOR(COUNT 100)、TRUE_FOR(10m AND COUNT 50)、TRUE_FOR(5m OR COUNT 20)。
- COUNT_WINDOW: 计数窗口，指定按行数划分窗口，count_val 窗口包含最大行数，范围为[2,2147483647]。sliding_val 窗口滑动数量，范围为[1,count_val]。col_name 在 v3.3.7.0 之后开始支持，指定一列或者多列，在 count_window 窗口计数时，窗口中的每行数据，指定列中至少有一列非空，否则该行数据不包含在计数窗口内。如果没有指定 col_name，表示没有限制。
interp_clause: interp 子句，与 interp 函数搭配使用，指定时间截面的记录值或者插值，可以指定插值的时间范围，输出时间间隔，插值类型。
- RANGE: 指定单个或者开始结束时间值，结束时间须大于开始时间，ts_val 为标准时间戳类型，surrounding_time_val 可选，指定时间范围，为正值，精度可选 1n、1u、1a、1s、1m、1h、1d、1w。如 RANGE('2023-10-01T00:00:00.000') 、RANGE('2023-10-01T00:00:00.000', '2023-10-01T23:59:59.999')。
- EVERY: 时间间隔范围，every_val 为正值，精度可选 1n、1u、1a、1s、1m、1h、1d、1w，如 EVERY(1s)。
fill_clause: fill 子句，可以与 interp 函数或 interval 窗口搭配使用，用于指定数据缺失时的数据填充方法。
group_by_expr: 指定数据分组聚合规则，支持表达式、函数、位置、列、别名。使用位置语法时必须出现在选择列中，如select ts, current from meters order by ts desc,2，2 对应 current 列。
partition_by_expr: 指定数据切片条件，切片内的数据独立进行计算。支持表达式、函数、位置、列、别名。使用位置语法时必须出现在选择列中，如select current from meters partition by 1，1 对应 current 列。
order_expr: 指定输出数据排序规则，默认不排序。支持表达式、函数、位置、列、别名，可以在单列或者多列中每列使用不同的排序规则，可以指定空值排序在前或者在后。
SLIMIT: 指定输出分片数量，limit_val 指定输出数量，offset_val 指定偏移开始位置，offset_val 可选，limit_val 和 offset_val 均为正值，在 PARTITION BY、GROUP BY 子句中使用。使用 ORDER BY 子句时只输出一个分片。
LIMIT: 指定输出数据数量，limit_val 指定输出数量，offset_val 指定偏移开始位置，offset_val 可选，limit_val 和 offset_val 均为正值。使用 PARTITION BY 子句时控制的是每个分片的数量。

Hints

Hints 是用户控制单个语句查询优化的一种手段，当 Hint 不适用于当前的查询语句时会被自动忽略，具体说明如下：

Hints 语法以/*+开始，终于*/，前后可有空格。
Hints 语法只能跟随在 SELECT 关键字后。
每个 Hints 可以包含多个 Hint，Hint 间以空格分开，当多个 Hint 冲突或相同时以先出现的为准。
当 Hints 中某个 Hint 出现错误时，错误出现之前的有效 Hint 仍然有效，当前及之后的 Hint 被忽略。
hint_param_list 是每个 Hint 的参数，根据每个 Hint 的不同而不同。

目前支持的 Hints 列表如下：

Hint	参数	说明	适用范围
BATCH_SCAN	无	采用批量读表的方式	超级表 JOIN 语句
NO_BATCH_SCAN	无	采用顺序读表的方式	超级表 JOIN 语句
SORT_FOR_GROUP	无	采用 sort 方式进行分组，与 PARTITION_FIRST 冲突	partition by 列表有普通列时
PARTITION_FIRST	无	在聚合之前使用 PARTITION 计算分组，与 SORT_FOR_GROUP 冲突	partition by 列表有普通列时
PARA_TABLES_SORT	无	超级表的数据按时间戳排序时，不使用临时磁盘空间，只使用内存。当子表数量多，行长比较大时候，会使用大量内存，可能发生 OOM	超级表的数据按时间戳排序时
SMALLDATA_TS_SORT	无	超级表的数据按时间戳排序时，查询列长度大于等于 256，但是行数不多，使用这个提示，可以提高性能	超级表的数据按时间戳排序时
SKIP_TSMA	无	用于显示的禁用 TSMA 查询优化	带 Agg 函数的查询语句

举例：

SELECT /*+ BATCH_SCAN() */ a.ts FROM stable1 a, stable2 b where a.tag0 = b.tag0 and a.ts = b.ts;
SELECT /*+ SORT_FOR_GROUP() */ count(*), c1 FROM stable1 PARTITION BY c1;
SELECT /*+ PARTITION_FIRST() */ count(*), c1 FROM stable1 PARTITION BY c1;
SELECT /*+ PARA_TABLES_SORT() */ * from stable1 order by ts;
SELECT /*+ SMALLDATA_TS_SORT() */ * from stable1 order by ts;

列表

查询语句可以指定部分或全部列作为返回结果。数据列和标签列都可以出现在列表中。

通配符

通配符 * 可以用于代指全部列。对于普通表和子表，结果中只有普通列。对于超级表，还包含了 TAG 列。

SELECT * FROM d1001;

通配符支持表名前缀，以下两个 SQL 语句均为返回全部的列：

SELECT * FROM d1001;
SELECT d1001.* FROM d1001;

在 JOIN 查询中，带表名前缀的*和不带前缀*返回的结果有差别， *返回全部表的所有列数据（不包含标签），而带表名前缀的通配符，则只返回该表的列数据。

SELECT * FROM d1001, d1003 WHERE d1001.ts=d1003.ts;
SELECT d1001.* FROM d1001,d1003 WHERE d1001.ts = d1003.ts;

上面的查询语句中，前者返回 d1001 和 d1003 的全部列，而后者仅返回 d1001 的全部列。

在使用 SQL 函数来进行查询的过程中，部分 SQL 函数支持通配符操作。其中的区别在于： count(*)函数只返回一列。first、last、last_row函数则是返回全部列。

标签列

在超级表和子表的查询中可以指定 标签列，且标签列的值会与普通列的数据一起返回。

SELECT location, groupid, current FROM d1001 LIMIT 2;

别名

别名的命名规则与列相同，支持直接指定 UTF-8 编码格式的中文别名。

结果去重

DISTINCT 关键字可以对结果集中的一列或多列进行去重，去除的列既可以是标签列也可以是数据列。

对标签列去重：

SELECT DISTINCT tag_name [, tag_name ...] FROM stb_name;

对数据列去重：

SELECT DISTINCT col_name [, col_name ...] FROM tb_name;

信息

cfg 文件中的配置参数 maxNumOfDistinctRes 将对 DISTINCT 能够输出的数据行数进行限制。其最小值是 100000，最大值是 100000000，默认值是 10000000。如果实际计算结果超出了这个限制，那么会仅输出这个数量范围内的部分。
由于浮点数天然的精度机制原因，在特定情况下，对 FLOAT 和 DOUBLE 列使用 DISTINCT 并不能保证输出值的完全唯一性。

标签查询

当查询的列只有标签列时，TAGS 关键字可以指定返回所有子表的标签列。每个子表只返回一行标签列。

返回所有子表的标签列：

SELECT TAGS tag_name [, tag_name ...] FROM stb_name

结果集列名

SELECT子句中，如果不指定返回结果集合的列名，结果集列名称默认使用SELECT子句中的表达式名称作为列名称。此外，用户可使用AS来重命名返回结果集合中列的名称。例如：

taos> SELECT ts, ts AS primary_key_ts FROM d1001;

但是针对first(*)、last(*)、last_row(*)不支持针对单列的重命名。

伪列

伪列: 伪列的行为表现与普通数据列相似但其并不实际存储在表中。可以查询伪列，但不能对其做插入、更新和删除的操作。伪列有点像没有参数的函数。下面介绍是可用的伪列：

TBNAME TBNAME 可以视为超级表中一个特殊的标签，代表子表的表名。

获取一个超级表所有的子表名及相关的标签信息：

SELECT TAGS TBNAME, location FROM meters;

建议用户使用 INFORMATION_SCHEMA 下的 INS_TAGS 系统表来查询超级表的子表标签信息，例如获取超级表 meters 所有的子表名和标签值：

SELECT table_name, tag_name, tag_type, tag_value FROM information_schema.ins_tags WHERE stable_name='meters';

统计超级表下辖子表数量：

SELECT COUNT(*) FROM (SELECT DISTINCT TBNAME FROM meters);

以上两个查询均只支持在 WHERE 条件子句中添加针对标签（TAGS）的过滤条件。

_QSTART/_QEND

_qstart 和_qend 表示用户输入的查询时间范围，即 WHERE 子句中主键时间戳条件所限定的时间范围。如果 WHERE 子句中没有有效的主键时间戳条件，则时间范围为[-2^63, 2^63-1]。

_qstart 和_qend 不能用于 WHERE 子句中。

_WSTART/_WEND/_WDURATION _wstart 伪列、_wend 伪列和_wduration 伪列 _wstart 表示窗口起始时间戳，_wend 表示窗口结束时间戳，_wduration 表示窗口持续时长。

这三个伪列只能用于时间窗口的窗口切分查询之中，且要在窗口切分子句之后出现。

_c0/_ROWTS

TDengine TSDB 中，所有表的第一列都必须是时间戳类型，且为其主键，_rowts 伪列和_c0 伪列均代表了此列的值。相比实际的主键时间戳列，使用伪列更加灵活，语义也更加标准。例如，可以和 max\min 等函数一起使用。

select _rowts, max(current) from meters;

_IROWTS

_irowts 伪列只能与 interp 函数一起使用，用于返回 interp 函数插值结果对应的时间戳列。

select _irowts, interp(current) from meters range('2020-01-01 10:00:00', '2020-01-01 10:30:00') every(1s) fill(linear);

_IROWTS_ORIGIN _irowts_origin 伪列只能与 interp 函数一起使用，仅适用于 FILL 类型为 PREV/NEXT/NEAR, 用于返回 interp 函数所使用的原始数据的时间戳列。若范围内无值，则返回 NULL。

select _iorwts_origin, interp(current) from meters range('2020-01-01 10:00:00', '2020-01-01 10:30:00') every(1s) fill(NEXT);

查询对象

FROM 关键字后面可以是若干个表（超级表）列表，也可以是子查询的结果。如果没有指定用户的当前数据库，可以在表名称之前使用数据库的名称来指定表所属的数据库。例如：power.d1001 方式来跨库使用表。

TDengine TSDB 支持基于时间戳主键的 INNER JOIN，规则如下：

支持 FROM 表列表和显式的 JOIN 子句两种语法。
对于普通表和子表，ON 条件必须有且只有时间戳主键的等值条件。
对于超级表，ON 条件在时间戳主键的等值条件之外，还要求有可以一一对应的标签列等值条件，不支持 OR 条件。
参与 JOIN 计算的表只能是同一种类型，即只能都是超级表，或都是子表，或都是普通表。
JOIN 两侧均支持子查询。
不支持与 FILL 子句混合使用。

INTERP

interp 子句是 INTERP 函数的专用语法，当 SQL 语句中存在 interp 子句时，只能查询 INTERP 函数而不能与其他函数一起查询，同时 interp 子句与窗口子句 (window_clause)、分组子句 (group_by_clause) 也不能同时使用。INTERP 函数在使用时需要与 RANGE、EVERY 和 FILL 子句一起使用。

INTERP 的输出时间范围根据 RANGE(timestamp1, timestamp2) 字段来指定，需满足 timestamp1 <= timestamp2。其中 timestamp1 为输出时间范围的起始值，即如果 timestamp1 时刻符合插值条件则 timestamp1 为输出的第一条记录，timestamp2 为输出时间范围的结束值，即输出的最后一条记录的 timestamp 不能大于 timestamp2。
INTERP 根据 EVERY(time_unit) 字段来确定输出时间范围内的结果条数，即从 timestamp1 开始每隔固定长度的时间（time_unit 值）进行插值，time_unit 可取值时间单位：1a(毫秒)、1s(秒)、1m(分)、1h(小时)、1d(天)、1w(周)。例如 EVERY(500a) 将对于指定数据每 500 毫秒间隔进行一次插值。
INTERP 根据 FILL 字段来决定在每个符合输出条件的时刻如何进行插值。关于 FILL 子句如何使用请参考 FILL 子句。注意：插值时所使用的采样数据并非限制于 RANGE 字段的约束，而是满足 WHERE 子句条件的全部数据，如果没有指定 WHERE 子句，则为全表数据；FILL 子句的参数为 PREV/NEXT/NEAR 时，会使用相邻的有效数据进行插值，NULL 数据能否被认定为有效数据，取决于 INTERP 函数的 ignore_null_values 参数。若想限制采样数据的范围，可以使用 SURROUND 子句。
INTERP 可以在 RANGE 字段中只指定唯一的时间戳对单个时间点进行插值，在这种情况下，EVERY 字段可以省略。例如 SELECT INTERP(col) FROM tb RANGE('2023-01-01 00:00:00') FILL(linear)。
INTERP 查询支持 NEAR FILL 模式，即当需要 FILL 时，使用距离当前时间点最近的有效数据进行插值，当前后时间戳与当前时间断面一样近时，FILL 前一行的值。此模式在窗口查询中不支持。例如 SELECT INTERP(col) FROM tb RANGE('2023-01-01 00:00:00', '2023-01-01 00:10:00') FILL(NEAR) (v3.3.4.9 及以后支持)。

FILL 子句

FILL 语句指定某一窗口区间数据缺失的情况下的填充模式。填充模式包括以下几种：

不进行填充：NONE（默认填充模式）。
VALUE 填充：固定值填充，此时需要指定填充的数值。例如 FILL(VALUE, 1.23)。这里需要注意，最终填充的值受由相应列的类型决定，如 FILL(VALUE, 1.23)，相应列为 INT 类型，则填充值为 1，若查询列表中有多列需要 FILL，则需要给每一个 FILL 列指定 VALUE，如 SELECT _wstart, min(c1), max(c1) FROM ... FILL(VALUE, 0, 0)，注意，SELECT 表达式中只有包含普通列时才需要指定 FILL VALUE，如 _wstart、_wstart+1a、now、1+1 以及使用 partition by 时的 partition key (如 tbname) 都不需要指定 VALUE，如 timediff(last(ts), _wstart) 则需要指定 VALUE。
NULL 填充：使用 NULL 填充数据。例如 FILL(NULL)。
PREV 填充：使用前一个有效数据填充。例如 FILL(PREV)。
NEXT 填充：使用下一个有效数据填充。例如 FILL(NEXT)。
NEAR 填充：使用距离当前时间点最近的有效数据填充。例如 FILL(NEAR)。在窗口查询中不支持。
LINEAR 填充：根据前后距离最近的有效数据做线性插值填充。例如 FILL(LINEAR)。

以上所有填充模式中，除了 NONE 模式默认不填充值外，其他模式若在查询的整个时间范围内没有数据，则 FILL 子句不会生效，不会产生填充值，查询结果为空。对于 PREV、NEXT、LINEAR 等模式，这是合理的，因为在这些模式下，没有有效数据就无法进行填充。

“有效数据”的定义在 INTERVAL 子句和 INTERP 子句中有所不同：在 INTERVAL 子句中，扫描出的数据均为有效数据，例如 FILL(PREV) 即使用相邻前一窗口的数据进行填充；在 INTERP 子句中，NULL 值是否有效取决于 INTERP 函数的 ignore_null_values 参数，例如 FILL(PREV) 且 NULL 值无效，则略过所有 NULL，不断向前寻找 non-NULL 数据，若所有数据均为 NULL，则不进行填充。在 INTERP 子句中，PREV、NEXT 和 NEAR 模式下，会在 WHERE 条件范围内持续向前/向后/前后寻找有效数据，若所有数据均为 NULL，则不进行填充。

对另外一些模式（NULL、VALUE）来说，理论上是可以产生填充数值的，至于需不需要输出填充数值，取决于应用的需求。所以为了满足这类需要强制填充数据或 NULL 的应用的需求，同时不破坏现有填充模式的行为兼容性，从 v3.0.3.0 开始，增加了两种新的填充模式：

NULL_F：强制填充 NULL 值
VALUE_F：强制填充 VALUE 值

NULL、NULL_F、VALUE、VALUE_F 这几种填充模式针对不同场景区别如下：

INTERVAL 子句：NULL_F、VALUE_F 为强制填充模式；NULL、VALUE 为非强制模式。在这种模式下下各自的语义与名称相符
流计算中的 INTERVAL 子句：NULL_F 与 NULL 行为相同，均为非强制模式；VALUE_F 与 VALUE 行为相同，均为非强制模式。即流计算中的 INTERVAL 没有强制模式
INTERP 子句：NULL 与 NULL_F 行为相同，均为强制模式；VALUE 与 VALUE_F 行为相同，均为强制模式。即 INTERP 中没有非强制模式。

信息

使用 FILL 语句的时候可能生成大量的填充输出，务必指定查询的时间区间。针对每次查询，系统可返回不超过 1 千万条具有插值的结果。
FILL 具有连续性，例如一列数据中仅第一条不为 NULL，则 FILL(PREV) 会为后续所有行填充该值。

SURROUND 子句

用于限制 FILL 子句的填充范围，只能在 PREV、NEXT、NEAR（仅 INTERP 查询支持）模式下使用。

SURROUNDING_TIME_VAL 参数指定有效数据需要满足的时间范围，取值为正数，单位可选除月（n）、年（y）外的时间单位。在 INTERVAL 窗口查询中，其值必须大于等于 INTERVAL 窗口的时间长度。

在 INTERP 查询中，当有效数据行与当前行的时间差超过该参数值时，不使用该行数据，转而使用 FILL_VALS 进行填充。在 INTERVAL 窗口查询中，当有效数据窗口与当前窗口的时间差（窗口起始时间戳差值）超过该参数值时，不使用该窗口数据，转而使用 FILL_VALS 填充。

FILL_VALS 参数用于指定填充的值，数目和格式均与 FILL 子句的 VALUE 填充模式相同，可以为常量或常量表达式，不支持子查询。

示例

taos> select * from fill_example;
           ts            |   c1        |
========================================
 2026-01-01 00:00:00.000 | 2026        |
 2026-01-01 00:00:01.000 | NULL        |
 2026-01-01 00:00:02.000 | NULL        |
 2026-01-01 00:00:03.000 | NULL        |
 2026-01-01 00:00:04.000 | NULL        |
 2026-01-01 00:00:05.000 | NULL        |
 2026-01-01 00:00:06.000 | 6202        |

taos> select _irowts as ts, interp(c1) from fill_example range('2026-01-01 00:00:01', '2026-01-01 00:00:05') every(1s) fill(near);
           ts            |   c1        |
========================================
 2026-01-01 00:00:01.000 | 2026        |
 2026-01-01 00:00:02.000 | 2026        |
 2026-01-01 00:00:03.000 | 2026        |
 2026-01-01 00:00:04.000 | 6202        |
 2026-01-01 00:00:05.000 | 6202        |

taos> select _irowts as ts, interp(c1) from fill_example range('2026-01-01 00:00:01', '2026-01-01 00:00:05') every(1s) fill(near) surround(2s, 0);
           ts            |   c1        |
========================================
 2026-01-01 00:00:01.000 | 2026        |
 2026-01-01 00:00:02.000 | 2026        |
 2026-01-01 00:00:03.000 | 0           |
 2026-01-01 00:00:04.000 | 6202        |
 2026-01-01 00:00:05.000 | 6202        |

taos> select _wstart, _wend, avg(c1), last(c1) from fill_example where ts between "2026-01-01 00:00:00" and "2026-01-01 00:00:06" interval(1s) fill(prev) surround(5s, 0, 0);
         _wstart         |          _wend          |  avg(c1)   |  last(c1)   |
===============================================================================
 2026-01-01 00:00:00.000 | 2026-01-01 00:00:01.000 |       2026 |        2026 |
 2026-01-01 00:00:01.000 | 2026-01-01 00:00:02.000 |       2026 |        2026 |
 2026-01-01 00:00:02.000 | 2026-01-01 00:00:03.000 |       2026 |        2026 |
 2026-01-01 00:00:03.000 | 2026-01-01 00:00:04.000 |       2026 |        2026 |
 2026-01-01 00:00:04.000 | 2026-01-01 00:00:05.000 |       2026 |        2026 |
 2026-01-01 00:00:05.000 | 2026-01-01 00:00:06.000 |       2026 |        2026 |
 2026-01-01 00:00:06.000 | 2026-01-01 00:00:07.000 |       6202 |        6202 |

taos> select _wstart, _wend, avg(c1), last(c1) from fill_example where ts between "2026-01-01 00:00:00" and "2026-01-01 00:00:06" interval(1s) fill(next) surround(2s, 0, 0);
         _wstart         |          _wend          |  avg(c1)   |  last(c1)   |
===============================================================================
 2026-01-01 00:00:00.000 | 2026-01-01 00:00:01.000 |       2026 |        2026 |
 2026-01-01 00:00:01.000 | 2026-01-01 00:00:02.000 |          0 |           0 |
 2026-01-01 00:00:02.000 | 2026-01-01 00:00:03.000 |          0 |           0 |
 2026-01-01 00:00:03.000 | 2026-01-01 00:00:04.000 |          0 |           0 |
 2026-01-01 00:00:04.000 | 2026-01-01 00:00:05.000 |       6202 |        6202 |
 2026-01-01 00:00:05.000 | 2026-01-01 00:00:06.000 |       6202 |        6202 |
 2026-01-01 00:00:06.000 | 2026-01-01 00:00:07.000 |       6202 |        6202 |

GROUP BY

如果在语句中同时指定了 GROUP BY 子句，那么 SELECT 列表只能包含如下表达式：

常量
聚集函数
与 GROUP BY 后表达式相同的表达式。
包含前面表达式的表达式

GROUP BY 子句对每行数据按 GROUP BY 后的表达式的值进行分组，并为每个组返回一行汇总信息。

GROUP BY 子句中可以通过指定表或视图的列名来按照表或视图中的任何列分组，这些列不需要出现在 SELECT 列表中。

GROUP BY 子句中可以使用位置语法，位置标识为正整数，从 1 开始，表示使用 SELECT 列表的第几个表达式进行分组。

GROUP BY 子句中可以使用结果集列名，表示使用 SELECT 列表的指定表达式进行分组。

GROUP BY 子句中在使用位置语法和结果集列名进行分组时，其对应的 SELECT 列表中的表达式不能是聚集函数。

该子句对行进行分组，但不保证结果集的顺序。若要对分组进行排序，请使用 ORDER BY 子句

PARTITION BY

PARTITION BY 子句是 TDengine TSDB 3.0 版本引入的特色语法，用于根据 part_list 对数据进行切分，在每个切分的分片中可以进行各种计算。

PARTITION BY 与 GROUP BY 基本含义相似，都是按照指定列表进行数据分组然后进行计算，不同点在于 PARTITION BY 没有 GROUP BY 子句的 SELECT 列表的各种限制，组内可以进行任意运算（常量、聚合、标量、表达式等），因此在使用上 PARTITION BY 完全兼容 GROUP BY，所有使用 GROUP BY 子句的地方都可以替换为 PARTITION BY, 需要注意的是在没有聚合查询时两者的查询结果可能存在差异。

因为 PARTITION BY 没有返回一行聚合数据的要求，因此还可以支持在分组切片后的各种窗口运算，所有需要分组进行的窗口运算都只能使用 PARTITION BY 子句。

详见 TDengine TSDB 特色查询

ORDER BY

ORDER BY 子句对结果集排序。如果没有指定 ORDER BY，无法保证同一语句多次查询的结果集返回顺序一致。

ORDER BY 后可以使用位置语法，位置标识为正整数，从 1 开始，表示使用 SELECT 列表的第几个表达式进行排序。

ASC 表示升序，DESC 表示降序。

NULLS 语法用来指定 NULL 值在排序中输出的位置。NULLS LAST 是升序的默认值，NULLS FIRST 是降序的默认值。

LIMIT

LIMIT 控制输出条数，OFFSET 指定从第几条之后开始输出。LIMIT/OFFSET 对结果集的执行顺序在 ORDER BY 之后。LIMIT 5 OFFSET 2 可以简写为 LIMIT 2, 5，都输出第 3 行到第 7 行数据。

在有 PARTITION BY/GROUP BY 子句时，LIMIT 控制的是每个切分的分片中的输出，而不是总的结果集输出。

SLIMIT

SLIMIT 和 PARTITION BY/GROUP BY 子句一起使用，用来控制输出的分片的数量。SLIMIT 5 SOFFSET 2 可以简写为 SLIMIT 2, 5，都表示输出第 3 个到第 7 个分片。

需要注意，如果有 ORDER BY 子句，则输出只有一个分片。

特殊功能

部分特殊的查询功能可以不使用 FROM 子句执行。

获取当前数据库

下面的命令可以获取当前所在的数据库 database()，如果登录的时候没有指定默认数据库，且没有使用USE命令切换数据，则返回 NULL。

SELECT DATABASE();

获取服务器和客户端版本号

SELECT CLIENT_VERSION();
SELECT SERVER_VERSION();

获取服务器状态

服务器状态检测语句。如果服务器正常，返回一个数字（例如 1）。如果服务器异常，返回 error code。该 SQL 语法能兼容连接池对于 TDengine TSDB 状态的检查及第三方工具对于数据库服务器状态的检查。并可以避免出现使用了错误的心跳检测 SQL 语句导致的连接池连接丢失的问题。

SELECT SERVER_STATUS();

获取当前时间

SELECT NOW();

获取当前日期

SELECT TODAY();

获取当前时区

SELECT TIMEZONE();

获取当前用户

SELECT CURRENT_USER();

正则表达式过滤

语法

WHERE (column|tbname) match/MATCH/nmatch/NMATCH _regex_

正则表达式规范

确保使用的正则表达式符合 POSIX 的规范，具体规范内容可参见Regular Expressions

使用限制

只能针对表名（即 tbname 筛选）、binary/nchar 类型值进行正则表达式过滤。

正则匹配字符串长度不能超过 128 字节。可以通过参数 maxRegexStringLen 设置和调整最大允许的正则匹配字符串，该参数是客户端配置参数，需要重启才能生效。

CASE 表达式

语法

CASE value WHEN compare_value THEN result [WHEN compare_value THEN result ...] [ELSE result] END
CASE WHEN condition THEN result [WHEN condition THEN result ...] [ELSE result] END

说明

TDengine TSDB 通过 CASE 表达式让用户可以在 SQL 语句中使用 IF ... THEN ... ELSE 逻辑。

第一种 CASE 语法返回第一个 value 等于 compare_value 的 result，如果没有 compare_value 符合，则返回 ELSE 之后的 result，如果没有 ELSE 部分，则返回 NULL。

第二种语法返回第一个 condition 为真的 result。如果没有 condition 符合，则返回 ELSE 之后的 result，如果没有 ELSE 部分，则返回 NULL。

CASE 表达式的返回类型为第一个 WHEN THEN 部分的 result 类型，其余 WHEN THEN 部分和 ELSE 部分，result 类型都需要可以向其转换，否则 TDengine TSDB 会报错。

示例

某设备有三个状态码，显示其状态，语句如下：

SELECT CASE dev_status WHEN 1 THEN 'Running' WHEN 2 THEN 'Warning' WHEN 3 THEN 'Downtime' ELSE 'Unknown' END FROM dev_table;

统计智能电表的电压平均值，当电压小于 200 或大于 250 时认为是统计有误，修正其值为 220，语句如下：

SELECT AVG(CASE WHEN voltage < 200 or voltage > 250 THEN 220 ELSE voltage END) FROM meters;

JOIN 子句

在 3.3.0.0 版本之前 TDengine TSDB 只支持内连接，自 3.3.0.0 版本起 TDengine TSDB 支持了更为广泛的 JOIN 类型，这其中既包括传统数据库中的 LEFT JOIN、RIGHT JOIN、FULL JOIN、SEMI JOIN、ANTI-SEMI JOIN，也包括时序库中特色的 ASOF JOIN、WINDOW JOIN。JOIN 操作支持在子表、普通表、超级表以及子查询间进行。

示例

普通表与普通表之间的 JOIN 操作：

SELECT *
FROM temp_tb_1 t1, pressure_tb_1 t2
WHERE t1.ts = t2.ts

超级表与超级表之间的 LEFT JOIN 操作：

SELECT *
FROM temp_stable t1 LEFT JOIN temp_stable t2
ON t1.ts = t2.ts AND t1.deviceid = t2.deviceid AND t1.status=0;

子表与超级表之间的 LEFT ASOF JOIN 操作：

SELECT *
FROM temp_ctable t1 LEFT ASOF JOIN temp_stable t2
ON t1.ts = t2.ts AND t1.deviceid = t2.deviceid;

更多 JOIN 操作相关介绍参见页面 TDengine TSDB 关联查询

嵌套查询

“嵌套查询”又称为“子查询”，也即在一条 SQL 语句中，“内层查询”的计算结果可以作为“外层查询”的计算对象来使用。

从 2.2.0.0 版本开始，TDengine TSDB 的查询引擎开始支持在 FROM 子句中使用非关联子查询（“非关联”的意思是，子查询不会用到父查询中的参数）。也即在普通 SELECT 语句的 tb_name_list 位置，用一个独立的 SELECT 语句来代替（这一 SELECT 语句被包含在英文圆括号内），于是完整的嵌套查询 SQL 语句形如：

SELECT ... FROM (SELECT ... FROM ...) ...;

信息

内层查询的返回结果将作为“虚拟表”供外层查询使用，此虚拟表建议起别名，以便于外层查询中方便引用。
外层查询支持直接通过列名或`列名`的形式引用内层查询的列或伪列。
在内层和外层查询中，都支持普通的表间/超级表间 JOIN。内层查询的计算结果也可以再参与数据子表的 JOIN 操作。
内层查询支持的功能特性与非嵌套的查询语句能力是一致的。
- 内层查询的 ORDER BY 子句一般没有意义，建议避免这样的写法以免无谓的资源消耗。
与非嵌套的查询语句相比，外层查询所能支持的功能特性存在如下限制：
- 计算函数部分：
  - 如果内层查询的结果数据未提供时间戳，那么计算过程隐式依赖时间戳的函数在外层会无法正常工作。例如：INTERP、DERIVATIVE、IRATE、LAST_ROW、FIRST、LAST、TWA、STATEDURATION、TAIL、UNIQUE。
  - 如果内层查询的结果数据不是按时间戳有序，那么计算过程依赖数据按时间有序的函数在外层会无法正常工作。例如：LEASTSQUARES、ELAPSED、INTERP、DERIVATIVE、IRATE、TWA、DIFF、STATECOUNT、STATEDURATION、CSUM、MAVG、TAIL、UNIQUE。
  - 计算过程需要两遍扫描的函数，在外层查询中无法正常工作。例如：此类函数包括：PERCENTILE。

非相关标量子查询

非相关标量子查询是 SQL 中一种独立可执行的子查询类型，其核心特征为仅返回单个值（一行一列），且执行过程完全不依赖外层查询的任何字段，任何符合这一特征的查询语句都可以作为非相关标量子查询，也可以在查询语句的任意子句、函数、表达式中使用非相关标量子查询，只要语法定义为表达式的部分均可以使用非相关标量子查询，非相关标量子查询也可以嵌套使用。非相关标量子查询可以先独立计算出结果，再将该结果代入外层查询作为筛选条件或参考值，常用于基于聚合值（如平均值、最大值）的过滤或多表查询结果结合的场景，执行效率高于相关子查询。

从 3.4.0.0 版本开始，TDengine TSDB 开始在查询语句中支持非相关标量子查询，其他语句（流计算、订阅、DDL、DML 等）暂不支持。

以出现在 SELECT、WHERE 子句中的非相关标量子查询示例如下：

SELECT col1, (SELECT sum(col1) FROM tb1) FROM tb2;
SELECT col1 FROM tb2 WHERE col1 >= (SELECT avg(col1) FROM tb1);

子查询表达式

从 3.4.1.0 版本开始，TDengine TSDB 开始支持下列子查询表达式，其中的子查询仅限非相关子查询，目前只支持在查询语句中使用，流计算、订阅、DDL（数据定义语言）、DML（数据操纵语言）语句中暂不支持。

IN 子查询

IN 运算符与子查询组合使用，子查询结果作为 IN 运算符的匹配列表，实现灵活的多值查询逻辑，满足复杂数据筛选场景需求。其中的子查询只能输出单列数据，可支持任意满足输出要求的查询语句（含嵌套查询）。

-- WHERE 子句基础用法
select col1 from tb2 where col1 in (select col1 from tb1 where f2 > 10);

-- JOIN 关联条件中使用
select a.ts from tb1 a 
join tb2 b on a.ts = b.ts and a.f1 in (select col1 from tb1 union select col1 from tb2);

-- CASE 表达式中使用
select case when f1 in (select f2 from tb1) then 0 else 1 end from tb1;

NOT IN 子查询

NOT IN 运算符与子查询的组合使用，判断表达式的值是否与子查询返回的所有结果都不相等，实现反向多值筛选逻辑，满足复杂数据过滤场景需求。其中的子查询只能输出单列数据，可支持任意满足输出要求的查询语句（含嵌套查询）。

-- WHERE 子句基础用法
select col1 from tb2 where col1 not in (select col1 from tb1 where f2 < 100);

-- HAVING 子句中使用
select avg(f1) from tb1 
group by f1 having f1 not in (select f1 from tb2 interval(10s));

-- JOIN 关联条件中使用
select a.ts, b.val from tb1 a
join tb2 b on a.ts = b.ts and a.f2 not in (select col2 from tb3 where ts > '2026-01-01');

ALL 子查询

ALL 运算符与子查询的组合使用，ALL 需与比较运算符（=, >, <, >=, <=, <>）结合，判断表达式是否满足子查询返回的所有结果。其中的子查询只能输出单列数据，可支持任意满足输出要求的查询语句（含嵌套查询）。

-- 大于子查询所有结果
select col1, col2 from tb1 where col1 > ALL (select f1 from tb2 where f2 > 10);

-- 不等于子查询所有结果
select col1 from tb1 where col1 <> ALL (select avg(f1) from tb2 group by f2);

-- HAVING 子句中使用
select sum(f1) from tb1 
group by f1 having max(f2) <= ALL (select col3 from tb3 interval(1s));

ANY 子查询

ANY 运算符与子查询的组合使用，ANY 需与比较运算符（=, >, <, >=, <=, <>）结合，判断表达式是否满足子查询返回的任意一个结果，实现多值条件匹配。其中的子查询只能输出单列数据，可支持任意满足输出要求的查询语句（含嵌套查询）。

-- 小于子查询任意一个结果
select a.ts, b.val from tb1 a 
join tb2 b on a.ts = b.ts and a.f1 < ANY (select col1 from tb3 union select col1 from tb4);

-- INSERT INTO SELECT 中使用
insert into tb6 (ts, val) 
select ts, f1 from tb1 where f1 = ANY (select col1 from tb7 where ts > '2026-01-01 00:00:00');

-- CASE 表达式中使用
select case when f2 >= ANY (select f3 from tb8) then 'high' else 'low' end from tb1;

SOME 子查询

SOME 运算符与子查询的组合使用，SOME 与 ANY 功能完全等价，需与比较运算符（=, >, <, >=, <=, <>）结合，判断表达式是否满足子查询返回的任意一个结果。其中的子查询只能输出单列数据，可支持任意满足输出要求的查询语句（含嵌套查询）。

-- HAVING 子句中使用
select avg(f1) from tb1 
group by f1 having sum(f2) >= SOME (select f3 from tb2 interval(1s));

-- SELECT 列表中使用
select col1, f2 > SOME (select f1 from tb3) as flag from tb1;

-- WHERE 子句基础用法
select col1 from tb1 where f3 = SOME (select col2 from tb4 where f4 < 50);

EXISTS 子查询

EXISTS 运算符与子查询的组合使用，EXISTS 仅判断子查询是否返回至少一行数据，不关注返回数据具体内容。其中的子查询无列数限制，可支持任意满足逻辑要求的查询语句（含嵌套查询）。

-- CASE 表达式中使用
select case when exists (select 1 from tb2 where tb2.col1 = 1) 
           then 'exist' else 'not exist' end as status from tb1;

-- UNION 中组合使用
select col1 from tb1 where exists (select 1 from tb4) 
union 
select col2 from tb2 where exists (select 1 from tb5 where f2 > 0);

-- WHERE 子句基础用法
select col1 from tb1 where exists (select * from tb3 where f3 = 1);

NOT EXISTS 子查询

NOT EXISTS 运算符与子查询的组合使用，NOT EXISTS 与 EXISTS 逻辑相反，判断子查询是否无数据返回。其中的子查询无列数限制，可支持任意满足逻辑要求的查询语句（含嵌套查询）。

-- SELECT 列表中使用
select col1, not exists (select f1 from tb3 where f1 = 1) as flag from tb1;

-- WHERE 子句中使用
select col1 from tb1 
where not exists (select 1 from tb2 where f2 between 10 and 20);

-- JOIN 关联条件中使用
select a.ts from tb1 a
left join tb2 b on a.ts = b.ts 
where not exists (select 1 from tb3 where tb3.col1 = 1);

UNION 子句

SELECT ...
UNION [ALL] SELECT ...
[UNION [ALL] SELECT ...]

TDengine 支持 UNION [ALL] 操作符，用于合并多个 SELECT 子句的查询结果。使用该操作符时，多个 SELECT 子句需满足以下两个条件：

各 SELECT 子句返回结果的列数必须一致；
对应位置的列需保持相同的顺序，且数据类型必须相同或兼容。

合并后，结果集的列名由第一个 SELECT 子句所定义的列名决定。

SQL 示例

对于下面的例子，表 tb1 用以下语句创建：

CREATE TABLE tb1 (ts TIMESTAMP, col1 INT, col2 FLOAT, col3 BINARY(50));

查询 tb1 刚过去的一个小时的所有记录：

SELECT * FROM tb1 WHERE ts >= NOW - 1h;

查询表 tb1 从 2018-06-01 08:00:00.000 到 2018-06-02 08:00:00.000 时间范围，并且 col3 的字符串是'nny'结尾的记录，结果按照时间戳降序：

SELECT * FROM tb1 WHERE ts > '2018-06-01 08:00:00.000' AND ts <= '2018-06-02 08:00:00.000' AND col3 LIKE '%nny' ORDER BY ts DESC;

查询 col1 与 col2 的和，并取名 complex，时间大于 2018-06-01 08:00:00.000，col2 大于 1.2，结果输出仅仅 10 条记录，从第 5 条开始：

SELECT (col1 + col2) AS 'complex' FROM tb1 WHERE ts > '2018-06-01 08:00:00.000' AND col2 > 1.2 LIMIT 10 OFFSET 5;

查询过去 10 分钟的记录，col2 的值大于 3.14，并且将结果输出到文件 /home/testoutput.csv：

SELECT COUNT(*) FROM tb1 WHERE ts >= NOW - 10m AND col2 > 3.14 >> /home/testoutput.csv;

查询语法​

部分字段语法说明​

Hints​

列表​

通配符​

标签列​

别名​

结果去重​

标签查询​

结果集列名​

伪列​

查询对象​

INTERP​

FILL 子句​

SURROUND 子句​

示例​

GROUP BY​

PARTITION BY​

ORDER BY​

LIMIT​

SLIMIT​

特殊功能​

获取当前数据库​

获取服务器和客户端版本号​

获取服务器状态​

获取当前时间​

获取当前日期​

获取当前时区​

获取当前用户​

正则表达式过滤​

语法​

正则表达式规范​

使用限制​

CASE 表达式​

语法​

说明​

示例​

JOIN 子句​

示例​

嵌套查询​

非相关标量子查询​

子查询表达式​

IN 子查询​

NOT IN 子查询​

ALL 子查询​

ANY 子查询​

SOME 子查询​

EXISTS 子查询​

NOT EXISTS 子查询​

UNION 子句​

SQL 示例​

支持和反馈