Skip to main content

数据类型

时间戳

使用 TDengine,最重要的是时间戳。创建并插入记录、查询历史记录的时候,均需要指定时间戳。时间戳有如下规则:

  • 时间格式为 YYYY-MM-DD HH:mm:ss.MS,默认时间分辨率为毫秒。比如:2017-08-12 18:25:58.128
  • 内部函数 NOW 是客户端的当前时间
  • 插入记录时,如果时间戳为 NOW,插入数据时使用提交这条记录的客户端的当前时间
  • Epoch Time:时间戳也可以是一个长整数,表示从 UTC 时间 1970-01-01 00:00:00 开始的毫秒数。相应地,如果所在 Database 的时间精度设置为“微秒”,则长整型格式的时间戳含义也就对应于从 UTC 时间 1970-01-01 00:00:00 开始的微秒数;纳秒精度逻辑相同。
  • 时间可以加减,比如 NOW-2h,表明查询时刻向前推 2 个小时(最近 2 小时)。数字后面的时间单位可以是 b(纳秒)、u(微秒)、a(毫秒)、s(秒)、m(分)、h(小时)、d(天)、w(周)。 比如 SELECT * FROM t1 WHERE ts > NOW-2w AND ts <= NOW-1w,表示查询两周前整整一周的数据。在指定降采样操作(Down Sampling)的时间窗口(Interval)时,时间单位还可以使用 n(自然月)和 y(自然年)。

TDengine 缺省的时间戳精度是毫秒,但通过在 CREATE DATABASE 时传递的 PRECISION 参数也可以支持微秒和纳秒。

CREATE DATABASE db_name PRECISION 'ns';

数据类型

在 TDengine 中,普通表的数据模型中可使用以下数据类型。

#类型Bytes说明
1TIMESTAMP8时间戳。缺省精度毫秒,可支持微秒和纳秒,详细说明见上节。
2INT4整型,范围 [-2^31, 2^31-1]
3INT UNSIGNED4无符号整数,[0, 2^32-1]
4BIGINT8长整型,范围 [-2^63, 2^63-1]
5BIGINT UNSIGNED8长整型,范围 [0, 2^64-1]
6FLOAT4浮点型,有效位数 6-7,范围 [-3.4E38, 3.4E38]
7DOUBLE8双精度浮点型,有效位数 15-16,范围 [-1.7E308, 1.7E308]
8BINARY自定义记录单字节字符串,建议只用于处理 ASCII 可见字符,中文等多字节字符需使用 NCHAR
9SMALLINT2短整型, 范围 [-32768, 32767]
10SMALLINT UNSIGNED2无符号短整型,范围 [0, 65535]
11TINYINT1单字节整型,范围 [-128, 127]
12TINYINT UNSIGNED1无符号单字节整型,范围 [0, 255]
13BOOL1布尔型,
14NCHAR自定义记录包含多字节字符在内的字符串,如中文字符。每个 NCHAR 字符占用 4 字节的存储空间。字符串两端使用单引号引用,字符串内的单引号需用转义字符 \'。NCHAR 使用时须指定字符串大小,类型为 NCHAR(10) 的列表示此列的字符串最多存储 10 个 NCHAR 字符。如果用户字符串长度超出声明长度,将会报错。
15JSONJSON 数据类型, 只有 Tag 可以是 JSON 格式
16VARCHAR自定义BINARY 类型的别名
17GEOMETRY自定义几何类型
18VARBINARY自定义可变长的二进制数据
note
  • 表的每行长度不能超过 48KB(从 3.0.5.0 版本开始为 64KB)(注意:每个 BINARY/NCHAR/GEOMETRY/VARBINARY 类型的列还会额外占用 2 个字节的存储位置)。

  • 虽然 BINARY 类型在底层存储上支持字节型的二进制字符,但不同编程语言对二进制数据的处理方式并不保证一致,因此建议在 BINARY 类型中只存储 ASCII 可见字符,而避免存储不可见字符。多字节的数据,例如中文字符,则需要使用 NCHAR 类型进行保存。如果强行使用 BINARY 类型保存中文字符,虽然有时也能正常读写,但并不带有字符集信息,很容易出现数据乱码甚至数据损坏等情况。

  • BINARY 类型理论上最长可以有 16,374(从 3.0.5.0 版本开始,数据列为 65,517,标签列为 16,382) 字节。BINARY 仅支持字符串输入,字符串两端需使用单引号引用。使用时须指定大小,如 BINARY(20) 定义了最长为 20 个单字节字符的字符串,每个字符占 1 字节的存储空间,总共固定占用 20 字节的空间,此时如果用户字符串超出 20 字节将会报错。对于字符串内的单引号,可以用转义字符反斜线加单引号来表示,即 \'

  • GEOMETRY 类型数据列为最大长度为 65,517 字节,标签列最大长度为 16,382 字节。支持 2D 的 POINT、LINESTRING 和 POLYGON 子类型数据。长度计算方式如下表所示:

    #语法最小长度最大长度每组坐标长度增长
    1POINT(1.0 1.0)2121
    2LINESTRING(1.0 1.0, 2.0 2.0)9+2*169+4094*16+16
    3POLYGON((1.0 1.0, 2.0 2.0, 1.0 1.0))13+3*1613+4094*16+16
  • SQL 语句中的数值类型将依据是否存在小数点,或使用科学计数法表示,来判断数值类型是否为整型或者浮点型,因此在使用时要注意相应类型越界的情况。例如,9999999999999999999 会认为超过长整型的上边界而溢出,而 9999999999999999999.0 会被认为是有效的浮点数。

  • VARBINARY 是一种存储二进制数据的数据类型,最大长度为 65,517 字节,标签列最大长度为 16,382 字节。可以通过sql或schemaless方式写入二进制数据(需要转换为\x开头的字符串写入),也可以通过stmt方式写入(可以直接使用二进制)。显示时通过16进制\x开头。

常量

TDengine 支持多个类型的常量,细节如下表:

#语法类型说明
1[{+ | -}]123BIGINT整型数值的字面量的类型均为 BIGINT。如果用户输入超过了 BIGINT 的表示范围,TDengine 按 BIGINT 对数值进行截断。
2123.45DOUBLE浮点数值的字面量的类型均为 DOUBLE。TDengine 依据是否存在小数点,或使用科学计数法表示,来判断数值类型是否为整型或者浮点型。
31.2E3DOUBLE科学计数法的字面量的类型为 DOUBLE。
4'abc'BINARY单引号括住的内容为字符串字面值,其类型为 BINARY,BINARY 的 Size 为实际的字符个数。对于字符串内的单引号,可以用转义字符反斜线加单引号来表示,即 \'
5"abc"BINARY双引号括住的内容为字符串字面值,其类型为 BINARY,BINARY 的 Size 为实际的字符个数。对于字符串内的双引号,可以用转义字符反斜线加单引号来表示,即 \"
6TIMESTAMP {'literal' | "literal"}TIMESTAMPTIMESTAMP 关键字表示后面的字符串字面量需要被解释为 TIMESTAMP 类型。字符串需要满足 YYYY-MM-DD HH:mm:ss.MS 格式,其时间分辨率为当前数据库的时间分辨率。
7{TRUE | FALSE}BOOL布尔类型字面量。
8{'' | "" | '\t' | "\t" | ' ' | " " | NULL }--空值字面量。可以用于任意类型。
note
  • TDengine 依据是否存在小数点,或使用科学计数法表示,来判断数值类型是否为整型或者浮点型,因此在使用时要注意相应类型越界的情况。例如,9999999999999999999 会认为超过长整型的上边界而溢出,而 9999999999999999999.0 会被认为是有效的浮点数。