跳到主要内容
版本:0.10

数据类型

SQL 数据类型定义了列可以存储的数据类型。当您运行 DESC TABLE 命令时,你可以看到每列的数据类型。

字符串和二进制数据类型

类型名称描述大小
StringUTF-8 编码的字符串。最多可容纳 2,147,483,647 字节的数据字符串的长度
Binary变长二进制值。最多可容纳 2,147,483,647 字节的数据数据的长度 + 2 字节

StringBinary 的最大容量取决于它们的编码方式以及存储引擎如何处理它们。例如,String 值被编码为 UTF-8,如果所有字符的长度为 3 个字节,该字段最多可以存储 715,827,882 个字符。对于 Binary 类型,它们最多可以存储 2,147,483,647 字节。

数值数据类型

类型名称描述大小
Int8-128 ~ 1271 字节
Int16-32768 ~ 327672 字节
Int32-2147483648 ~ 21474836474 字节
Int64-9223372036854775808 ~ 92233720368547758078 字节
UInt80 ~ 2551 字节
UInt160 ~ 655352 字节
UInt320 ~ 42949672954 字节
UInt640 ~ 184467440737095516158 字节
Float3232 位 IEEE 754 浮点数4 字节
Float64双精度 IEEE 754 浮点数8 字节

Decimal 类型

GreptimeDB 支持 decimal 类型,这是一种定点类型,表示为 decimal(precision, scale),其中 precision 是总位数,scale 是小数部分的位数。例如,123.45 的总位数为 5,小数位数为 2。

  • precision 可以在 [1, 38] 范围内。
  • scale 可以在 [0, precision] 范围内。

如果未指定总位数和比例,则默认的十进制数是 decimal(38, 10)

CREATE TABLE decimals(
d DECIMAL(3, 2),
ts TIMESTAMP TIME INDEX,
);

INSERT INTO decimals VALUES ('0.1',1000), ('0.2',2000);

SELECT * FROM decimals;
+------+---------------------+
| d | ts |
+------+---------------------+
| 0.10 | 1970-01-01T00:00:01 |
| 0.20 | 1970-01-01T00:00:02 |
+------+---------------------+

日期和时间类型

类型名称描述大小
TimestampSecond64 位时间戳值,精度为秒,范围:[-262144-01-01 00:00:00, +262143-12-31 23:59:59]8 字节
TimestampMillisecond64 位时间戳值,毫秒精度,范围:[-262144-01-01 00:00:00.000, +262143-12-31 23:59:59.999]8 字节
TimestampMicroSecond64 位时间戳值,微秒精度,范围:[-262144-01-01 00:00:00.000000, +262143-12-31 23:59:59.999999]8 字节
TimestampNanosecond64 位时间戳值,纳秒精度,范围: [1677-09-21 00:12:43.145225, 2262-04-11 23:47:16.854775807]8 字节
Interval时间间隔对于 YearMonth, 使用4字节,对于 DayTime, 使用8字节,对于 MonthDayNano, 使用16字节
注意

使用 MySQL/PostgreSQL 协议写入时间戳字符串字面量时,值的范围限制为 '0001-01-01 00:00:00' 到 '9999-12-31 23:59:59'。

Interval 类型详解

Interval 类型用于需要跟踪和操作时间间隔的场景。它的编写语法如下:

QUANTITY UNIT [QUANTITY UNIT...]
  • QUANTITY:是一个数字(可能有符号),
  • UNIT:时间单位,可以是 microsecond(微秒)、millisecond(毫秒)、second(秒)、minute(分钟)、hour(小时)、day(天)、week(周)、month(月)、year(年)、decade(十年)、century(世纪)或这些单位的缩写或复数形式;

不同的时间单位将会被计算合并,每个单位的符号决定它是增加还是减少总间隔。例如,“1 年 -2 个月”导致净间隔为 10 个月。 遗憾的是,GreptimeDB 暂时还不支持以 ISO 8601 时间间隔格式编写间隔,例如 P3Y3M700DT133H17M36.789S 等。但它支持以这种格式输出。

让我们来看一些例子:

SELECT '2 years 15 months 100 weeks 99 hours 123456789 milliseconds'::INTERVAL;
+---------------------------------------------------------------------+
| Utf8("2 years 15 months 100 weeks 99 hours 123456789 milliseconds") |
+---------------------------------------------------------------------+
| P3Y3M700DT133H17M36.789S |
+---------------------------------------------------------------------+

55 分钟前:

SELECT '-1 hour 5 minute'::INTERVAL;
+--------------------------+
| Utf8("-1 hour 5 minute") |
+--------------------------+
| P0Y0M0DT0H-55M0S |
+--------------------------+

1 小时 5 分钟前:

SELECT '-1 hour -5 minute'::INTERVAL;
+---------------------------+
| Utf8("-1 hour -5 minute") |
+---------------------------+
| P0Y0M0DT-1H-5M0S |
+---------------------------+

当然,你可以通过算术运算来操作时间间隔。 获取 5 分钟前的时间:

SELECT now() - INTERVAL '5 minute';
+----------------------------------------------+
| now() - IntervalMonthDayNano("300000000000") |
+----------------------------------------------+
| 2024-06-24 21:24:05.012306 |
+----------------------------------------------+

注意到你也可以用 INTERVAL 'literal' 的方式来输入 interval 类型。'-1 hour -5 minute'::INTERVAL 这样的方式其实是一个CAST 函数调用。

GreptimeDB 还支持类似 3y2mon4h 这样不包含空格的简写形式:

SELECT INTERVAL '3y2mon4h';
SELECT '3y2mon4h'::INTERVAL;
+---------------------------------------------------------+
| IntervalMonthDayNano("3010670175542044842954670112768") |
+---------------------------------------------------------+
| P3Y2M0DT4H0M0S |
+---------------------------------------------------------+
+---------------------------------------------------------+
| IntervalMonthDayNano("3010670175542044842954670112768") |
+---------------------------------------------------------+
| P3Y2M0DT4H0M0S |
+---------------------------------------------------------+

同样也支持符号数:

SELECT INTERVAL '-1h5m';
SELECT '-1h5m'::INTERVAL;
+----------------------------------------------+
| IntervalMonthDayNano("18446740773709551616") |
+----------------------------------------------+
| P0Y0M0DT0H-55M0S |
+----------------------------------------------+
+----------------------------------------------+
| IntervalMonthDayNano("18446740773709551616") |
+----------------------------------------------+
| P0Y0M0DT0H-55M0S |
+----------------------------------------------+

支持的缩写包括:

缩写全称
yyears
monmonths
wweeks
ddays
hhours
mminutes
sseconds
millismilliseconds
msmilliseconds
usmicroseconds
nsnanoseconds

JSON 类型

GreptimeDB 支持 JSON 类型,允许用户存储和查询 JSON 格式的数据。JSON 类型非常灵活,可以存储各种形式的结构化或非结构化数据,适合日志记录、分析和半结构化数据存储等场景。

CREATE TABLE json_data(
my_json JSON,
ts TIMESTAMP TIME INDEX
);

INSERT INTO json_data VALUES ('{"key1": "value1", "key2": 10}', 1000),
('{"name": "GreptimeDB", "open_source": true}', 2000);

SELECT * FROM json_data;

输出:

+------------------------------------------+---------------------+
| my_json | ts |
+------------------------------------------+---------------------+
| {"key1":"value1","key2":10} | 1970-01-01 00:00:01 |
| {"name":"GreptimeDB","open_source":true} | 1970-01-01 00:00:02 |
+------------------------------------------+---------------------+

查询 JSON 数据

您可以直接查询 JSON 数据,也可以使用 GreptimeDB 提供的 JSON 函数 提取特定字段。以下是一个示例:

SELECT json_get_string(my_json, '$.name') as name FROM json_data;

输出:

+---------------------------------------------------+
| name |
+---------------------------------------------------+
| NULL |
| GreptimeDB |
+---------------------------------------------------+

布尔类型

类型名称描述大小
Boolean布尔值1 字节

在 SQL 语句中使用 TRUEFALSE 表示布尔值。例如:

CREATE TABLE bools(
b BOOLEAN,
ts TIMESTAMP DEFAULT CURRENT_TIMESTAMP() TIME INDEX,
);
INSERT INTO bools(b) VALUES (TRUE), (FALSE);

与 MySQL 和 PostgreSQL 兼容的数据类型

类型别名

对于从 MySQL 或 PostgreSQL 迁移到 GreptimeDB 的用户,GreptimeDB 支持以下类型别名。

数据类型别名
StringText, TinyText, MediumText, LongText, Varchar, Char
BinaryVarbinary
Int8TinyInt
Int16SmallInt
Int32Int
Int64BigInt
UInt8UnsignedTinyInt
UInt16UnsignedSmallInt
UInt32UnsignedInt
UInt64UnsignedBigInt
Float32Float
Float64Double
TimestampSecondTimestamp_s, Timestamp_sec, Timestamp(0)
TimestampMillisecondTimestamp, Timestamp_ms , Timestamp(3)
TimestampMicroSecondTimestamp_us, Timestamp(6)
TimestampNanosecondTimestamp_ns, Timestamp(9)

在创建表时也可以使用这些别名类型。 例如,使用 Varchar 代替 String,使用 Double 代替 Float64,使用 Timestamp(0) 代替 TimestampSecond

CREATE TABLE alias_types (
s TEXT,
i Double,
ts0 Timestamp(0) DEFAULT CURRENT_TIMESTAMP() TIME INDEX,
PRIMARY KEY(s)
);

日期和时间类型

除了在 GreptimeDB 中用作默认时间类型的 Timestamp 类型之外 GreptimeDB 还支持与 MySQL 和 PostgreSQL 兼容的 DateDateTime 类型。

类型名称描述大小
Date32 位日期值,表示自 UNIX Epoch 以来的天数4 字节
DateTime64 位日期时间值,表示自 UNIX Epoch 以来的毫秒数8 字节

示例

创建表

CREATE TABLE data_types (
s STRING,
vbi BINARY,
b BOOLEAN,
tint INT8,
sint INT16,
i INT32,
bint INT64,
utint UINT8,
usint UINT16,
ui UINT32,
ubint UINT64,
f FLOAT32,
d FLOAT64,
dm DECIMAL(3, 2),
dt DATE,
dtt DATETIME,
ts0 TIMESTAMPSECOND,
ts3 TIMESTAMPMILLISECOND,
ts6 TIMESTAMPMICROSECOND,
ts9 TIMESTAMPNANOSECOND DEFAULT CURRENT_TIMESTAMP() TIME INDEX,
PRIMARY KEY(s));

描述表结构

DESC TABLE data_types;
+--------+----------------------+------+------+---------------------+---------------+
| Column | Type | Key | Null | Default | Semantic Type |
+--------+----------------------+------+------+---------------------+---------------+
| s | String | PRI | YES | | TAG |
| vbi | Binary | | YES | | FIELD |
| b | Boolean | | YES | | FIELD |
| tint | Int8 | | YES | | FIELD |
| sint | Int16 | | YES | | FIELD |
| i | Int32 | | YES | | FIELD |
| bint | Int64 | | YES | | FIELD |
| utint | UInt8 | | YES | | FIELD |
| usint | UInt16 | | YES | | FIELD |
| ui | UInt32 | | YES | | FIELD |
| ubint | UInt64 | | YES | | FIELD |
| f | Float32 | | YES | | FIELD |
| d | Float64 | | YES | | FIELD |
| dm | Decimal(3, 2) | | YES | | FIELD |
| dt | Date | | YES | | FIELD |
| dtt | DateTime | | YES | | FIELD |
| ts0 | TimestampSecond | | YES | | FIELD |
| ts3 | TimestampMillisecond | | YES | | FIELD |
| ts6 | TimestampMicrosecond | | YES | | FIELD |
| ts9 | TimestampNanosecond | PRI | NO | current_timestamp() | TIMESTAMP |
+--------+----------------------+------+------+---------------------+---------------+