跳到主要内容
版本:Nightly

SSTS_STORAGE

SSTS_STORAGE 表提供直接从存储层列出的 SST(排序字符串表)文件信息。此表显示来自对象存储的原始文件元数据,可能包括尚未反映在清单中的文件或已孤立的文件。

注意

此表在 GreptimeCloud 上不可用。

USE INFORMATION_SCHEMA;
DESC SSTS_STORAGE;

输出如下:

+------------------+----------------------+-----+------+---------+---------------+
| Column | Type | Key | Null | Default | Semantic Type |
+------------------+----------------------+-----+------+---------+---------------+
| file_path | String | | NO | | FIELD |
| file_size | UInt64 | | YES | | FIELD |
| last_modified_ms | TimestampMillisecond | | YES | | FIELD |
| node_id | UInt64 | | YES | | FIELD |
+------------------+----------------------+-----+------+---------+---------------+

SSTS_STORAGE 表中的字段描述如下:

  • file_path:对象存储中文件的完整路径。
  • file_size:文件的大小(字节,如果存储中可用)。
  • last_modified_ms:最后修改时间(毫秒,如果存储中可用)。
  • node_id:文件所在的数据节点 ID。

使用场景

SSTS_STORAGE 表适用于:

  • 存储验证:将存储中的文件与清单进行比较,以检测孤立文件或不一致性。
  • 存储调试:识别存在于存储中但可能未在清单中正确跟踪的文件。
  • 清理操作:查找并删除不再被引用的孤立 SST 文件。
  • 存储审计:获取存储层中所有 SST 文件的完整视图。

示例

查询存储中的所有 SST 文件:

SELECT * FROM INFORMATION_SCHEMA.SSTS_STORAGE;

查找存储中但不在清单中的文件(潜在的孤立文件):

SELECT s.file_path, s.file_size, s.last_modified_ms
FROM INFORMATION_SCHEMA.SSTS_STORAGE s
LEFT JOIN INFORMATION_SCHEMA.SSTS_MANIFEST m ON s.file_path = m.file_path
WHERE m.file_path IS NULL;

查找存储中最大的 SST 文件:

SELECT file_path, file_size
FROM INFORMATION_SCHEMA.SSTS_STORAGE
WHERE file_size IS NOT NULL
ORDER BY file_size DESC
LIMIT 10;

计算 SST 文件的总存储使用量:

SELECT COUNT(*) as file_count, SUM(file_size) as total_size
FROM INFORMATION_SCHEMA.SSTS_STORAGE
WHERE file_size IS NOT NULL;

输出样例:

mysql> SELECT * FROM INFORMATION_SCHEMA.SSTS_STORAGE LIMIT 1\G;
*************************** 1. row ***************************
file_path: data/greptime/public/1024/4398046511104_0/01234567-89ab-cdef-0123-456789abcdef.parquet
file_size: 1234
last_modified_ms: 2025-01-01 00:00:00.000
node_id: 0
1 row in set (0.02 sec)

与 SSTS_MANIFEST 的区别

方面SSTS_MANIFESTSSTS_STORAGE
数据源清单元数据直接从存储层
信息详细的 SST 元数据(行数、时间范围等)仅基本文件元数据
文件覆盖仅清单中跟踪的文件存储中的所有文件
使用场景查询 SST 元数据进行分析验证存储、查找孤立文件
性能快速(从清单读取)较慢(扫描存储)