Glossary(术语表)
欢迎访问 GreptimeDB 技术术语库!本资源系统阐释了云原生开源时序数据库 GreptimeDB 的核心概念与关键技术术语,涵盖指标、日志及事件处理领域。通过本术语库,您将深入理解支撑 GreptimeDB 的创新架构与技术实现。
注:该排名顺序按照英文词汇首字母正序排列。
A
Anomaly Detection (异常检测)
识别数据点、事件或观测值显著偏离常态的过程。在时序数据场景中,异常检测可辅助发现可能表征关键事件的非常规模式。
Append Only Table (Append Only 表)
GreptimeDB 中针对写入密集型工作负载优化的表类型,数据仅插入而不更新或删除。这种设计显著提升写入和查询性能,特别适用于日志分析和时序数据场景。
C
Cardinality (基数)
衡量数据库元素唯一性的指标,如数据列中唯一值的数量。高基数场景(尤其在时序数据中)将显著提升存储复杂度与资源需求。
Cloud-Native Design (云原生架构)
基于云计算框架构建弹性可扩展应用的架构方法论。GreptimeDB 的云原生设计支持从边缘计算节点到云端分布式集群的无缝扩展。
Columnar Storage (列式存储)
按列而非行组织数据表的存储格式。该格式显著提升分析型查询效率,是 GreptimeDB 实现高性价比的重要技术基础。
D
Decoupled Compute and Storage Architecture (存算分离架构)
将计算资源与存储资源解耦管理的架构设计。该架构支持独立扩展与资源优化,实现工作负载管理的灵活性与高性能。
E
Edge Database (边缘数据库)
部署在网络边缘侧(临近数据源或终端用户)的数据库系统,通过降低数据传输延迟实现实时数据处理。
Edge Deployment (边缘部署)
在临近数据源或终端用户的边缘节点部署服务的实践方案。GreptimeDB 支持边缘部署模式,可在资源受限环境下实现实时数据处理。
Event Management (事件管理)
对指标、日志、追踪等事件数据进行采集、组织与分析的系统化实践,是保障实时系统稳定运行的核心环节。
D
Datanode (数据节点)
GreptimeDB 分布式架构中负责数据存储和处理的核心组件。Datanode 处理数据摄入、存储管理、本地数据查询执行,并维护包含实际表数据的 region。可在集群中部署多个 datanode 以提供水平可扩展性、容错能力和分布式数据处理能力。
F
Field (字段)
GreptimeDB 数据模型中包含实际测量数据或日志内容的列类型。Field 存储数值、文本内容或其他数据指标,代表时序数据中的核心信息,与 Tag 和 Time Index 列相补构成完整的数据模型。
Flow Engine (流处理引擎)
GreptimeDB 的实时流数据处理系统,支持对流式数据进行连续增量计算。Flow Engine 类似智能物化视图,当源表有新数据到达时自动更新结果表。以可配置间隔(默认一秒)处理数据,计算开销极小,特别适用于 ETL 流程、降采样、实时分析和持续聚合等场景。
Frontend (前端节点)
GreptimeDB 分布式架构中的查询处理层,作为客户端连接的入口点。Frontend 节点处理 SQL 解析、查询规划、分布式查询协调和结果聚合。它们将查询路由到适当的 datanode,管理客户端会话,并为各种数据库接口(包括 MySQL、PostgreSQL 和 GreptimeDB 原生协议)提供协议兼容性。
G
GreptimeCloud
GreptimeDB 的全托管云服务,提供 serverless 自 动扩展的数据库即服务(DBaaS)能力。GreptimeCloud 通过自动扩展、按量付费、企业级安全和无缝云边协同部署等特性消除运维开销,非常适合寻求无忧可观测性数据库解决方案的组织。
I
IoT Cloud (物联网云平台)
专为物联网应用设计的云计算平台,提供海量设备数据存储、处理与连接管理能力。
IoT Database (物联网数据库)
针对物联网传感器高频时序数据优化的数据库系统。GreptimeDB 可高效处理物联网设备产生的大规模时序数据,提供弹性扩展能力。
IoT Observability (物联网可观测性)
通过指标、日志与事件数据对物联网设备及系统进行监控、分析与洞察的能力,确保物联网生态的可靠运行。
Interoperability (协议互操作性)
异构系统间无缝协作的能力。GreptimeDB 原生支持 SQL、InfluxDB、OpenTelemetry、Prometheus、Elasticsearch、Loki 等协议与 API,实现开箱即用的系统集成。
L
Log Aggregation (日志聚合)
对一组日志执行计算以生成单个摘要统计数据,以供分析和故障排除,例如 SUM,COUNT 等。
Log Management (日志管理)
涵盖日志采集、存储、分析与可视化的全生命周期管理方案,是保障系统性能与安全的重要基础。
M
Memory Leak (内存泄漏)
程序未能正确释放闲置内存 导致的软件缺陷,长期运行可能引发系统性能下降或崩溃。
Metric Engine (指标引擎)
GreptimeDB 中专门设计用于高效处理指标数据的存储引擎,特别适用于可观测性工作负载中常见的数千个小表场景。Metric Engine 使用合成的宽物理表来存储来自众多逻辑表的数据,实现高效的列和元数据重用,降低存储开销并增强列式压缩效果。基于 Mito Engine 构建,提供强大的存储能力。
Mito Engine (Mito 引擎)
GreptimeDB 的默认存储引擎,基于日志结构合并树(LSM-Tree)架构,针对时序工作负载进行优化。Mito 具备预写日志(WAL)、内存表和时间窗口压缩策略(TWCS),能够处理高吞吐量写入同时保持出色的查询性能。原生集成对象存储解决方案(S3、GCS、Azure Blob)并实现分层缓存以优化存储成本和访问速度。
L
LSM-Tree (日志结构合并树)
GreptimeDB 存储引擎采用的数 据结构,通过先将数据写入日志再定期合并为有序结构来优化写入性能。该设计特别适合高写入吞吐量的时序工作负载。
M
Metasrv (元数据服务)
GreptimeDB 分布式架构中的元数据管理服务,维护集群状态、表结构和 region 分布信息。Metasrv 协调集群操作,管理表的创建和修改,处理 region 分配和迁移,确保集群范围内的元数据一致性。它作为集群管理的中央控制平面,是所有元数据操作的权威数据源。
O
Observability (可观测性)
通过系统外部输出推断内部状态的能力。GreptimeDB 作为可观测性基础设施,可通过指标、日志与事件数据实现系统性能监控与深度洞察。
OpenTelemetry
面向云原生应用的开源可观测性框架,提供遥测数据(追踪、指标、日志)的采集、处 理与导出工具链。GreptimeDB 深度集成 OpenTelemetry 以强化数据可观测性。
P
Pipeline (数据管道)
GreptimeDB 中用于实时处理传入数据的强大解析和转换机制。Pipeline 由可配置的处理器组成,用于预处理原始数据;分发器用于将数据路由到不同管道;以及转换规则用于数据类型转换和表结构定义。支持多种输入格式和数据源(包括日志、Prometheus 指标和其他可观测性数据),提供广泛的处理能力,包括时间戳解析、正则匹配、字段提取和数据类型转换,实现可观测性数据的结构化存储和高效查询。
PromQL (Prometheus 查询语言)
专为 Prometheus 设计的时序数据查询语言。GreptimeDB 支持 PromQL 且兼容性接近 100%,支持用户执行复杂的时序数据分析操作并使用现有的 Prometheus 仪表盘和告警规则。