TDinsight 参考手册
TDinsight 是使用 [Grafana] 对 TDengine 进行监控的解决方案。
TDengine 通过 taosKeeper 将服务器的 CPU、内存、硬盘空间、带宽、请求数、磁盘读写速度、慢查询等信息定时写入指定数据库。通过 Grafana 和 TDengine 数据源插件,TDinsight 将集群状态、节点信息、插入及查询请求、资源使用情况等进行可视化展示,为开发者实时监控 TDengine 集群运行状态提供了便利。本文将指导用户安装 TDengine 数据源插件及部署 TDinsight 可视化面板。
前置条件
首先检查下面服务:
-
TDengine 已经安装并正常运行,此仪表盘需要 TDengine 3.0.0.0 及以上,并开启监控上报配置,具体配置请参考:TDengine 监控配置。
-
taosAdapter 已经安装并正常运行。具体细节请参考:taosAdapter 参考手册
-
taosKeeper 已安装并正常运行。具体细节请参考:taosKeeper 参考手册
-
Grafana 服务已安装并正常运行。我们建议您使用最新的 Grafana 版本,TDInsight 支持 Grafana 7.5 及以上版本。
信息下文介绍中,都以 Grafana v11.0.0 版本为例,其他版本功能可能有差异,请参考 Grafana 官网。
然后记录以下信息:
- taosAdapter 集群 REST API 地址,如:
http://localhost:6041
。 - taosAdapter 集群认证信息,可使用用户名及密码。
- taosKeeper 记录监控指标的数据库名称。
安装 TDengine 数据源插件和配置数据源
安装 Grafana TDengine 数据源插件和配置数据源的步骤请参考:与 Grafana 集成
导入 TDinsightV3 仪表盘
在配置 TDengine 数据源界面,点击 “Dashboards” tab,再点击 ”import” 导入 ”TDengine for 3.x” 仪表盘。 导入成功后可以进入这个 dashboard,在左上角 ”Log from“ 选项中选择 taosKeeper 中设置的记录监控指标的数据库就可以看到监控结果。
TDinsightV3 仪表盘详情
TDinsight 仪表盘旨在提供 TDengine 相关资源的使用情况和状态,比如 dnodes、 mnodes、 vnodes 和数据库等。 主要分为集群状态、DNodes 概述、MNode 概述、请求、数据库、DNode 资源使用情况和 taosAdapter 监控信息。下面我们分别详细介绍。
集群状态
这部分指标包括集群当前信息和状态。
指标详情(从上到下,从左到右):
- First EP:当前 TDengine 集群中的
firstEp
设置。 - Version:TDengine 服务器版本(master mnode)。
- Expire Time - 企业版过期时间。
- Used Measuring Points - 企业版已使用的测点数。
- Databases - 数据库个数。
- Connections - 当前连接个数。
- DNodes/MNodes/VGroups/VNodes:每种资源的总数和存活数。
- DNodes/MNodes/VGroups/VNodes Alive Percent:每种资源的存活数/总数的比例,启用告警规则,并在资源存活率(1 分钟内平均健康资源比例)不足 100%时触发。
- Measuring Points Used:启用告警规则的测点数用量(社区版无数据,默认情况下是健康的)。
DNodes 概述
这部分指标包括集群 dnode 基本信息。
指标详情:
- DNodes Status:
show dnodes
的简单表格视图。 - DNodes Number:DNodes 数量变化。
MNode 概述
这部分指标包括集群 mnode 基本信息。
指标详情:
- MNodes Status:
show mnodes
的简单表格视图。 - MNodes Number:类似于
DNodes Number
,MNodes 数量变化。
请求统计
这部分指标包括集群执行 sql 的统计指标。
指标详情:
- Select Request:select 请求数。
- Delete Request:delete 请求数。
- Insert Request