【第一篇章】认识一下 influxdb 数据库
原创大约 2 分钟
一、InfluxDB 介绍
InfluxDB
是一个由 InfluxData
开发的开源时序型数据库,主要用于存储和处理带时间戳的数据。它特别适用于需要高性能查询与存储的时序数据场景,如DevOps监控、应用程序指标、物联网传感器数据和实时分析等。
InfluxDB v1文档:https://docs.influxdata.com/influxdb/v1/
二、应用场景
InfluxDB广泛应用于各种需要高性能时序数据存储和查询的场景,如:
- 监控系统:实时收集并存储系统监控数据,如CPU使用率、内存占用率等。
- 物联网:收集并处理物联网设备的实时数据,如传感器读数、设备状态等。
- 金融分析:存储并分析金融市场的高频交易数据,进行趋势预测和风险评估。
- 日志管理:作为日志存储和查询的后端,支持日志数据的快速检索和分析。
三、特性与优势
1、时间序列特性
支持与时间有关的相关函数,如最大、最小、求和等,便于时间序列数据的分析和处理。
2、高性能
由 Go 语言编写,内置高性能的 TSM(Time-Structured Merge tree)存储引擎,支持高写入和查询负载。
3、灵活的数据模型
schemaless(无结构)设计,支持任意数量的列,适合多样化的数据存储需求。
4、强大的查询功能
支持类SQL查询语句(InfluxQL)和FLUX查询语言(2.x版本),提供灵活的数据查询和分析能力。
5、标签索引
通过tags对序列进行索引,实现快速有效的查询。
6、数据保留策略
支持Retention policies(RP),自动处理过期数据,减少存储空间占用。
7、可扩展性
支持单机和集群部署,满足不同规模的数据存储需求。
四、数据模型
InfluxDB的数据模型由几个核心概念组成:
- Database:数据库,用于存储相关数据。
- Measurement:类似传统数据库中的表,用于存储相同类型的数据点。
- Point:数据点,由时间戳(time)、数据(field)和标签(tags)组成。
- Tag:索引列,用于快速查询,只能是字符串类型。
- Field:无索引的列,用于存储具体的数据值,类型无限制。
- Series:一系列数据点,具有相同的Measurement和Tag Set,可以通过图表表示成一条或多条线。