通过时间、拓扑和文本相似性对告警进行聚合,并过滤派生告警,让运维人员聚焦真正问题。
从海量文本日志中解析日志模板,并利用 LSTM、Transformer 等序列模型检测异常模式。
构建基于大数据和机器学习的智能运维平台,实现异常检测、根因定位、告警收敛和故障自愈。
学习在复杂系统中利用相关性、因果推断和搜索算法从诸多异常指标中定位故障根因。