联盟告警平台建设的目标是,通过对联盟、法人行及各个外围系统告警信息进行收集汇总展示,以及对核心交易数据进行分析,以此达到及时发现问题、解决问题的目的,而且还能够提前预警可能出现的问题,提前排除隐患,从而为联盟、法人行及各个系统的高可用性提供支持。

告警系统可以对核心、其他系统进行告警,能够在问题尚在襁褓中时发现并进行消灭。核心告警又分为渠道信息统计、重要错误信息展示、错误码数量统计以及核心错误码统计查询等功能界面。渠道信息统计将关注并展现哪些法人行在某渠道规定警戒时间阀值内没有交易;重要错误信息统计展示通过灵活的规则配置,可以根据时间段+错误码+交易码等的需要关注的条件进行组合展示;错误码数量统计可以按照错误码、法人行、交易码等维度展示一段时间内同一错误码出现次数超过警戒阀值的错误。

其他告警信息主要是实时展示前端,核心,ESB,XBUS等外围过滤而来的告警消息,包含了磁盘空间,表空间,队列深度,进程是否存在、假死等涉及联盟及成员行异常交易、设备故障和需要特殊关注的方方面面。

除以上两大告警之外,告警平台还可以分渠道和法人行实时形成成功率,交易曲线图等图表信息,能够直观的了解当前以及历史交易情况。

告警平台通过友好的可视化界面,可以在第一时间发现并告警异常交易,系统故障等一切需要关注的内容,并能提供足够多的信息来解决问题,将生产问题消灭于摇篮之中,大大增强了安全运维系数,成为了安全运维的关键。