鲸品堂|专业探索:PON网络割接自动化

2023-02-20 379

网络割接是运营商网络运维中常见工作内容,割接专业涉及多专业,包括无线、传输、数据、接入、动环等,不同专业割接流程及操作差异较大,但当前有一个共同的问题是只能实现简单的流程化支撑,割接过程关键操作都极度依赖人工,包括割接影响分析、割接操作、风险识别、割接验证等,割接效率不高,更重要的是割接出错时常发生,最终影响使用感知。


本文通过分析PON接入网割接的各环节规律,探索接入网割接自动化的方法,摆脱对人工的过度依赖,提升割接成功率,降低对业务的影响。


当前接入网割接存在的问题:


割接业务影响无法快速识别

网络割接影响哪些业务与客户,需要人工在资源系统查找割接设备节点及下挂子设备节点,并根据“业务链路”及“物理链路”组合查找割接设备承载业务所关联的客户,即受影响客户,之后通过接口或线下表格导入进来,此过程操作繁琐且由于PON网络具有层级多、链路多等特性,人工过滤筛选方式识别出来的影响客户往往不够准确,影响后续精准客户关怀。


无法实时准确判断割接状态


网络割接影响影响用户业务使用,割接期间需要实时监测相关网络的业务质量、网络质量的变化情况,判断割接进展是否异常,是否需要即时中止、回退割接等,目前这些均通过人工观察分析,面对众多的指标数据极易监测疏漏,往往难以及时准确判断割接状态。


缺乏对割接风险自动识别能力


网络割接操作过程,涉及对关键设备的操作,缺乏操作权限自动监管;对操作脚本和指令是否带风险,缺乏系统自动判断能力。割接风险自动识别能力的缺失,降低了PON网络割接的成功率。


人工割接验证与复盘耗时耗力


割接结束后,需要对PON网络质量、业务质量进行验证,以确认割接完成后网络和业务恢复正常或达到预期的新水平,这也涉及大量指标比对分析。同时,割接复盘需要对大量割接过程信息进行提取,对割接存在问题进行分析,输出改进举措。


01

 PON业务网络自动割接整体思路



PON网络割接业务流程主要包含割接准备、割接执行、割接验证三大环节,每个环节在现阶段生产应用中,还是比较依赖人工,因此针对这三大环节进行流程改进优化,引入自动数据采集、自动影响分析、自动值守、自动复盘、风险监控以及基于网络指标割接验证模型的智能化验证等能力,实现PON网络运维高效可靠的割接支撑,提高割接效率和风险把控,促进网络运维自智水平。以割接50个PON口割接为例,自动化割接流程后,预计操作时间可以从小时级到分钟级,节约人力、减少风险。


PON网络自动割接整体思路:


图片关键词


割接准备

针对割接设备的IP,从综合网管、性能中心、告警中心等系统自动采集告警、性能、设备状态、用户在线情况等数据,同时对接资源系统自动进行割接影响分析。


割接执行

针对当前割接,启动自动值守功能,代替人工实时监控网元的告警数据和性能指标数据,若发生异常,则自动提醒。在割接操作时进行风险监控,自动识别割接人员是否在执行风险指令,若识别出风险指令,则详细记录风险操作日志,并发出提醒通知相关人员。


割接验证

在割接完成后对PON网络设备进行自动割接验证,验证割接设备影响的下级设备是否状态正常、性能指标正常,是否有告警等,保障割接后网络质量和业务质量的稳定。


割接完成

割接完成并验证网络已经恢复正常,那么系统自动解除告警拦截和屏蔽,并输出割接总结报告,自动复盘记录本次割接的设备信息、操作信息、验证信息等数据。同时启动网络质量动态监测,从多维度对割接后的网络质量进行监测,与割接前的网络质量进行比较,判断网络是否恢复正常。

02

 PON网络自动割实现要点



准备阶段—采集数据



当通过系统创建割接工单并录入待割接设备信息时,系统通过对接外系统自动采集割接的设备及子设备的告警信息、性能信息、用户在线情况等数据。


对割接所需的信息数据,系统自动识别采集,并入库,以作割接完验证的基本数据。对接的外系统包含网管系统、拨测系统、性能中心、告警中心、资源系统等,统一对接入口管理。


图片关键词


自动采集PON设备性能指标信息

采集割接设备下挂的光猫、OLT、ONU、OBD等设备的性能数据,包含设备光功率信号、误码、用户数、设备CPU使用率、内存使用率、端口输入输出流量等。


自动采集PON设备承载业务的用户在线情况

采集割接设备及下挂设备的承载业务的用户在线情况,业务包含宽带、IPTV、ITMS、互联网专线、VPN专线等。按照割接前一周时间进行采集,用于做割接后数据对比,如一周的环比和前一天的环比。


自动采集PON设备告警信息

采集OLT/ONU等PON网络设备是否有光信号丢失等告警,是否有影响业务、设备的告警。

准备阶段—影响分析



通过割接的设备IP,系统自动进行影响分析,调取资源系统数据,获取割接影响的设备节点、宽带客户清单、电路清单等数据,再通过影响分析规则判定是否为割接影响的设备、客户、电路。


图片关键词


自动分析影响设备节点

网元库根据设备IP,提供割接设备及下挂设备的所有 设备节点信息,通过建立规则分析是否为割接设备下挂子设备节点、割接所封锁的资源,来筛选影响设备节点。


自动分析影响业务及用户

根据设备IP,提供割接设备及下挂设备的所接入的所有 “客户信息”、“业务信息”,通过建立规则分析是否为割接设备承载业务所关联的客户,来筛选出影响的用户清单。


自动分析影响电路

提供割接设备所涉及的所有的“业务链路”及“物理链路”信息,通过建立规则分析是否为割接设备关联的物理链路和业务链路,来筛选出影响的电路清单。

执行阶段—割接值守



在PON网络的割接操作一般都会影响用户业务的使用,因此在每次执行割接任务时,割接前、割接中、割接后都需要有人员观察业务质量、网络质量变化等情况,且割接时间通常选在凌晨,割接人员易疲惫,面对众多的指标数据容易出现监控疏漏。


对此构建自动值守能力,即引入业务质量和网络质量自动监控能力代替人员监控,实现割接前、割接中、割接后智能自动值守,包含实时监控感知异常指标数据,如网络质量、业务流量、用户在线情况、设备告警等。


在割接全流程中,无间断监控网络状态,发现异常能及时报警,并通知相关人员进行处理,高效可靠的保障割接顺利完成。


图片关键词


自动监控

系统在割接前、割接中、割接后自动监控,无间断实时监控割接所在网络的网络质量、业务质量、用户在线、相关设备告警等情况。


趋势预测

利用AI能力指标趋势预测模型自动判断设备流量、光功率等指标的情况是否有异常趋势,与割接前一周的数据进行同比和环比,或通过模型训练的动态阈值判断指标是否异常。


多视角监控

提供监控内容定制化,根据用户权限、用户工作性质、监控重点等维度调整监控信息,包含值守人员视角监控、操作人员视角监控、领导视角监控等。


自动异常报警

自动值守时发现指标劣化异常、用户在线情况异常等及时报警提醒相关人员进行处理。

示例:提供实时流量监测能力,根据当天数据流量趋势,与前一天的流量、一周前的流量等数据进行同比和环比,计算动态基线,预测割接后的流量,看和实际流量是否有较大出入,若偏离动态基线过多,则进行预警通知相关人员处理。


图片关键词


如上图所示,监测业务流量波动情况,针对输入和输出流量进行异常监测识别。根据实时监测实际值和预测值对比,实际值在割接时间内(16-12:00左右)波形骤降,发出预警提示。


执行阶段—风险监控


通过设置风险操作识别规则,实现对割接风险操作自动识别、风险操作拦截。当割接中,若有人执行的操作指令是风险操作,系统自动识别操作风险,并自动判断执行人是否有权限操作,有权限进行风险操作提醒,并记录操作详细日志,无权限则进行拦截预警、限制操作。


图片关键词


风险操作识别

如软件大版本升级、网络结构变更、核心设备中断或重启等操作,采用屏幕操作监控、指令输入识别方式对风险操作进行识别。提前设定风险操作指令识别规则、屏幕风险操作识别规则进行识别,如判断登录网管系统是否正确、系统输入的指令是否有风险等。


风险操作权限判断

对识别的风险操作判断是否有操作权限,若当前用户无权限则及时拦截预警,若当前用户有权限进行操作,则自动记录操作详细日志。日志信息包括操作人、操作内容、操作时间、风险等级等。

验证阶段—割接验证



割接操作后,需对PON网络质量、业务质量等指标进行割接验证:如BRAS、 OLT、ONU、用户终端的相关性能指标、告警、用户在线情况等数据进行割接验证。在此引入基于网络指标割接验证模型的智能化验证能力,实现自动、智能的验证割接后网络各项指标数据,以确保割接完成后网络和业务恢复正常。


建立网络指标割接验证模型,通过采集的割接待验证指标数据,自动进行割接前后数值比对,自动判断割接后这些指标数据是否异常,从而判断网络是否恢复,从而实现割接验证的自动化。


图片关键词


归档阶段—割接复盘


割接完成后,确定网络恢复正常,系统自动撤回割接前的告警屏蔽和工单拦截,并将割接流程的关键信息自动保存记录,并输出报告。


自动复盘核心举措是对割接关键信息,包括割接设备信息(硬件及网络拓扑)、割接操作及异常处理信息、割接人员及时间安排信息、割接验证信息等,自动进行关键点分析,形成完整割接报告,提供割接管理者参考,帮助其制订进行割接方案改进、割接处理流程优化、人员画像更正、网络质量持续监控等措施。


图片关键词


割接后评估—持续动态监测


对于割接完成PON网络,需在割接完成后的一段时间,一般保持7天持续网络质量监测,保障割接后网络质量和业务质量趋于稳定,而目前行业内还未有较为完善的方案进行割接后评估。


因此,通过构建割接后评估模型,多维度综合分析割接后的网络情况,包含质差网络分析、质差业务分析、用户在线情况分析、告警关联分析。分析到异常问题,则证明割接任务对网络质量造成了影响,需要派发处理工单给相关人员,工单处理完成进行反馈,更新调优割接后评估模型。


图片关键词


本文主要为解决PON网络割接效率低、割接风险大、指标监控难等问题提出解决思路,通过对整个割接流程赋予自动化、智能化的能力,包含自动采集数据、自动影响分析、割接自动值守、操作风险自动监控、基于网络指标割接验证模型的自动验证、割接自动复盘评估、割接后评估等能力,提升网络割接的效率与准确性,从而降低人工出错率。未来也可扩展到其他专业的网络割接场景,包含无线、传输、数据、接入、动环等专业的割接场景。



官方微信公众号

浩鲸云计算科技股份有限公司 版权所有 2003-2023

苏ICP备10224443号-6       苏公网安备 32011402011374号