首页>>科技 >>内容

广东电信出现历史性故障,影响全省电信用户,容灾机制在

发布时间:2023-08-10 09:30:39编辑:温柔的背包来源:

很多朋友对广东电信出现历史性故障,影响全省电信用户,容灾机制在不是很了解,每日小编刚好整理了这方面的知识,今天就来带大家一探究竟。

广东电信出现历史性故障,影响全省电信用户,容灾机制在

.不起作用

电子爱好者网讯(文/吴子鹏)6月8日,广东电信发生重大故障,导致广东电信本地和漫游用户通话异常。当天16时许,有网友陆续在社交媒体上发帖称,使用电信卡的手机无法通话和交流。“失败后,我尝试了重启卡、检查手机硬件、充话费等不同的方法,还是无法解决问题。”

随后不久,中国电信广东客服回应称“由于网络异常,影响部分移动用户接听电话,我们正在进行紧急抢修。对于给您带来的不便,我们深表歉意,感谢您的理解和支持。”随后在8日18: 00左右,中国电信广东客服补充消息称,“经过紧急抢修,16:30起,受影响用户正在逐步恢复,在此期间对受影响的客户表示诚挚的歉意。

19时左右,官方微信又发布消息称,“截至目前,受影响移动用户的语音服务已全面恢复,对由此带来的不便再次表示歉意。”

来源:中国电信广东客服官魏,中国电信官方尚未公布此次故障的具体原因。但针对这起历史性的电信事故,8日晚,广东省通信管理局召集广东电信、广东移动、广东联通、广东广电、广东铁塔相关负责人召开网络运行安全紧急调度会。透过事件本身来看,电信系统是如何运作的?容灾系统不起作用的原因是什么?解密电信网络系统

对于电信网络的运营来说,它上面有两个系统,即上层的IT软件和下层的基础硬件。其中,IT系统可分为BSS、OSS、MSS和EDW。BSS(业务支撑系统)和OSS(运营支撑系统)统称BOSS系统,即电信业务运营支撑系统。BOSS系统以客服、业务运营和管理为核心,支撑客服、计费等关键事物的运营。

在BOSS系统中,BSS实际上具有主动管理能力。这种能力使得运维人员能够在故障发生前提前介入,消除系统故障带来的潜在风险,这是运营商在系统层面提升客户满意度的关键功能。但显然,在此次广东电信故障事故中,BSS系统未能起到主动管理的作用。从这个角度来说,事故非常突然。

MSS(管理支撑系统)负责IT系统的规划和窗口呈现,帮助电信运营商更好地融合业务和市场需求,提高企业管理和IT系统升级的效率,也有助于提高企业的运营效率。EDW(企业数据仓库)主要负责数据存储和信息管理。IT系统是电信运营商业务的神经中枢。当然,它的运行需要部署在底层的硬件设备上。

在介绍底层硬件结构之前,我们先用下图看看电信业务是如何工作的。如下图所示,电话业务和移动电话业务最终都需要接入核心网。

电信业务架构示意图。来源:华为培训我们再来看另一张图。宽带业务其实也是一样,所有的业务支撑最终都会回归到核心网层面。宽带业务示意图,来源:华为培训所以,这也是运营商经常被称为“管道提供商”的原因。其实所有的电信运营都像水管一样,网络流量和核心网是差异化的。如下图所示,每个服务都是根据管道中的流量从主干网络转移的。

电信网络分流示意图,来源:中国电信当然,网络是一个比较模糊的概念,要靠设备来支撑。在整个网络架构中,有三类设备是最常见也是最关键的,即路由器、交换机和核心交换机。如下图所示,网络无论是在核心网、IP传输网还是业务网上传输,都是依靠交换机中转的。来源:广州移动培训资料

运营商在建网时,通常会选择使用多个核心交换机来构建一个超级节点。超级节点基本只存在于北上广等重要节点城市,负责国际和省际网络传输,也构成核心网传输的第一平面。这个平面包括超级节点及其链接,以及各省的第一出口链接。

当然,骨干网还有第二层,由普通核心节点到超级节点的链路和各省的二次出口链路组成,负责跨大区的流量转发。该国大约三分之二的流量在这个网络上运行。如下图所示,为了增加网络接入的效率,在节点处进一步分流流量,就是到基站和普通交换机/路由器侧,方便用户接入。

网络接入和传输示意图,来源:华为培训。

那么显然一个普通的路由器和交换机很难造成一个省网络的所有问题。很可能是核心交换机出了问题,影响了骨干网的传输,导致一个省没有网络流量入口。虽然二层网络已经推出多年,但仍然是电信运营商主要采用的骨干网络架构。虽然二层网络的可扩展性不好,但其跨域传输性能非常出色。

当然,这也造成了一个问题,就是看似互联的网络中,会有一些重要的节点,这些节点不能丢失。

电信网络的容灾机制

电信网络是关系到国计民生的领域,所以在建设过程中,需要有容灾机制,面对一些突发的挑战。上面我们已经提到,电信网络基本上是由两个系统来运营的,一个是IT系统,一个是底层设备。由于用户信息和业务的高度集中,每个电信业务在部署时都有一套“B计划”,也叫灾难恢复措施,主要是应对突发的火灾、洪水、飓风等突发因素。

据介绍,电信系统除了在BSS系统中加入故障预测机制外,在硬件层面还有多层容灾措施,包括单板容灾、设备容灾、网元容灾、异地同城容灾。通过多维度的容灾措施,电信运营商可以在重大故障发生后快速恢复网络。上一次大规模区域性断网发生在郑州的洪水期间。

由于几十年不遇的洪水,郑州骨干核心机房和主备机房全部被淹。最后,为了让郑州市民尽快用上互联网,启动了异地同城容灾机制。但一般来说,异地同城容灾已经是电信网络容灾机制的最高规格。万一全省突发事件,其实很难发挥作用。

写在最后

此次广东电信的故障是一次历史性的事件,也给国内的主要运营商提了醒。在当前的骨干网络架构里,一些关键节点的重要性与日俱增,一旦出现问题,就会带来大面积的影响。当然,此次广东电信故障还没有公布真正的原因,上述也只是从电信运营商软硬件体系结构下推断出来的。具体原因如何,相信广东电信会给大家一个解释。

以上知识分享希望能够帮助到大家!