首页>>科技 >>内容

微博服务器为什么会宕机,这几年为什么极少再宕机了

发布时间:2023-07-09 10:58:28编辑:温柔的背包来源:

很多朋友对微博服务器为什么会宕机,这几年为什么极少再宕机了不是很了解,每日小编刚好整理了这方面的知识,今天就来带大家一探究竟。

微博服务器为什么会宕机,这几年为什么极少再宕机了

你注意到一件事了吗?相比六七年前,微博因为各种明星的新闻频繁被关停,这几年微博里的宕机次数已经越来越少了。由于各路名人的故事让新浪的服务器处于崩溃的边缘,很多吃瓜的人把名人的咖点和微博的服务器联系起来:如果一个名人报道了外遇/结婚/离婚,微博也不会崩溃,证明这个名人的影响力还不够。

为什么新浪的服务器总是死机?国外也是这样吗?新浪服务器遇到明星的大新闻就会崩溃,相当于国庆高速公路。流量激增后,所有人都会挤在路上。如果服务器处理不了,就会显示部分业务请求无效或者整体瘫痪,也就是所谓的宕机现象。

其实服务器崩溃并不少见,国外网站也会有这样的问题。比如几年前,YouTube遭遇了全球范围的宕机,YouTube、YouTubeTV、YouTube music都受到了影响,大概半个小时就恢复了。除了访问量的爆发,网络瘫痪的原因也可能是物理上的。比如微软数据中心遭雷击,其云服务大面积出现网络连接问题;韩国KT电信突然遭遇火灾,整个首尔网络几乎完全瘫痪。

停机时间到底是什么?是什么导致了停机?其实停机是一个IT行业术语,是英文down的音译。所谓宕机,是指网络空间的信息系统无法提供正常服务,出现卡顿甚至“停止”的情况。用户的直接体验是系统长时间无响应,比如无法正常访问,搜索无响应,无法发帖。

造成系统宕机的因素有很多,比如机房供电故障、服务器硬件崩溃、系统处理能力不足、网络攻击等。微博中因突发热点事件导致的服务器宕机,通常是因为访问量突然增加,使得后台服务器不堪重负,不得不“关机”。根据数据设计了微博系统服务器访问的上限来预估正常流量的峰值,并据此配置相关的服务资源。

一旦突发事件导致流量超过这个峰值,系统将无法承受,宕机将不可避免。

微博里的宕机是因为什么技术问题吗?其实单从技术角度来说,防止微博服务器宕机没有太大问题,只要能扩容就行。微博中服务器频繁宕机主要有两个原因:

第一,微博中服务器的部署规模和处理能力有限。很多公共服务平台平时流量基本稳定。基于成本考虑,微博运营商在保持适度冗余处理能力的前提下,不会主动租用或分配超出日常数据处理需求的大量计算和存储资源。服务器容量大大扩展。如果没有流量支持,资源就会闲置,成本就会增加。

这为微博节省了不少成本。毕竟如果平时征用这么多服务器,基本都是闲置的,太浪费了。根据之前阿里云关伟的价格公布,一台机器租一小时只要1.86元(其实这只是华北三区一台低配机的价格)。即使是这个最低价,每天用一台机器也要45元左右的钱,1000台机器要4.5万,一个月135万,一年1620万。

另一方面,微博流量具有瞬时峰值高、持续时间短的特点,在热点事件出现时更为明显。微博热点流量难以预测,使得微博运营商在扩容上陷入两难境地:扩容太多容易流失,容量不足容易挂机。

目前,防止服务器宕机的解决方案,新浪的做法是扩大容量。但是扩容最大的问题是新闻事件是随机的,明星不会选择时间让你的服务器做好再出事的准备。

所以对新闻影响力的预测会考验平台的判断。比如对某个明星的事件造成的震撼程度预测错误,就会带来另一个问题。——临时花大价钱购买的服务器成本放进去了,却没带来那么多流量。不仅没有获得预期的收益,还损失了服务器的高成本。

新浪这么大的公司难道就养不起几台闲置的服务器吗?

新浪作为一个大公司,能买得起的肯定买得起,但是现在服务器基本都是按需按时收费,一天花的钱还不错,但是一年花的钱就是一笔大数目了。新浪作为一个企业,首要目的肯定是盈利。如果直接购买硬件,可能需要上千台服务器来处理高并发,而现有的服务器可以解决平时的流量,导致新的服务器大部分时间处于闲置状态,这是一种巨大的资源浪费。

所以一般来说,新浪会在必要的情况下临时购买额外的服务器。新浪最靠谱的解决方案是:魏云和程序员做好随时加班的准备;或者找明星团队谈,让他们联系新浪再爆料。

如果加购选项不成立,那么能做到预测峰值流量吗?

热点流量虽较难以预测,但不等于不可预测。只要能预估出流量峰值范围,就可通过定时扩容和提供弹性计算存储资源来从容应对。很多平台在这方面都有过应对流量突增的成功案例,比如电商平台应对“双十一”时的峰值流量。明星离婚等网络突发事件,虽不受微博运营商控制,但微博运营商应该可通过舆情监控等手段感知即将到来的流量大潮,通过启动应急预案来应对。

构建弹性伸缩业务系统,辅以人工智能预测和业务持续性监控,来保障峰值服务正常运行。比如,通过人工智能技术来预测网络突发流量,利用云计算弹性计算资源平台来实现快速扩容甚至实时扩容,以应对高峰流量。云提供商目前可在宕机后数秒内探测到服务不可连接,然后在90秒内实现扩容,恢复运行中断业务。

这种按需部署的服务器配置方式,既可显著降低网络平台服务器宕机的风险,又能很好地利用存储计算资源,实现双赢。

同时微博还可采用“降级”运行策略,即将服务器的业务拆分为若干相对独立的业务,各业务之间共享数据库。一旦服务器出现过载,可启动降级策略来“丢卒保车”,至少保证核心业务能正常运行。比如,若微博热搜榜崩溃,可维持评论、转发等核心功能的正常运行。

另一种有效的应对方式是利用边缘计算技术,通过在网络边缘实现数据分布式本地处理,可显著降低访问数据的汇聚和传输总量,这不仅能缩短用户响应时间、提升用户体验,还能大幅降低中心节点的数据传输和处理压力,也是一条应对宕机的新路径。

“边缘计算”比较完美的解决了宕机难题

边缘计算是为应用开发者和服务提供商在网络的边缘侧提供云服务和IT环境服务;目标是在靠近数据输入或用户的地方提供计算、存储和网络带宽。边缘计算是一种分布式计算,将数据资料的处理、应用程序的运行和功能服务的实现,由网络中心下放到网络边缘的节点上。这样就可以把云打散,就近接入不同节点,提供最近端服务。

把边缘计算和云计算紧密结合,充分发挥边缘的低延迟,安全等特性同时,结合云的大数据分析能力。

全国网民在同时访问微博时,可以就近访问不同的节点。各个节点之间有一定的处理能力,处理完再上报给集中节点,这就大大减少了数据的汇聚和传输量,同时就近节点的访问延迟也会缩短。此外,边缘计算支持数据本地处理,大流量业务本地卸载可以减轻回传压力,有效降低成本。

CDN巨头对于边缘计算的应用如何?

CDN(即内容分发网络)的核心价值是将数字内容智能分发到离用户更近的节点,进而提升整体分发效率,降低网络延时、节省带宽资源,其与生俱来的边缘节点属性,低延时和低带宽,令其在边缘计算市场具备先发优势,CDN本身就是边缘计算的雏形。

Akamai作为全球CDN领头羊早在2003年就与IBM合作边缘计算,如今Akamai与IBM在其WebSphere上提供基于边缘Edge的服务。网宿科技也已将边缘计算当成核心战略,2016年开始建设边缘计算网络,2017年逐步推出边缘计算微服务,并将逐步开放边缘IaaS和PaaS服务。

CloudFlare公司在2017年就推出了CloudFlare Workers,以微服务的形式开放边缘计算服务,支持用户在边缘端编程,这标志着它已经初步搭建好了边缘计算的平台。

阿里云/腾讯云也均在云计算和边缘计算上下了很大功夫,并且有非常成功的经验,比如上文所提的微博就是主要使用的阿里云服务器,正是因为阿里云的云计算和边缘计算技术不断进步和迭代,才保障了微博近年来宕机事件越来越少的成果。

目前火伞云已经建立了遍布全球的智能融合CDN网络,为客户提供集边缘计算、边缘存储、融合CDN及安全防护于一体的综合解决方案。公司旗下的火伞云融合CDN目前已融合多家头部CDN厂商:阿里云、腾讯云、网宿云、亚马逊云、谷歌云、白山云等,未来我们将不断融合更多更全的海内外知名厂商,为用户提供更多,更安全稳定的CDN节点服务。

以上知识分享希望能够帮助到大家!