编辑: 黑豆奇酷 2019-07-06

以及

2013 年7月22 日微信服务中断数小 时等重大事故均属于产品未能实现多活 IDC 架构,单个 IDC 故障导致服务全面下线的惨痛案例. 在上述方面,我方拥有超过十年的积累,掌握多项受国家和国际发明专利保护的分布式架构 和算法.得益于这些领先的强一致、高可用、高性能分布式集群算法和架构,我们在蓝鲸、白豚、 职业精等全线产品上,均实现了真正的多活 IDC 架构,为客户提供了无以伦比的数据可靠性和服 务可用性保证. a BaiY product 分布式网游服务器集群概要设计

5 分布式协调服务 图1分布式协调服务为集群提供服务发现、服务选举、故障检测、故障转移、故障恢复、分布式 锁、任务调度,以及消息路由和消息分发等功能. 分布式协调服务是分布式集群的大脑,负责指挥集群中的所有服务器节点协同工作.将分布 式集群协调为一个有机整体,使其有效且一致地运转.实现可线性横向扩展的高性能(HPC)和 高可用(HAC)分布式集群系统. a BaiY product 分布式网游服务器集群概要设计

6 图2传统的 Paxos/Raft 分布式协调算法为每个请求发起投票,产生至少

3 次网络广播(b1-b3)和 多次磁盘 IO.使其对网络吞吐和通信时延要求很高,无法部署在跨 IDC(城域网)环境. 我们的专利算法则完全消除了此类开销.因此大大降低了网络负载,显著提升整体效率.并 使得集群跨 IDC 部署(多活 IDC)变得简单可行. a BaiY product 分布式网游服务器集群概要设计

7 图3基于我方独有的分布式协调技术,可实现高性能、强一致的多活 IDC 机制.可在秒级完成故 障检测和故障转移,即使整座 IDC 机房下线,也不会导致系统不可用.同时提供强一致性保证: 即使发生了网络分区也不会出现脑裂(Split Brain)等数据不一致的情形.例如: a BaiY product 分布式网游服务器集群概要设计

8 图4在传统的双机容错方案中,从节点在丢失主节点心跳信号后,会自动将自身提升为主节点, 并继续对外提供服务,以实现高可用.在此种情形中,当主从节点均正常,但心跳连接意外断开 时(网络分区) ,就会发生脑裂(Split Brain)问题,如图

4 所示:此时 A、B 均认为对方已下线, 故将自己提升为主节点并分别对外提供服务,产生难以恢复的数据不一致. 我方 BYPSS 服务可提供与传统 Paxos/Raft 分布式算法相同水平的强一致性保证,从根本上 杜绝脑裂问题的发生. 类似地:工行、支付宝等服务也有异地容灾方案 (支付宝: 杭州 → 深圳、 工行:上海 → 北京) .但在其异地容灾方案中,两座 IDC 之间并无 Paxos 等分布式协调算法保护,因此无法实现 强一致,也无法避免脑裂. 举例来说, 一个在支付宝成功完成的转账交易, 可能要数分钟甚至数小时后才会从杭州主 IDC 被异步地同步到深圳的灾备........

下载(注:源文件不在本站服务器,都将跳转到源网站下载)
备用下载
发帖评论
相关话题
发布一个新话题