ha(high **ailability)指的是通过尽量缩短因日常维护操作(计划)和突发的系统崩溃(非计划)所导致的停机时间,以提高系统和应用的可用性。ha系统是目前企业防止核心计算机系统因故障停机的最有效手段。实现ha的方式,一般采用两台机器同时完成一项功能,比如数据库服务器,平常只有一台机器对外提供服务,另一台机器作为热备,当这台机器出现故障时,自动动态切换到另一台热备的机器。怎么实现故障检测的那? 心跳,采用定时发送一个数据包,如果机器多长时间没响应,就认为是发生故障,自动切换到热备的机器上去。怎么实现自动切换那? 虚ip。何为虚ip那,就是一个未分配给真实主机的ip,也就是说对外提供数据库服务器的主机除了有一个真实ip外还有一个虚ip,使用这两个ip中的 任意一个都可以连接到这台主机,所有项目中数据库链接一项配置的都是这个虚ip,当服务器发生故障无法对外提供服务时,动态将这个虚ip切换到备用主机。开始我也不明白这是怎么实现的,以为是软件动态改ip地址,其实不是这样,其实现原理主要是靠的。因为ip地址只是一个逻辑 地址,在以太网中mac地址才是真正用来进行数据传输的物理地址,每台主机中都有一个arp高速缓存,存储同一个网络内的ip地址与mac地址的对应关 系,以太网中的主机发送数据时会先从这个缓存中查询目标ip对应的mac地址,会向这个mac地址发送数据。会自动维护这个缓存。这就是整个实现 的关键。下边就是我电脑上的arp缓存的内容。(192.168.1.219) at 00:21:5a:db:68:e8 [ether] on bond0(192.168.1.217) at 00:21:5a:db:68:e8 [ether] on bond0(192.168.1.218) at 00:21:5a:db:7f:c2 [ether] on bond0192.168.1.217、192.168.1.218是两台真实的电脑,192.168.1.217为对外提供数据库服务的主机。 192.168.1.218为热备的机器。192.168.1.217为虚ip。大家注意红字部分,219、217的mac地址是相同的。再看看那217宕机后的arp缓存(192.168.1.219) at 00:21:5a:db:7f:c2 [ether] on bond0(192.168.1.217) at 00:21:5a:db:68:e8 [ether] on bond0(192.168.1.218) at 00:21:5a:db:7f:c2 [ether] on bond0 这就是奥妙所在。当218 发现217宕机后会向网络发送一个arp数据包,告诉所有主机192.168.1.219这个ip对应的mac地址是00:21:5a:db:7f:c2 ,这样所有发送到219的数据包都会发送到mac地址为00:21:5a:db:7f:c2的机器 20210311