总之我们很大听闻过 Nginx,若据我所知它,所以很大母汤氏它的”南埃尔普”Apache 吧!
相片源自 Pexels
Nginx 的造成
Nginx 同 Apache 那样都是一种 Web 伺服器。如前所述 REST 构架艺术风格,以标准化天然资源配置文件(Uniform Resources Identifier)URI 或是标准化天然资源功能定位符(Uniform Resources Locator)URL 做为沟通交流依照,通过 HTTP 协定提供更多各式各样网络服务。
不过,那些伺服器在结构设计Hathras受彼时自然环境的局限性,比如彼时的采用者体量,网络连接,商品特征等局限性因此各别的功能定位和产业发展发展都各不相同。这也使各 Web 伺服器有著各别独特的特征。
Apache 的产业发展发展末期极短,而且是不无争论的世界第三大伺服器。它有著许多缺点:平衡、开放源码、虚拟化之类。
它出现的时间太短了,它蓬勃发展的二十世纪,网络产业发展相比之下远不如现在。所以它被结构设计为一个新锐的。
它不全力支持高mammalian的伺服器。在 Apache 上运转数以千计的mammalian出访,会引致伺服器耗用大批缓存。
作业系统对其进行民主化或缓存间的转换也耗用了大批的 CPU 天然资源,引致 HTTP 允诺的平均值反应速度减少。
那些都下定决心了 Apache 不可能成为高效能 Web 伺服器,轻量高mammalian伺服器 Nginx 就不断涌现了。
白俄罗斯的技师 Igor Sysoev,他在为 Rambler Media 工作前夕,采用 C 词汇开发了 Nginx。
Nginx 做为 Web 伺服器始终为 Rambler Media 提供更多出众而又平衡的服务。然后呢,Igor Sysoev 将 Nginx 代码开放源码,因此赋予自由软件许可证。
由于以下这几点,所以,Nginx 火了:
Nginx 采用如前所述事件驱动构架,使其可以全力支持数以百万级别的 TCP 连接。高度的模块化和自由软件许可证使第三方模块层出不穷(这是个开放源码的时代啊)。Nginx 是一个虚拟化伺服器,可以运转在 Linux、Windows、FreeBSD、Solaris、AIX、Mac OS 等作业系统上。那些优秀的结构设计带来的极大的平衡性。Nginx 的用武之地
Nginx 是一款自由的、开放源码的、高效能的 HTTP 伺服器和反向代理伺服器;同时也是一个 IMAP、POP3、SMTP 代理伺服器。
Nginx 可以做为一个 HTTP 伺服器进行网站的发布处理,另外 Nginx 可以作为反向代理进行负载均衡的实现。
关于代理
说到代理,首先我们要明确一个概念,所谓代理就是一个代表、一个渠道;此时就涉及到两个角色,一个是被代理角色,一个是目标角色。
被代理角色通过这个代理出访目标角色完成一些任务的过程称为代理操作过程;如同生活中的专卖店,客人到 adidas 专卖店买了一双鞋,这个专卖店就是代理,被代理角色就是 adidas 厂家,目标角色就是采用者。
正向代理
说反向代理之前,我们先看看正向代理,正向代理也是我们最常接触到的代理模式,我们会从两个方面来说关于正向代理的处理模式,分别从软件方面和生活方面来解释一下什么叫正向代理。
在如今的网络自然环境下,我们如果由于技术需要要去出访国外的某些网站,此时你会发现位于国外的某网站我们通过浏览器是没有办法出访的。
此时我们可能都会用一个操作 FQ 进行出访,FQ 的方式主要是找到一个可以出访国外网站的代理伺服器,我们将允诺发送给代理伺服器,代理服务器去出访国外的网站,然后将出访到的数据传递给我们!
上述这样的代理模式称为正向代理,正向代理最大的特征是客户端非常明确要出访的伺服器地址;伺服器只清楚允诺源自哪个代理伺服器,而不清楚源自哪个具体的客户端;正向代理模式屏蔽或是隐藏了真实客户端信息。
来看个示意图(我把客户端和正向代理框在一块,同属于一个自然环境,后面我有介绍):
客户端必须设置正向代理伺服器,当然前提是要知道正向代理伺服器的 IP 地址,还有代理程序的端口。
如下图:
总结来说:正向代理,”它代理的是客户端”,是一个位于客户端和原始伺服器(Origin Server)之间的伺服器,为了从原始伺服器取得内容,客户端向代理发送一个允诺并指定目标(原始伺服器)。
然后代理向原始伺服器转交允诺并将获得的内容返回给客户端。客户端必须要进行一些特别的设置才能采用正向代理。
正向代理的用途:
出访原来无法出访的天然资源,如 Google。可以做缓存,加速出访天然资源。对客户端出访授权,上网进行认证。代理可以记录采用者出访记录(上网行为管理),对外隐藏采用者信息。反向代理
明白了什么是正向代理,我们继续看关于反向代理的处理方式,举比如我国的某宝网站,每天同时连接到网站的出访人数已经爆表,单个伺服器相比之下不能满足人民日益增长的购买欲望了。
此时就出现了一个我们耳熟能详的名词:分布式部署;也就是通过部署多台伺服器来解决出访人数限制的问题。
某宝网站中大部分功能也是直接采用 Nginx 进行反向代理实现的,因此通过封装 Nginx 和其他的组件之后起了个高大上的名字:Tengine。
有兴趣的童鞋可以出访 Tengine 的官网查看具体的信息:
http://tengine.taobao.org/所以反向代理具体是通过什么样的方式实现的分布式的集群操作呢,我们先看一个示意图(我把伺服器和反向代理框在一块,同属于一个自然环境,后面我有介绍):
通过上述的图解我们就可以看清楚了,多个客户端给伺服器发送的允诺,Nginx 伺服器接收到之后,按照很大的规则分发给了后端的业务处理伺服器进行处理了。
扮演的就是一个反向代理角色。
客户端是无感知代理的存在的,反向代理对外都是透明的,出访者并不知道自己出访的是一个代理。因为客户端不需要任何配置就可以出访。
反向代理,”它代理的是服务端”,主要用于伺服器集群分布式部署的情况下,反向代理隐藏了伺服器的信息。
反向代理的作用:
保证内网的安全,通常将反向代理做为公网出访地址,Web 伺服器是内网。负载均衡,通过反向代理伺服器来优化网站的负载。项目场景
通常情况下,我们在实际项目操作时,正向代理和反向代理很有可能会存在同一个应用场景中,正向代理代理客户端的允诺去出访目标伺服器,目标伺服器是一个反向单利伺服器,反向代理了多台真实的业务处理伺服器。
具体的拓扑图如下:
截了一张图来说明正向代理和反向代理二者之间的区别,如下图:
图解:
在正向代理中,Proxy 和 Client 同属于一个 LAN(图中方框内),隐藏了客户端信息。在反向代理中,Proxy 和 Server 同属于一个 LAN(图中方框内),隐藏了服务端信息。实际上,Proxy 在两种代理中做的事情都是替伺服器代为收发允诺和响应,不过从结构上看正好左右互换了一下,所以把后出现的那种代理方式称为反向代理了。
负载均衡
我们已经明确了所谓代理伺服器的概念,所以接下来,Nginx 扮演了反向代理伺服器的角色,它是依照什么样的规则进行允诺分发的呢?不用的项目应用场景,分发的规则是否可以控制呢?
这里提到的客户端发送的、Nginx 反向代理伺服器接收到的允诺数量,就是我们说的负载量。
允诺数量按照很大的规则进行分发,到不同的伺服器处理的规则,就是一种均衡规则。
所以将伺服器接收到的允诺按照规则分发的过程,称为负载均衡。
负载均衡在实际项目操作过程中,有硬件负载均衡和软件负载均衡两种,硬件负载均衡也称为硬负载,如 F5 负载均衡,相对造价昂贵成本较高。
但是数据的平衡性安全性之类有非常好的保障,如中国移动中国联通这样的公司才会选择硬负载进行操作。
更多的公司考虑到成本原因,会选择采用软件负载均衡,软件负载均衡是利用现有的技术结合主机硬件实现的一种消息队列分发机制。
Nginx 全力支持的负载均衡调度算法方式如下:
①weight 轮询(默认):接收到的允诺按照顺序逐一分配到不同的后端伺服器,即使在采用过程中,某一台后端伺服器宕机,Nginx 会自动将该伺服器剔除出队列,允诺受理情况不会受任何影响。
这种方式下,可以给不同的后端伺服器设置一个权重值(weight),用于调整不同的伺服器上允诺的分配率。
权重数据越大,被分配到允诺的几率越大;该权重值,主要是针对实际工作自然环境中不同的后端伺服器硬件配置进行调整的。
②ip_hash:每个允诺按照发起客户端的 ip 的 hash 结果进行匹配,这样的算法下一个固定 ip 地址的客户端总会出访到同一个后端伺服器,这也在很大程度上解决了集群部署自然环境下 Session 共享的问题。
③fair:智能调整调度算法,动态的根据后端伺服器的允诺处理到响应的时间进行均衡分配。
响应时间短处理效率高的伺服器分配到允诺的概率高,响应时间长处理效率低的伺服器分配到的允诺少,它是结合了前两者的缺点的一种调度算法。
但是需要注意的是 Nginx 默认不全力支持 fair 算法,如果要采用这种调度算法,请安装 upstream_fair 模块。
④url_hash:按照出访的 URL 的 hash 结果分配允诺,每个允诺的 URL 会指向后端固定的某个伺服器,可以在 Nginx 做为静态伺服器的情况下提高缓存效率。
同样要注意 Nginx 默认不全力支持这种调度算法,要采用的话需要安装 Nginx 的 hash 软件包。
Web 伺服器对比
几种常用 Web 伺服器对比如下图: