大型分布式網站建設注意事項
2019.04.04
大型分布式網站建設要結合以下的方麵進行;
1,大型分布式網站架構技術
大型網站的特點
大型網站一般有如下特點:
用戶多,分布廣泛,大流量,高並, 海量數據,服務高可用,安全環境惡劣,易受網絡攻擊
功能多,變更快,頻繁發布,從小到大,漸進發展, 以用戶為中心,免費服務,付費體驗
2,大型網站架構目標
大型網站的架構目標有如下幾個:
高性能:提供快速的訪問體驗。高可用:網站服務一直可以正常訪問。
可伸縮:通過硬件增加/減少,提高/降低處理能力。 擴展性:方便地通過新增/移除方式,增加/減少新的功能/模塊。 安全性:提供網站安全訪問和數據加密、安全存儲等策略。
敏捷性:隨需應變,快速響應。

3,大型網站架構模式
大型網站的架構模式:
分層:一般可分為應用層、服務層、數據層、管理層與分析層。
分割:一般按照業務/模塊/功能特點進行劃分,比如應用層分為首頁、用戶中心。
分布式:將應用分開部署(比如多台物理機),通過遠程調用協同工作。
集群:一個應用/模塊/功能部署多份(如:多台物理機),通過負載均衡共同提供對外訪問。
緩存:將數據放在距離應用或用戶最近的位置,加快訪問速度。
異步:將同步的操作異步化。客戶端發出請求,不等待服務端響應,等服務端處理完畢後,使用通知或輪詢的方式告知請求方。一般指:請求——響應——通知模式。
冗餘:增加副本,提高可用性、安全性與性能。
安全:對已知問題有有效的解決方案,對未知/潛在問題建立發現和防禦機製。
自動化:將重複的、不需要人工參與的事情,通過工具的方式,使用機器完成。
敏捷性:積極接受需求變更,快速響應業務發展需求。
4,高性能架構
高性能的架構是以用戶為中心,提供快速的網頁訪問體驗,主要參數有較短的響應時間、較大的並發處理能力、較高的吞吐量與穩定的性能參數。
可分為前端優化、瀏覽器優化、應用層優化、代碼層優化與存儲層優化:
前端優化:網站業務邏輯之前的部分。
瀏覽器優化:減少 HTTP 請求數,使用瀏覽器緩存,啟用壓縮,CSS JS 位置,JS 異步,減少 Cookie 傳輸;CDN 加速,反向代理。
應用層優化:處理網站業務的服務器。使用緩存,異步,集群。
代碼優化:合理的架構,多線程,資源複用(對象池,線程池等),良好的數據結構,JVM調優,單例,Cache 等。
存儲優化:緩存、固態硬盤、光纖傳輸、優化讀寫、磁盤冗餘、分布式存儲(HDFS)、NoSQL 等。
5,高可用架構
大(da)型(xing)網(wang)站(zhan)應(ying)該(gai)在(zai)任(ren)何(he)時(shi)候(hou)都(dou)可(ke)以(yi)正(zheng)常(chang)訪(fang)問(wen),正(zheng)常(chang)提(ti)供(gong)對(dui)外(wai)服(fu)務(wu)。因(yin)為(wei)大(da)型(xing)網(wang)站(zhan)的(de)複(fu)雜(za)性(xing),分(fen)布(bu)式(shi),廉(lian)價(jia)服(fu)務(wu)器(qi),開(kai)源(yuan)數(shu)據(ju)庫(ku),操(cao)作(zuo)係(xi)統(tong)等(deng)特(te)點(dian),要(yao)保(bao)證(zheng)高(gao)可(ke)用(yong)是(shi)很(hen)困(kun)難(nan)的(de),也(ye)就(jiu)是(shi)說(shuo)網(wang)站(zhan)的(de)故(gu)障(zhang)是(shi)不(bu)可(ke)避(bi)免(mian)的(de)。
如何提高可用性,就是需要迫切解決的問題。首先,需要從架構級別考慮,在規劃的時候,就考慮可用性。
行業內一般用幾個 9 表示可用性指標,比如四個 9(99.99),一年內允許的不可用時間是 53 分鍾。
不同層級使用的策略不同,一般采用冗餘備份和失效轉移解決高可用問題:
應用層:一般設計為無狀態的,對於每次請求,使用哪一台服務器處理是沒有影響的。一般使用負載均衡技術(需要解決 Session 同步問題)實現高可用。
服務層:負載均衡,分級管理,快速失敗(超時設置),異步調用,服務降級,冪等設計等。
數據層:冗餘備份(冷,熱備[同步,異步],溫備),失效轉移(確認,轉移,恢複)。數據高可用方麵著名的理論基礎是 CAP 理論。(持久性,可用性,數據一致性[強一致,用戶一致,最終一致])
6,可伸縮架構
伸縮性是指在不改變原有架構設計的基礎上,通過添加/減少硬件(服務器)的方式,提高/降低係統的處理能力:
應用層:對應用進行垂直或水平切分。然後針對單一功能進行負載均衡(DNS、HTTP[反向代理]、IP、鏈路層)。
服務層:與應用層類似。
數據層:分庫、分表、NoSQL 等;常用算法 Hash,一致性 Hash。
7,可擴展架構
可以方便地進行功能模塊的新增/移除,提供代碼/模塊級別良好的可擴展性:
模塊化,組件化:高內聚,低耦合,提高複用性,擴展性。
穩定接口:定義穩定的接口,在接口不變的情況下,內部結構可以“隨意”變化。
設計模式:應用麵向對象思想,原則,使用設計模式,進行代碼層麵的設計。
消息隊列:模塊化的係統,通過消息隊列進行交互,使模塊之間的依賴解耦。
分布式服務:公用模塊服務化,提供其他係統使用,提高可重用性,擴展性。
8,安全架構
對已知問題有有效的解決方案,對未知/潛在問題建立發現和防禦機製。對於安全問題,首先要提高安全意識,建立一個安全的有效機製,從政策層麵,組織層麵進行保障。
比如服務器密碼不能泄露,密碼每月更新,並且三次內不能重複;每周安全掃描等。
以製度化的方式,加強安全體係的建設。同時,需要注意與安全有關的各個環節。
安全問題不容忽視,包括基礎設施安全,應用係統安全,數據保密安全等:
基礎設施安全:硬(ying)件(jian)采(cai)購(gou),操(cao)作(zuo)係(xi)統(tong),網(wang)絡(luo)環(huan)境(jing)方(fang)麵(mian)的(de)安(an)全(quan)。一(yi)般(ban)采(cai)用(yong)正(zheng)規(gui)渠(qu)道(dao)購(gou)買(mai)高(gao)質(zhi)量(liang)的(de)產(chan)品(pin),選(xuan)擇(ze)安(an)全(quan)的(de)操(cao)作(zuo)係(xi)統(tong),及(ji)時(shi)修(xiu)補(bu)漏(lou)洞(dong),安(an)裝(zhuang)殺(sha)毒(du)軟(ruan)件(jian)防(fang)火(huo)牆(qiang)。
防範病毒,後門。設置防火牆策略,建立 DDOS 防禦係統,使用攻擊檢測係統,進行子網隔離等手段。
應用係統安全:在程序開發時,對已知常用問題,使用正確的方式,在代碼層麵解決掉。
防止跨站腳本攻擊(XSS),注入攻擊,跨站請求偽造(CSRF),錯誤信息,HTML 注釋,文件上傳,路徑遍曆等。
還可以使用 Web 應用防火牆(比如:ModSecurity),進行安全漏洞掃描等措施,加強應用級別的安全。
數據保密安全:存儲安全(存儲在可靠的設備,實時,定時備份),保存安全(重要的信息加密保存,選擇合適的人員複雜保存和檢測等),傳輸安全(防止數據竊取和數據篡改)。
常用的加解密算法(單項散列加密[MD5、SHA],對稱加密[DES、3DES、RC]),非對稱加密[RSA]等。
9,敏捷性
網站的架構設計,運維管理要適應變化,提供高伸縮性,高擴展性。方便的應對快速的業務發展,突增高流量訪問等要求。
除上麵介紹的架構要素外,還需要引入敏捷管理,敏捷開發的思想。使業務,產品,技術,運維統一起來,隨需應變,快速響應。












