我們都知道,當(dāng)今的時(shí)代是一個(gè)新技術(shù)蓬勃發(fā)展的時(shí)代;大數(shù)據(jù)、云計(jì)算、移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)……作為應(yīng)用服務(wù)開(kāi)發(fā)者的我們,有了很多很好的選擇;我們的傳統(tǒng)的應(yīng)用基礎(chǔ)架構(gòu)也開(kāi)始向云端遷移;我們看一下,現(xiàn)在企業(yè)應(yīng)用IT架構(gòu)是什么樣?
很典型,從用戶(hù)一直到硬件,很立體的六個(gè)層面,從用戶(hù)到CDN,到防護(hù)墻,防護(hù)墻內(nèi)有一堆的服務(wù)器,跑的是你的代碼,還有一堆的硬盤(pán)做數(shù)據(jù)存儲(chǔ),這是咱們傳統(tǒng)企業(yè)的應(yīng)用架構(gòu)。到了云的時(shí)代,因?yàn)槲乙v的是云時(shí)代的APM,架構(gòu)就變成這樣了,后端防火墻的一些東西都隱化了,到了云時(shí)代背后的一般都變成一種資源,包括網(wǎng)絡(luò),可能很多人也不一定知道,網(wǎng)絡(luò)怎么把它變成一種資源,有一種技術(shù)叫SDN,把所有東西變成資源以后在云上我們看到的情況會(huì)很不一樣。到了云的時(shí)代,很多東西都在云上,為什么會(huì)發(fā)生這樣的變化呢?
既然是一種技術(shù)趨勢(shì)上升帶來(lái)的變化,肯定是有很多的好處;就拿青云的服務(wù)為例,給我們技術(shù)部門(mén)有哪些幫助呢?
秒級(jí)調(diào)度 所有計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)資源都是秒級(jí)響應(yīng)。如果初始資源不夠用,可以彈性擴(kuò)展伸縮。不需要的資源可以隨時(shí)銷(xiāo)毀。隨需應(yīng)變,無(wú)需等待。
按秒計(jì)費(fèi),最大限度降低總擁有成本 因?yàn)榍嘣频馁Y源可在秒級(jí)創(chuàng)建和銷(xiāo)毀,為了鼓勵(lì)大家按需使用資源,我們?cè)谟?jì)費(fèi)上只根據(jù)您實(shí)際使用的時(shí)長(zhǎng)收費(fèi),并精確到秒。讓您可以隨時(shí)調(diào)整業(yè)務(wù)規(guī)模,無(wú)需考慮計(jì)費(fèi)周期的限制。
私有云,搭建屬于自己的私有云環(huán)境 通過(guò) SDN 實(shí)現(xiàn)的虛擬路由器和交換機(jī),您可以快速搭建屬于自己的私有云環(huán)境,并提供 100% 的網(wǎng)絡(luò)隔離,確保安全。還能與現(xiàn)有的計(jì)算環(huán)境通過(guò)安全隧道連接,形成公私兼顧的混合云(hybrid cloud)。
最大程度保障您的數(shù)據(jù)安全 私有網(wǎng)絡(luò)提供100%二層隔離,在這個(gè)環(huán)境里,你的內(nèi)部數(shù)據(jù)是非常安全的,黑客無(wú)法嗅探或者截獲到你的數(shù)據(jù)。多重實(shí)時(shí)副本和備份可以保障即使在物理硬件徹底損壞時(shí),數(shù)據(jù)也不會(huì)丟失,并且可以很快恢復(fù)業(yè)務(wù)。都用云了,是不是就不用擔(dān)心我們的業(yè)務(wù)系統(tǒng)了呢?一切就完美了嗎? 我們的業(yè)務(wù)一定能向我們期望的那樣,快速,穩(wěn)健增長(zhǎng)嗎?
我們可以從另外一個(gè)角度來(lái)思考這個(gè)問(wèn)題;不知道什么時(shí)候開(kāi)始,我們都聽(tīng)過(guò)“用戶(hù)體驗(yàn)”這個(gè)名稱(chēng);什么是用戶(hù)體驗(yàn)?zāi)兀?/span>
百度里是這樣解釋的:用戶(hù)使用產(chǎn)品和服務(wù)過(guò)程中建立起來(lái)的純主觀(guān)感受;
那么這種純主觀(guān)感受實(shí)際上包含很多的要素;比如說(shuō)漂亮的視覺(jué)設(shè)計(jì)、貼心專(zhuān)業(yè)的服務(wù)、快速的用戶(hù)響應(yīng)、極致簡(jiǎn)潔的交互界面等等。
可想而知,上面的這些要素都會(huì)影響到用戶(hù)的純主觀(guān)感受,那其實(shí)我們今天還要分享一個(gè)要素,就是性能;當(dāng)然性能這塊,有很多的數(shù)據(jù),比如說(shuō)網(wǎng)絡(luò)延遲每增加0.4秒,亞馬遜每年將損失16億美元,性能每減少0.4秒,雅虎訪(fǎng)問(wèn)量就會(huì)增加9%,還有移動(dòng)App里面非常經(jīng)典的五秒鐘定律;如果你的App應(yīng)用的響應(yīng)時(shí)間大于5秒鐘;那么50%移動(dòng)應(yīng)用用戶(hù)會(huì)放棄,30%用戶(hù)會(huì)卸載,33%失望的用戶(hù)會(huì)轉(zhuǎn)向競(jìng)爭(zhēng)對(duì)手的應(yīng)用。
所以小米的雷軍也在說(shuō)一句比較經(jīng)典的話(huà):拋開(kāi)性能談體驗(yàn),都是耍流氓。
當(dāng)然他說(shuō)這句話(huà)時(shí)候是在小米手機(jī)發(fā)布會(huì)上針對(duì)手機(jī)跑分是這樣,針對(duì)我們線(xiàn)上的業(yè)務(wù)系統(tǒng)實(shí)際上也完全適用;我們不禁思考,為什么性能這樣重要呢?
很簡(jiǎn)單,性能影響用戶(hù)體驗(yàn),用戶(hù)體驗(yàn)影響的是我們的業(yè)務(wù)營(yíng)收,業(yè)務(wù)營(yíng)收就是白花花的金錢(qián);所以這個(gè)等式就成立了,即我們的系統(tǒng)性能就等于金錢(qián)!既然和錢(qián)有關(guān)系,我們當(dāng)然要很好的解決掉。
那我們說(shuō)了這么的性能,對(duì)于性能我們應(yīng)該如何理解呢?
實(shí)際上云智慧對(duì)性能的抽象理解很簡(jiǎn)單,只有兩點(diǎn):
第一個(gè)挑戰(zhàn)是業(yè)務(wù)中斷,確實(shí)對(duì)企業(yè)來(lái)說(shuō)這是最大的挑戰(zhàn),業(yè)務(wù)中斷有再多的用戶(hù)沒(méi)用。所以對(duì)企業(yè)來(lái)講,業(yè)務(wù)是永遠(yuǎn)不能斷的。
第二個(gè)挑戰(zhàn)是什么?性能緩慢,我們回想中國(guó)GDP增長(zhǎng)曲線(xiàn),從1978年的3650到2014年的636463,保持平均每年8%的快速增長(zhǎng),經(jīng)濟(jì)發(fā)展速度是相當(dāng)?shù)目臁V袊?guó)經(jīng)濟(jì)的發(fā)展不能慢,為什么?慢了掙錢(qián)就少了,掙錢(qián)少了中國(guó)經(jīng)濟(jì)就要崩潰陷入中等收入陷阱,我們也不能慢,慢了說(shuō)明用戶(hù)要跑了,錢(qián)也就沒(méi)了,企業(yè)也就發(fā)展不了,所以天下武功唯快不破。慢代表什么?慢代表性能,性能的好和壞。所以說(shuō)對(duì)于在線(xiàn)提供產(chǎn)品和服務(wù)的我們,性能就代表一切!
那我們也在思考,性能影響是通過(guò)什么表達(dá)給我們;響應(yīng)時(shí)間、吞吐率、延遲、丟包率、慢查詢(xún)、代碼堆棧、崩潰率等等——這是一大堆技術(shù)參數(shù),很難理解;而恰恰,我們的IT系統(tǒng)運(yùn)行產(chǎn)生的指標(biāo)都是很數(shù)據(jù)化的;傳統(tǒng)做APM的方法做到了一定層面的數(shù)據(jù)可視化,但是對(duì)解決問(wèn)題實(shí)際的用戶(hù)體驗(yàn)問(wèn)題我覺(jué)得還不夠直觀(guān),為什么?
其實(shí)我們最期望看到的是,用戶(hù)在做什么的時(shí)候怎么樣了?每一個(gè)他在下單的時(shí)候是開(kāi)懷大笑還是憤怒無(wú)邊?而這一切,通過(guò)用戶(hù)行為性能分析的層面,我們是能夠做的。
當(dāng)我們的身體出現(xiàn)問(wèn)題時(shí),只有CT才能在幾分鐘內(nèi)給患者完成從頭到腳的全身掃描,從而準(zhǔn)確發(fā)現(xiàn)病灶,為后續(xù)的治療提供準(zhǔn)確的依據(jù)。
今天的互聯(lián)網(wǎng)就像人體一樣強(qiáng)大而復(fù)雜,一款看似簡(jiǎn)單的網(wǎng)絡(luò)應(yīng)用,需要服務(wù)器、存儲(chǔ)、系統(tǒng)、應(yīng)用環(huán)境、網(wǎng)絡(luò)和用戶(hù)電腦/手機(jī)設(shè)備的一系列支持,才能順暢運(yùn)行。當(dāng)應(yīng)用發(fā)生故障時(shí),比如用戶(hù)無(wú)法登錄、頁(yè)面打不開(kāi)、搜索沒(méi)結(jié)果,誰(shuí)來(lái)幫助我們快速而準(zhǔn)確的定位應(yīng)用的問(wèn)題?
APM就像是部署在互聯(lián)網(wǎng)上的CT掃描設(shè)備,通過(guò)SDK采集用戶(hù)端數(shù)據(jù),通過(guò)監(jiān)控點(diǎn)采集網(wǎng)絡(luò)數(shù)據(jù),通過(guò)探針采集服務(wù)器上各種軟硬件環(huán)境數(shù)據(jù),然后利用大數(shù)據(jù)技術(shù)把采集到的數(shù)據(jù)進(jìn)行快速診斷分析,發(fā)現(xiàn)影響應(yīng)用性能的“病灶”,并給出診斷建議。
參考和分析市場(chǎng)上國(guó)內(nèi)外的應(yīng)用性能管理的解決方案;云智慧首創(chuàng)面向業(yè)務(wù)的基于用戶(hù)行為性能的方法;這是基于真實(shí)的用戶(hù)行為角度來(lái)分析應(yīng)用的性能表現(xiàn);分析的維度包括行為的維度和用戶(hù)的維度。
行為的維度,是從影響業(yè)務(wù)的各種行為入手來(lái)分析行為背后的影響;比如有一個(gè)行為叫“支付”,在一段時(shí)間內(nèi),有1000人支付,其中有400人因?yàn)樾阅軉?wèn)題受到了影響;他們沒(méi)有支付成功,那么這400人就給業(yè)務(wù)造成了很大的影響,平均每個(gè)人100元的支付額,那就是40000元的業(yè)務(wù)損失;接下來(lái)我們分析400人中有多少人是因?yàn)榍岸说腃rash問(wèn)題,可能有150人,我們接下來(lái)再分析這150人都用什么樣的手機(jī),系統(tǒng),運(yùn)營(yíng)商,這樣一步步有助于我們定位問(wèn)題;也可能有250人是因?yàn)楹蠖说姆?wù)質(zhì)量問(wèn)題造成影響,體現(xiàn)在加載緩慢上,那么我們可以分析后端的各種服務(wù)服的質(zhì)量。
我們還原一個(gè)需求的場(chǎng)景;有一天突然有個(gè)用戶(hù)投訴支付緩慢,支付不成功;這個(gè)時(shí)候我們技術(shù)部門(mén)如何快速定位到這個(gè)用戶(hù)的問(wèn)題,當(dāng)時(shí)的歷史快照是什么?目前沒(méi)有很好的辦法;用透視寶的用戶(hù)分析,我們可以定位到系統(tǒng)的每個(gè)用戶(hù)的每次操作的性能問(wèn)題上;簡(jiǎn)單的搜索就可以查到當(dāng)時(shí)這個(gè)用戶(hù)操作時(shí)發(fā)生了什么,包括前端和后端的整體記錄都可以定位到;
另外有的時(shí)候我們也關(guān)心一類(lèi)用戶(hù)的問(wèn)題,比如說(shuō)某個(gè)區(qū)域的聯(lián)通運(yùn)營(yíng)商用戶(hù),比如都用了某款國(guó)產(chǎn)手機(jī);通過(guò)透視寶的用戶(hù)篩選功能,我們可以針對(duì)特定人群進(jìn)行問(wèn)題分析,快速找到這類(lèi)瓶頸。
真正的端到端應(yīng)該是從用戶(hù)端到后端的物理服務(wù)器以及代碼端的完整穿透;
而且應(yīng)該是基于細(xì)化到每個(gè)用戶(hù)的每個(gè)真實(shí)行為操作層面來(lái)看待;
化到每個(gè)操作層面的端到端,讓深入定位問(wèn)題有了可能;通過(guò)標(biāo)記在每個(gè)行為操作上的Unique ID,透視寶將整個(gè)操作背后所有相關(guān)環(huán)節(jié)“拍照”;這樣非常有助于我們真實(shí)還原問(wèn)題細(xì)節(jié);
透視寶能夠幫助運(yùn)營(yíng)人員實(shí)時(shí)分析業(yè)務(wù),明確業(yè)務(wù)性能問(wèn)題以快速適應(yīng)市場(chǎng)變化;幫助開(kāi)發(fā)人員基于問(wèn)題事件定位架構(gòu)及代碼瓶頸,以實(shí)現(xiàn)快速構(gòu)建及改進(jìn)持續(xù)交付;提供端到端全技術(shù)棧監(jiān)控,幫助運(yùn)維人員快速定位、預(yù)測(cè)IT系統(tǒng)問(wèn)題,確保運(yùn)維SLA與服務(wù)質(zhì)量;面向管理層,提供多維報(bào)告與數(shù)據(jù)決策支持,幫助企業(yè)實(shí)現(xiàn)用戶(hù)滿(mǎn)意度及運(yùn)營(yíng)效率持續(xù)提升、企業(yè)營(yíng)收不斷提高。