• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    神威太湖之光可靠性及可用性設(shè)計(jì)與分析

    2021-12-14 11:32:46高劍剛龔道永方燕飛何王全金利峰李宏亮
    計(jì)算機(jī)研究與發(fā)展 2021年12期
    關(guān)鍵詞:神威超級(jí)計(jì)算機(jī)可用性

    高劍剛 胡 晉 龔道永 方燕飛 劉 驍 何王全 金利峰 鄭 方 李宏亮

    (國(guó)家并行計(jì)算機(jī)工程技術(shù)研究中心 北京 100190)

    過(guò)去數(shù)十年,隨著半導(dǎo)體集成電路工藝與系統(tǒng)規(guī)模的不斷提升,高性能計(jì)算機(jī)計(jì)算性能得到了快速的發(fā)展.當(dāng)前,為了滿足氣象、生命科學(xué)、高能核物理等大規(guī)??茖W(xué)應(yīng)用對(duì)計(jì)算能力的超高需求,E級(jí)計(jì)算(1000PFLOPS)已成為高性能計(jì)算領(lǐng)域的下一個(gè)研制目標(biāo).然而,由于系統(tǒng)規(guī)模與復(fù)雜度的不斷增加,故障失效成為超級(jí)計(jì)算機(jī)系統(tǒng)運(yùn)行過(guò)程中的普遍事件,當(dāng)系統(tǒng)性能由P級(jí)(PFLOPS)向E級(jí)擴(kuò)展時(shí),系統(tǒng)保存全局檢查點(diǎn)的時(shí)間可能達(dá)到甚至超過(guò)系統(tǒng)的平均無(wú)故障時(shí)間(mean time between failures, MTBF)[1],可靠性墻[2]正成為構(gòu)建E級(jí)計(jì)算機(jī)系統(tǒng)所面臨的一項(xiàng)巨大挑戰(zhàn).

    可靠性是指系統(tǒng)在規(guī)定的條件和規(guī)定的時(shí)間內(nèi),完成系統(tǒng)功能的能力,而可用性是指系統(tǒng)在規(guī)定的條件和時(shí)間區(qū)間內(nèi)處于可執(zhí)行規(guī)定功能狀態(tài)的能力,是可靠性和維修性的綜合體現(xiàn).超級(jí)計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)復(fù)雜、規(guī)模龐大,可靠性與可用性問(wèn)題日益嚴(yán)峻,必須研究采用可靠性增強(qiáng)技術(shù),提高系統(tǒng)基礎(chǔ)可靠性,同時(shí)必須有效采用故障容錯(cuò)技術(shù),提高系統(tǒng)在頻繁故障環(huán)境下的運(yùn)行效率,破解高性能計(jì)算機(jī)系統(tǒng)高可用難題.

    神威太湖之光是世界首臺(tái)性能超過(guò)10億億次并行規(guī)模超千萬(wàn)核的超級(jí)計(jì)算機(jī).本文對(duì)神威太湖之光超級(jí)計(jì)算機(jī)系統(tǒng)可靠性與可用性進(jìn)行全面的研究,分析高性能計(jì)算機(jī)失效特性與故障容錯(cuò)技術(shù),對(duì)于未來(lái)E級(jí)計(jì)算機(jī)系統(tǒng)高可靠與高可用設(shè)計(jì)具有重要的意義.

    本文的主要貢獻(xiàn)有3個(gè)方面:

    1)系統(tǒng)提出神威太湖之光超級(jí)計(jì)算機(jī)可靠性增強(qiáng)技術(shù),結(jié)合3種典型壽命周期分布,對(duì)系統(tǒng)故障間隔時(shí)間分布進(jìn)行數(shù)據(jù)擬合分析,建立神威太湖之光超級(jí)計(jì)算機(jī)失效分布模型,計(jì)算系統(tǒng)平均無(wú)故障時(shí)間;

    2)設(shè)計(jì)提出故障預(yù)測(cè)、主動(dòng)遷移與任務(wù)局部降級(jí)主被動(dòng)容錯(cuò)技術(shù),建立神威太湖之光超級(jí)計(jì)算機(jī)多層次主被動(dòng)統(tǒng)一、軟硬件協(xié)同的容錯(cuò)系統(tǒng),結(jié)合系統(tǒng)應(yīng)用課題,具體分析多種容錯(cuò)技術(shù)的時(shí)間開(kāi)銷(xiāo)與容錯(cuò)效果;

    3)以神威太湖之光超級(jí)計(jì)算機(jī)系統(tǒng)可靠性與可用性研究分析為基礎(chǔ),提出未來(lái)E級(jí)計(jì)算機(jī)系統(tǒng)高可靠與高可用技術(shù)發(fā)展建議.

    本文首先介紹高性能計(jì)算機(jī)系統(tǒng)可靠性與可用性研究領(lǐng)域相關(guān)工作,并概要描述神威太湖之光超級(jí)計(jì)算機(jī)系統(tǒng)結(jié)構(gòu);隨后系統(tǒng)提出神威太湖之光超級(jí)計(jì)算機(jī)可靠性增強(qiáng)技術(shù)與主被動(dòng)容錯(cuò)技術(shù),建立神威太湖之光系統(tǒng)多層次主被動(dòng)統(tǒng)一、軟硬件協(xié)同的容錯(cuò)系統(tǒng);通過(guò)系統(tǒng)運(yùn)行故障統(tǒng)計(jì)與實(shí)際應(yīng)用測(cè)試,建立系統(tǒng)失效分布模型,計(jì)算系統(tǒng)平均無(wú)故障時(shí)間,分析多種容錯(cuò)技術(shù)的時(shí)間開(kāi)銷(xiāo)及容錯(cuò)效果;進(jìn)一步以此為基礎(chǔ),提出E級(jí)計(jì)算機(jī)系統(tǒng)高可靠與高可用技術(shù)發(fā)展建議,最后總結(jié)全文并提出后續(xù)工作方向.

    1 相關(guān)工作

    1.1 可靠性技術(shù)

    為了提高高性能計(jì)算機(jī)系統(tǒng)的可靠性,業(yè)界研究采用了多種可靠性增強(qiáng)技術(shù).Summit,Sierra超級(jí)計(jì)算機(jī)InfiniBand高速網(wǎng)絡(luò)通過(guò)自適應(yīng)路由、冗余設(shè)計(jì)等技術(shù),提升互連網(wǎng)絡(luò)系統(tǒng)的可靠性[3].IBM Power處理器芯片設(shè)計(jì)支持指令重試恢復(fù)(instruction retry recovery, IRR)[4],通過(guò)定義狀態(tài)檢查點(diǎn),提供寄存器錯(cuò)誤恢復(fù)功能.糾錯(cuò)碼(error correcting code, ECC)是一種信息冗余技術(shù),通過(guò)附加冗余數(shù)據(jù)信息,實(shí)現(xiàn)錯(cuò)誤檢測(cè)與糾正.Cray XC系統(tǒng)Aries網(wǎng)絡(luò)芯片采用ECC與循環(huán)冗余碼(cyclic redundancy code, CRC),實(shí)現(xiàn)數(shù)據(jù)路徑有效防護(hù)[5].此外,硬件冗余設(shè)計(jì)也是高性能計(jì)算機(jī)系統(tǒng)提高可靠性的常用技術(shù),例如IBM Z系列服務(wù)器主機(jī)設(shè)計(jì)2套時(shí)鐘卡用于冗余備份[6],當(dāng)主卡發(fā)生故障時(shí),時(shí)鐘源可以動(dòng)態(tài)切換至從卡.超級(jí)計(jì)算機(jī)系統(tǒng)規(guī)模龐大,特別是計(jì)算節(jié)點(diǎn)與存儲(chǔ)系統(tǒng)器件數(shù)量顯著增加,對(duì)系統(tǒng)可靠性設(shè)計(jì)提出嚴(yán)峻挑戰(zhàn).本文結(jié)合神威太湖之光超級(jí)計(jì)算機(jī)組成結(jié)構(gòu),系統(tǒng)提出神威太湖之光系統(tǒng)可靠性增強(qiáng)技術(shù).

    在可靠性分析方面,高性能計(jì)算機(jī)系統(tǒng)失效特性分析得到了業(yè)界廣泛關(guān)注.文獻(xiàn)[7]總結(jié)了高性能計(jì)算機(jī)不同系統(tǒng)組件的失效類(lèi)型并提供了系統(tǒng)整體失效率.文獻(xiàn)[8]分析了2臺(tái)典型P級(jí)超級(jí)計(jì)算機(jī)的故障來(lái)源及失效特性;文獻(xiàn)[9]則分析了異構(gòu)服務(wù)器系統(tǒng)失效經(jīng)驗(yàn)數(shù)據(jù)與統(tǒng)計(jì)特性;可靠性、可用性與可維護(hù)性(reliability availability serviceability, RAS)日志通常是記錄系統(tǒng)故障事件的主要來(lái)源,有大量文獻(xiàn)[10-13]基于RAS日志對(duì)Blue Gene P/L等高性能計(jì)算機(jī)系統(tǒng)開(kāi)展失效特性分析.RAS日志往往包含大量冗余信息,需要結(jié)合過(guò)濾算法濾除冗余信息,以便于進(jìn)行后續(xù)失效分析.本文根據(jù)系統(tǒng)故障統(tǒng)計(jì)數(shù)據(jù),開(kāi)展神威太湖之光超級(jí)計(jì)算機(jī)系統(tǒng)失效特性分析,建立神威太湖之光系統(tǒng)失效分布模型.

    1.2 可用性技術(shù)

    為了實(shí)現(xiàn)高性能計(jì)算機(jī)系統(tǒng)高可用目標(biāo),業(yè)界提出了多種不同的故障容錯(cuò)技術(shù).保留恢復(fù)[14-16]是大規(guī)模并行計(jì)算中最常用的容錯(cuò)機(jī)制,通過(guò)狀態(tài)保存和恢復(fù)執(zhí)行進(jìn)行容錯(cuò).Rollback[17]和Rerun[18]則是通過(guò)重新加載和重新執(zhí)行來(lái)進(jìn)行恢復(fù).遷移模型[19-20]通過(guò)透明在線或離線的遷移執(zhí)行來(lái)增強(qiáng)超級(jí)計(jì)算機(jī)的容錯(cuò)能力.雙機(jī)接管[21]是在主設(shè)備無(wú)法工作時(shí)備用設(shè)備自動(dòng)接管系統(tǒng).進(jìn)程冗余[22]通過(guò)作業(yè)內(nèi)的冗余進(jìn)程副本來(lái)實(shí)現(xiàn)局部故障的容錯(cuò).算法容錯(cuò)[23]是通過(guò)增加數(shù)據(jù)編碼或存儲(chǔ)的冗余性來(lái)實(shí)現(xiàn)局部故障的容錯(cuò).各種容錯(cuò)方法都有自己的適用場(chǎng)景和優(yōu)勢(shì),然而,如何將各種手段有機(jī)融合為一體,同時(shí)給出面向具體應(yīng)用場(chǎng)景的特色化容錯(cuò)技術(shù),適時(shí)啟用最佳的容錯(cuò)方法,是一個(gè)需要迫切關(guān)注的焦點(diǎn).為此,本文基于神威太湖之光超級(jí)計(jì)算機(jī)系統(tǒng)開(kāi)展實(shí)用化特色容錯(cuò)技術(shù)的研究,建立了多層次主被動(dòng)協(xié)同容錯(cuò)系統(tǒng),在此基礎(chǔ)上具體分析了故障預(yù)測(cè)、主動(dòng)遷移、任務(wù)局部降級(jí)等容錯(cuò)技術(shù)的實(shí)際開(kāi)銷(xiāo).

    2 系統(tǒng)概述

    神威太湖之光超級(jí)計(jì)算機(jī)是由國(guó)家并行計(jì)算機(jī)工程技術(shù)研究中心于2015年研制完成的1臺(tái)超大規(guī)模并行計(jì)算機(jī).神威太湖之光超級(jí)計(jì)算機(jī)共安裝40 960個(gè)國(guó)產(chǎn)眾核處理器,全機(jī)運(yùn)算核心達(dá)到10 649 600個(gè),主存容量達(dá)到1.3PB,理論峰值計(jì)算性能及Linpack計(jì)算性能分別達(dá)到125.43PFLOPS與93.01PFLOPS.根據(jù)TOP500榜單[24],神威太湖之光于2016—2017年,連續(xù)4次排名世界第一.

    Fig.1 Sunway TaihuLight supercomputer hardware system

    神威太湖之光超級(jí)計(jì)算機(jī)系統(tǒng)包括硬件系統(tǒng)、軟件系統(tǒng)與應(yīng)用系統(tǒng).其中硬件系統(tǒng)由運(yùn)算系統(tǒng)、互連網(wǎng)絡(luò)系統(tǒng)、維護(hù)診斷、外圍存儲(chǔ)、電源及冷卻系統(tǒng)組成,如圖1所示.軟件系統(tǒng)由國(guó)產(chǎn)眾核處理器基礎(chǔ)軟件、并行操作系統(tǒng)環(huán)境、高性能存儲(chǔ)管理系統(tǒng)、并行語(yǔ)言與編譯環(huán)境以及并行開(kāi)發(fā)環(huán)境組成.應(yīng)用系統(tǒng)包括應(yīng)用平臺(tái)基礎(chǔ)框架、行業(yè)應(yīng)用平臺(tái)和典型應(yīng)用軟件.

    神威太湖之光超級(jí)計(jì)算機(jī)基于國(guó)產(chǎn)申威26010處理器構(gòu)建.申威26010是1款異構(gòu)眾核處理器,共包含260個(gè)運(yùn)算核心.申威26010眾核處理器采用片上計(jì)算陣列集群和分布式共享存儲(chǔ)相結(jié)合的異構(gòu)眾核體系結(jié)構(gòu).申威26010眾核處理器集成4個(gè)核組,每個(gè)核組包括運(yùn)算控制核心、運(yùn)算核心陣列和協(xié)議處理部件,其中運(yùn)算控制核心提供管理服務(wù)和計(jì)算功能,運(yùn)算核心陣列采用8×8陣列結(jié)構(gòu),集成64個(gè)運(yùn)算核心,提供主體計(jì)算能力,而協(xié)議處理部件用于處理數(shù)據(jù)一致性問(wèn)題.同時(shí),申威26010眾核處理器還提供DDR3(double data rate generation 3)存儲(chǔ)器接口、PCIE3.0(peripheral component interconnect express generation 3)通信接口、以太網(wǎng)及維護(hù)接口,支持高帶寬存儲(chǔ)訪問(wèn)與數(shù)據(jù)通信[8].

    3 技術(shù)體系

    3.1 總體設(shè)計(jì)方法

    神威太湖之光超級(jí)計(jì)算機(jī)規(guī)模龐大,為實(shí)現(xiàn)系統(tǒng)長(zhǎng)時(shí)間穩(wěn)定運(yùn)行,需要協(xié)同系統(tǒng)軟硬件,通過(guò)可靠性分析、可靠性設(shè)計(jì)與可用性設(shè)計(jì)3個(gè)層次,全面提升系統(tǒng)可靠性與可用性.

    可靠性分析基于系統(tǒng)組成單元功能邏輯關(guān)系,建立全機(jī)系統(tǒng)可靠性分析模型,采用元器件應(yīng)力分析法,開(kāi)展系統(tǒng)可靠性預(yù)計(jì)與評(píng)估,分析可靠性薄弱環(huán)節(jié),合理分配可靠性指標(biāo).可靠性設(shè)計(jì)針對(duì)系統(tǒng)關(guān)鍵部件及可靠性薄弱環(huán)節(jié),采取器件選型、冗余、熱設(shè)計(jì)等一系列可靠性增強(qiáng)技術(shù),改進(jìn)系統(tǒng)工藝與設(shè)計(jì),防止錯(cuò)誤發(fā)生,提高系統(tǒng)硬件基礎(chǔ)可靠性.可用性設(shè)計(jì)基于主被動(dòng)統(tǒng)一的容錯(cuò)思想,構(gòu)建高效容錯(cuò)控制體系,協(xié)同采用多種容錯(cuò)技術(shù),有效實(shí)現(xiàn)故障的檢測(cè)、診斷與恢復(fù),降低系統(tǒng)容錯(cuò)開(kāi)銷(xiāo),實(shí)現(xiàn)應(yīng)用級(jí)高可用目標(biāo).

    3.2 多層次容錯(cuò)體系

    神威太湖之光超級(jí)計(jì)算機(jī)基于體系化容錯(cuò)設(shè)計(jì)理念,在體系結(jié)構(gòu)、軟硬件系統(tǒng)、應(yīng)用系統(tǒng)等多個(gè)層次全面貫徹高可靠與高可用設(shè)計(jì)思想.遵循容錯(cuò)設(shè)計(jì)要求,優(yōu)化制定系統(tǒng)性能指標(biāo),達(dá)到系統(tǒng)功能實(shí)現(xiàn)與故障容錯(cuò)的深度融合.

    Fig.2 Fault tolerance system of multi-level active and passive collaboration

    系統(tǒng)采用以最小容錯(cuò)替換單元(minimum toler-ance replaceable unit, MTRU)設(shè)計(jì)為核心的故障局部化、輕量化容錯(cuò)設(shè)計(jì),綜合運(yùn)用故障隔離、替換與修復(fù)技術(shù),通過(guò)硬件系統(tǒng)、基礎(chǔ)支撐、容錯(cuò)控制等協(xié)同設(shè)計(jì),構(gòu)建主被動(dòng)統(tǒng)一、軟硬件協(xié)同的多層次容錯(cuò)系統(tǒng),如圖2所示.神威太湖之光通過(guò)系統(tǒng)維護(hù)、心跳檢測(cè)、容錯(cuò)數(shù)據(jù)庫(kù)構(gòu)建容錯(cuò)基礎(chǔ)支撐,通過(guò)容錯(cuò)控制臺(tái)、容錯(cuò)中間件和插件環(huán)境構(gòu)建容錯(cuò)控制系統(tǒng),通過(guò)系統(tǒng)和應(yīng)用層的多樣化容錯(cuò)提供多層次容錯(cuò)功能.在系統(tǒng)層提供故障預(yù)測(cè)、主動(dòng)遷移等主動(dòng)容錯(cuò)和消息重傳、作業(yè)回卷、局部降級(jí)、故障接管等被動(dòng)容錯(cuò)功能.在應(yīng)用層提供基于局部保留和透明遷移恢復(fù)的局部檢查點(diǎn)(local checkpoint, LC)與基于進(jìn)程冗余的冗余檢查點(diǎn)(redundancy checkpoint, RC)容錯(cuò)功能,并通過(guò)容錯(cuò)控制接口,將應(yīng)用級(jí)容錯(cuò)納入統(tǒng)一的自動(dòng)化容錯(cuò)系統(tǒng),實(shí)現(xiàn)系統(tǒng)感知的應(yīng)用級(jí)容錯(cuò).神威太湖之光系統(tǒng)通過(guò)軟硬件協(xié)同容錯(cuò)設(shè)計(jì)和多層次容錯(cuò)方法,提高多場(chǎng)景容錯(cuò)措施的覆蓋面,降低容錯(cuò)的影響范圍和容錯(cuò)開(kāi)銷(xiāo),提升系統(tǒng)的可用性.

    3.3 可靠性增強(qiáng)技術(shù)

    神威太湖之光超級(jí)計(jì)算機(jī)系統(tǒng)規(guī)模龐大,主機(jī)元器件數(shù)量達(dá)到億量級(jí),國(guó)產(chǎn)眾核處理器集成度高,性能指標(biāo)先進(jìn),存儲(chǔ)、網(wǎng)絡(luò)與電源冷卻子系統(tǒng)設(shè)計(jì)復(fù)雜,面臨嚴(yán)峻的可靠性挑戰(zhàn).為此,神威太湖之光在器件、部件、系統(tǒng)等不同層次,設(shè)計(jì)采用了一系列可靠性增強(qiáng)技術(shù),有效提升系統(tǒng)基礎(chǔ)可靠性.

    申威26010眾核處理器是神威太湖之光超級(jí)計(jì)算機(jī)的核心器件.為保證芯片的穩(wěn)定可靠,提出基于余數(shù)域分配律計(jì)算結(jié)果在線校驗(yàn)技術(shù),建立片上一體化檢驗(yàn)和故障異常處理技術(shù)體系.運(yùn)算核心浮點(diǎn)乘加檢錯(cuò)部件基于余數(shù)校驗(yàn)碼原理,根據(jù)運(yùn)算主通路輸入,生成預(yù)期結(jié)果的余數(shù)碼,與運(yùn)算主通路輸出結(jié)果的余數(shù)碼進(jìn)行比較,支持浮點(diǎn)和整數(shù)多種運(yùn)算的實(shí)時(shí)在線檢錯(cuò).通過(guò)算法優(yōu)化與功能復(fù)用,降低時(shí)序及面積開(kāi)銷(xiāo),檢錯(cuò)覆蓋率達(dá)到93.33%.結(jié)合系統(tǒng)級(jí)校驗(yàn)體系與軟件容錯(cuò),可以有效檢測(cè)并糾正由芯片內(nèi)部噪聲或外部放射性粒子所引發(fā)的瞬態(tài)故障,從而提高眾核處理器的穩(wěn)定性與可靠性.

    與Summit等超級(jí)計(jì)算機(jī)基于雙列直插內(nèi)存模塊(dual inline memory module, DIMM)構(gòu)建存儲(chǔ)系統(tǒng)所不同,神威太湖之光計(jì)算節(jié)點(diǎn)存儲(chǔ)系統(tǒng)選用DDR3存儲(chǔ)器顆粒,通過(guò)焊接貼裝于印制板上,避免因DIMM存儲(chǔ)條電氣與機(jī)械連接所引起的可靠性問(wèn)題.此外,申威26010眾核處理器存儲(chǔ)控制接口設(shè)計(jì)支持ECC,Chipkill,RS多種校驗(yàn)編碼,利用存儲(chǔ)器冗余數(shù)據(jù)位,實(shí)現(xiàn)單比特錯(cuò)自動(dòng)檢測(cè)與糾正,存儲(chǔ)器失效率可降低約80%[25],顯著提升計(jì)算節(jié)點(diǎn)存儲(chǔ)系統(tǒng)可靠性.

    在互連網(wǎng)絡(luò)系統(tǒng)可靠性設(shè)計(jì)中,提出泛樹(shù)網(wǎng)絡(luò)結(jié)構(gòu)與雙軌聯(lián)動(dòng)高效高可靠通信機(jī)制,網(wǎng)絡(luò)芯片設(shè)計(jì)冗余互連端口,有效提升互連網(wǎng)絡(luò)容錯(cuò)能力.通過(guò)采用高速信號(hào)傳輸技術(shù),14 Gbps高速串行鏈路傳輸誤碼率降低至10-15量級(jí),結(jié)合前向糾錯(cuò)編碼技術(shù),實(shí)現(xiàn)網(wǎng)絡(luò)數(shù)據(jù)不間斷穩(wěn)定可靠傳輸.

    冷卻散熱是影響超級(jí)計(jì)算機(jī)系統(tǒng)可靠性的一個(gè)關(guān)鍵因素,隨著器件結(jié)溫增加,元器件失效率呈指數(shù)級(jí)增長(zhǎng)[26].由電子設(shè)備可靠性預(yù)計(jì)手冊(cè)[27],半導(dǎo)體集成電路每運(yùn)行百萬(wàn)小時(shí)失效率λ可以估算得到:

    λ=(C1πTπV+(C2+C3)πE)πQπK,

    (1)

    其中,πT為溫度應(yīng)力系數(shù),取決于電路工藝和結(jié)溫,πV,πE,πQ,πK分別為電壓、環(huán)境、質(zhì)量與成熟度系數(shù),C1,C2為電路復(fù)雜度失效率,C3為封裝復(fù)雜度失效率.申威26010眾核處理器設(shè)計(jì)選用低熱阻封裝,主機(jī)系統(tǒng)采用間接液冷散熱,運(yùn)算插件冷板設(shè)計(jì)立體流道布局結(jié)構(gòu),結(jié)合流場(chǎng)均衡與剛?cè)釓?fù)合表貼接觸技術(shù),將眾核處理器芯片結(jié)溫有效控制在50℃量級(jí),顯著提升眾核處理器運(yùn)行穩(wěn)定性,進(jìn)而提高系統(tǒng)整體可靠性.

    系統(tǒng)廣泛采用冗余設(shè)計(jì)機(jī)制,外圍存儲(chǔ)采用成熟的冗余獨(dú)立磁盤(pán)陣列,冷卻與電源系統(tǒng)的冷水機(jī)組、水泵、空調(diào)、電源轉(zhuǎn)換模塊等均采取冗余設(shè)計(jì),避免單點(diǎn)故障引發(fā)系統(tǒng)失效.同時(shí),廣泛支持熱拔插與在線維修,實(shí)現(xiàn)系統(tǒng)故障快速恢復(fù),有效提升系統(tǒng)可靠性與可維性.

    3.4 高可用設(shè)計(jì)

    超級(jí)計(jì)算機(jī)系統(tǒng)規(guī)模龐大、應(yīng)用課題類(lèi)型多樣、程序模型千差萬(wàn)別,容錯(cuò)需求差異很大.為此神威太湖之光集合應(yīng)用容錯(cuò)需求,提出故障預(yù)測(cè)、主動(dòng)遷移與局部任務(wù)降級(jí)等主被動(dòng)容錯(cuò)技術(shù),通過(guò)協(xié)同多種容錯(cuò)技術(shù),提升系統(tǒng)可用性.

    3.4.1 故障預(yù)測(cè)

    神威太湖之光采用基于滑動(dòng)時(shí)間窗口和準(zhǔn)確度約束的數(shù)據(jù)關(guān)聯(lián)分析方法,對(duì)大規(guī)模系統(tǒng)實(shí)時(shí)和歷史數(shù)據(jù)進(jìn)行多維分析,深入挖掘同源多次故障、非故障多維特征數(shù)據(jù)與故障之間的相關(guān)性,提取故障發(fā)生的分布規(guī)律,結(jié)合實(shí)時(shí)故障驗(yàn)證,建立多層次系統(tǒng)資源故障失效時(shí)間分布模型,指導(dǎo)進(jìn)行故障預(yù)測(cè)分析.考慮到系統(tǒng)在生命周期不同階段、不同負(fù)載、不同應(yīng)用場(chǎng)景下的故障概率變化情況,采用機(jī)器學(xué)習(xí)方法對(duì)故障預(yù)測(cè)模型進(jìn)行周期性最優(yōu)近似求解并持續(xù)迭代,優(yōu)化調(diào)整預(yù)測(cè)模型參數(shù),提高故障預(yù)測(cè)準(zhǔn)確率.故障預(yù)測(cè)主要考慮關(guān)鍵因素如表1所示:

    Table 1 Key Factors for Failure Prediction

    在預(yù)測(cè)結(jié)果的計(jì)算過(guò)程中,主要參考了各種關(guān)鍵因素的故障歷史、臨近時(shí)間段內(nèi)的狀態(tài)數(shù)據(jù)、挖掘獲得的合理閾值和迭代求解得到的系數(shù).故障預(yù)測(cè):

    Ewarning=

    (2)

    其中,Ewarning為通過(guò)預(yù)測(cè)函數(shù)f(x)得到的預(yù)測(cè)結(jié)果即預(yù)警事件,g(x)表示基于關(guān)聯(lián)分析建模得到的模型函數(shù),{Fxy}表示時(shí)間區(qū)間內(nèi)的故障集合,{Txy}表示時(shí)間區(qū)間內(nèi)的狀態(tài)數(shù)據(jù)集合,{Thxy}表示閾值參數(shù),{Wxy}表示求解系數(shù),Sx表示取值集合,C,M,N,T,P,L分別代表處理器、存儲(chǔ)器、網(wǎng)絡(luò)接口、溫度、電源和負(fù)載.系統(tǒng)運(yùn)行過(guò)程中,持續(xù)采樣狀態(tài)數(shù)據(jù),根據(jù)預(yù)測(cè)模型函數(shù)計(jì)算預(yù)測(cè)結(jié)果,一旦相關(guān)因素的狀態(tài)數(shù)據(jù)滿足故障概率條件則形成故障預(yù)警,觸發(fā)并驅(qū)動(dòng)容錯(cuò)系統(tǒng)進(jìn)行容錯(cuò)決策,并擇機(jī)啟動(dòng)策略化的主動(dòng)容錯(cuò).在實(shí)際系統(tǒng)中,支持處理器核心、存儲(chǔ)器、網(wǎng)絡(luò)接口等主要部件的故障預(yù)測(cè).

    3.4.2 主動(dòng)遷移容錯(cuò)

    主動(dòng)遷移是一種基于預(yù)警事件驅(qū)動(dòng)的透明化容錯(cuò)技術(shù),適用于各種類(lèi)型的應(yīng)用,對(duì)提高系統(tǒng)的可用性非常重要.與事務(wù)處理及數(shù)據(jù)只讀型應(yīng)用不同,高性能計(jì)算遷移容錯(cuò)面臨著多進(jìn)程間的共享內(nèi)存、消息通信、文件處理等復(fù)雜耦合關(guān)系,控制復(fù)雜.神威太湖之光針對(duì)主動(dòng)預(yù)警容錯(cuò)需求,設(shè)計(jì)實(shí)現(xiàn)了面向高性能計(jì)算消息模型特征的局部預(yù)警主動(dòng)遷移容錯(cuò)技術(shù),采用凍結(jié)—遷移—恢復(fù)設(shè)計(jì)思想,其控制原理如圖3所示:

    Fig.3 Active migration fault tolerance

    基本算法如算法1所述:

    算法1.基于耦合識(shí)別的節(jié)點(diǎn)遷移算法.

    輸入:節(jié)點(diǎn)故障預(yù)警事件E、預(yù)警處理策略P;

    輸出:節(jié)點(diǎn)遷移結(jié)果result.

    ① 判斷預(yù)警事件所影響的作業(yè)J和節(jié)點(diǎn)N;

    ② 代價(jià)收益評(píng)估,確定最佳容錯(cuò)策略P;

    ③ 申請(qǐng)冗余資源R;

    ④ 驅(qū)趕J中的消息和IO;

    ⑤ 將緩存數(shù)據(jù)刷新到主存;

    ⑥ 識(shí)別用戶數(shù)據(jù)區(qū)UD和關(guān)鍵系統(tǒng)數(shù)據(jù)區(qū)SD;

    ⑦ 凍結(jié)作業(yè)J;

    ⑧ 將節(jié)點(diǎn)N上的UD和SD遷移到R上;

    ⑨ 重構(gòu)作業(yè)J的運(yùn)行控制環(huán)境;

    ⑩ 恢復(fù)作業(yè)J;

    在遷移算法中,通過(guò)動(dòng)態(tài)分析節(jié)點(diǎn)內(nèi)存數(shù)據(jù)的訪問(wèn)特征,識(shí)別用戶數(shù)據(jù)區(qū)、關(guān)鍵系統(tǒng)數(shù)據(jù)區(qū)和其他數(shù)據(jù)區(qū),確保只遷移用戶數(shù)據(jù)區(qū)和關(guān)鍵系統(tǒng)數(shù)據(jù)區(qū)空間,降低遷移數(shù)據(jù)量和開(kāi)銷(xiāo).通過(guò)作業(yè)運(yùn)行階段和多樣化容錯(cuò)特征識(shí)別,進(jìn)行容錯(cuò)代價(jià)和收益的評(píng)估,從而選擇最合適的容錯(cuò)手段.從策略和手段上降低開(kāi)銷(xiāo),提升實(shí)用性.

    3.4.3 局部降級(jí)容錯(cuò)

    消息重傳、作業(yè)回卷、故障接管等被動(dòng)容錯(cuò)是故障發(fā)生后的補(bǔ)救型容錯(cuò),其目的是減少故障的影響.高性能計(jì)算系統(tǒng)運(yùn)行并行應(yīng)用程序期間,一旦發(fā)生本地資源故障,通常只能取消作業(yè).否則不僅不能獲得正確的結(jié)果,而且作業(yè)也不能成功退出.動(dòng)態(tài)任務(wù)分區(qū)是一種應(yīng)用廣泛的程序模型,它通常有一個(gè)主進(jìn)程和其他從進(jìn)程.主進(jìn)程動(dòng)態(tài)地將任務(wù)分配給從進(jìn)程.任務(wù)完成后,從進(jìn)程繼續(xù)向主進(jìn)程申請(qǐng)新任務(wù),主從進(jìn)程通過(guò)消息相互交互.針對(duì)這種應(yīng)用特點(diǎn),在動(dòng)態(tài)任務(wù)劃分的基礎(chǔ)上,神威太湖之光提出一種特殊的局部降級(jí)容錯(cuò)技術(shù).當(dāng)故障發(fā)生時(shí),對(duì)故障資源和任務(wù)過(guò)程進(jìn)行動(dòng)態(tài)切割,重構(gòu)運(yùn)行環(huán)境.剩余的資源和任務(wù)進(jìn)程可以繼續(xù)執(zhí)行,而不會(huì)導(dǎo)致任務(wù)丟失.當(dāng)從進(jìn)程資源失敗時(shí),主進(jìn)程將所有未完成及后續(xù)任務(wù)重新分配給其他進(jìn)程,終止從進(jìn)程并釋放故障資源.當(dāng)主進(jìn)程失敗時(shí),從進(jìn)程通過(guò)投票算法選舉一個(gè)新的主進(jìn)程來(lái)替換任務(wù)分配功能.局部降級(jí)后,底層運(yùn)行時(shí)重新映射剩余的資源和進(jìn)程列表,重新構(gòu)建作業(yè)環(huán)境,以確保作業(yè)能夠連續(xù)運(yùn)行并成功退出,如圖4所示.

    Fig.4 Job local degradation

    Fig.5 Task distribution model

    4 數(shù)據(jù)分析

    4.1 可靠性分析

    本文利用神威太湖之光系統(tǒng)運(yùn)行以來(lái)故障統(tǒng)計(jì)數(shù)據(jù)進(jìn)行失效分析.神威太湖之光超級(jí)計(jì)算機(jī)系統(tǒng)中發(fā)生故障的部件主要有計(jì)算節(jié)點(diǎn)(包含CPU與DDR3存儲(chǔ)器)、互連網(wǎng)絡(luò)、維護(hù)診斷子系統(tǒng)、外圍存儲(chǔ)、電源與冷卻子系統(tǒng).故障統(tǒng)計(jì)數(shù)據(jù)包含了故障發(fā)生的時(shí)間、故障發(fā)生的物理位置、故障類(lèi)型以及故障場(chǎng)景等多種信息.由于故障數(shù)據(jù)內(nèi)可能包含相同時(shí)刻相同故障類(lèi)型的重復(fù)記錄,還可能包含因系統(tǒng)配置或用戶代碼所引發(fā)的警告信息[28],因此在對(duì)故障統(tǒng)計(jì)數(shù)據(jù)進(jìn)行數(shù)據(jù)整理預(yù)處理后開(kāi)展分析.

    根據(jù)故障類(lèi)型及其影響程度,故障可以進(jìn)一步分為非致命性故障與致命性故障2類(lèi).非致命性故障可以自動(dòng)通過(guò)硬件冗余資源或軟件容錯(cuò)技術(shù)進(jìn)行修復(fù),不會(huì)導(dǎo)致系統(tǒng)任務(wù)中斷.而致命性故障則會(huì)導(dǎo)致系統(tǒng)失效,必須及時(shí)進(jìn)行修復(fù).本文主要對(duì)致命性故障及其所引發(fā)的系統(tǒng)失效進(jìn)行分析.

    由系統(tǒng)故障統(tǒng)計(jì)數(shù)據(jù),系統(tǒng)部件失效分布餅圖如圖6所示.可以看出,計(jì)算節(jié)點(diǎn)失效最高,占比達(dá)到58.92%.針對(duì)神威太湖之光超級(jí)計(jì)算機(jī)計(jì)算節(jié)點(diǎn),進(jìn)一步分析其失效原因,計(jì)算節(jié)點(diǎn)失效主要為眾核處理器故障和DDR3存儲(chǔ)器故障,眾核處理器故障包括運(yùn)算控制核心故障、運(yùn)算核心陣列故障、協(xié)議處理部件故障、存儲(chǔ)控制器故障、片上網(wǎng)絡(luò)故障以及系統(tǒng)接口故障,而DDR3存儲(chǔ)器則主要表現(xiàn)為多比特錯(cuò)(multiple bit error, MBE).顯然,配置眾核處理器與大量DDR3存儲(chǔ)器的計(jì)算節(jié)點(diǎn)作為系統(tǒng)核心計(jì)算部件,是神威太湖之光硬件系統(tǒng)失效的主要來(lái)源,對(duì)于系統(tǒng)可靠性具有最重要的影響作用.其次為電源子系統(tǒng),由于全機(jī)電源板及電源器件數(shù)量眾多,因此電源子系統(tǒng)失效也較為可觀,其失效占比達(dá)到18.60%.維護(hù)診斷子系統(tǒng)失效占比為12.79%.相對(duì)而言,互連網(wǎng)絡(luò)、外圍存儲(chǔ)與冷卻子系統(tǒng)受益于高效的網(wǎng)絡(luò)容錯(cuò)機(jī)制與廣泛的冗余配置,具有較高的可靠性,其失效占比分別為6.20%,1.94%,1.55%.

    Fig.6 Failure distribution of Sunway TaihuLight system

    進(jìn)一步來(lái)分析神威太湖之光系統(tǒng)故障間隔時(shí)間分布特性,設(shè)T為系統(tǒng)故障發(fā)生時(shí)間集合,即

    T={t1,t2,…,tn},

    (3)

    則故障間隔時(shí)間Tbetween failures可以表征為

    Tbetween failures={ti+1-ti},i=1,2,…,n-1.

    (4)

    由系統(tǒng)故障發(fā)生時(shí)間可以計(jì)算得到故障累計(jì)時(shí)間分布函數(shù)F(t),則神威太湖之光系統(tǒng)可靠度R(t)可以表征為

    R(t)=1-F(t).

    (5)

    指數(shù)分布、對(duì)數(shù)正態(tài)分布與韋布爾分布作為3種典型壽命周期分布模型[29],在數(shù)據(jù)統(tǒng)計(jì)分析領(lǐng)域得到了廣泛的應(yīng)用,其失效概率密度分布函數(shù)f(t)如表2所示:

    Table 2 Typical Life Cycle Distribution Probability Density Function

    本文選擇這3種壽命周期分布模型,對(duì)神威太湖之光系統(tǒng)故障間隔時(shí)間分布進(jìn)行數(shù)據(jù)擬合分析.壽命周期分布具體數(shù)值可由最大似然估計(jì)得到,進(jìn)而與故障累計(jì)時(shí)間經(jīng)驗(yàn)數(shù)據(jù)進(jìn)行擬合分析.隨后,利用K-S(Kolmogorov Smirnov)檢驗(yàn)來(lái)評(píng)估壽命周期分布模型與經(jīng)驗(yàn)數(shù)據(jù)之間的擬合度.K-S檢驗(yàn)產(chǎn)生的p值用于表征統(tǒng)計(jì)數(shù)據(jù)的擬合度.一般而言,當(dāng)p>0.05時(shí),表示經(jīng)驗(yàn)數(shù)據(jù)與壽命周期分布具有較好的擬合度,可以認(rèn)為經(jīng)驗(yàn)數(shù)據(jù)服從壽命周期分布模型,當(dāng)p<0.05時(shí),則表示經(jīng)驗(yàn)數(shù)據(jù)與壽命周期分布不具有相關(guān)性.

    Fig.7 Comparison of empirical and three typical life cycle distribution CDF

    系統(tǒng)故障經(jīng)驗(yàn)累積分布函數(shù)(cumulative distri-bution function, CDF)與指數(shù)分布、對(duì)數(shù)正態(tài)分布及韋布爾分布對(duì)比如圖7所示,圖7中實(shí)線為由故障統(tǒng)計(jì)數(shù)據(jù)得到的神威太湖之光系統(tǒng)故障經(jīng)驗(yàn)累積分布函數(shù)曲線,虛線分別為數(shù)據(jù)擬合得到的指數(shù)、對(duì)數(shù)正態(tài)、韋布爾累積分布函數(shù)曲線.

    圖8進(jìn)一步對(duì)比了神威太湖之光系統(tǒng)故障經(jīng)驗(yàn)數(shù)據(jù)直方圖與指數(shù)、對(duì)數(shù)正態(tài)及韋布爾概率密度分布函數(shù)(probability density function, PDF)曲線.在顯著性水平為0.05的條件下,指數(shù)、對(duì)數(shù)正態(tài)與韋布爾分布K-S檢驗(yàn)p值分別為0.1298,0.3201,0.0845,K-S假設(shè)檢驗(yàn)成立.可以看出,指數(shù)、對(duì)數(shù)正態(tài)與韋布爾3種典型壽命周期分布模型與神威太湖之光系統(tǒng)故障經(jīng)驗(yàn)數(shù)據(jù)均得到了較好的擬合,而對(duì)數(shù)正態(tài)分布擬合程度最好.通過(guò)對(duì)故障數(shù)據(jù)的擬合分析,基于擬合度最佳的對(duì)數(shù)正態(tài)分布,建立神威太湖之光超級(jí)計(jì)算機(jī)失效分布模型.由失效分布模型參數(shù),計(jì)算對(duì)數(shù)正態(tài)分布的數(shù)學(xué)期望值,得到系統(tǒng)平均無(wú)故障時(shí)間MTBF為11.84 h.此外,經(jīng)最大似然估計(jì),韋布爾分布形狀參數(shù)m=1.0712(近似為1,此時(shí)韋布爾分布等同于指數(shù)分布),表明神威太湖之光系統(tǒng)基本處于可靠性浴盆曲線的偶然失效期,系統(tǒng)運(yùn)行穩(wěn)定,失效率較低.

    Fig.8 Comparison of histogram and three typical life cycle distribution PDF

    4.2 可用性分析

    對(duì)神威太湖之光超級(jí)計(jì)算機(jī)運(yùn)行以來(lái)系統(tǒng)容錯(cuò)數(shù)據(jù)庫(kù)中的容錯(cuò)歷史日志進(jìn)行統(tǒng)計(jì)分析,數(shù)據(jù)表明業(yè)務(wù)運(yùn)行期間,系統(tǒng)故障預(yù)測(cè)平均準(zhǔn)確率約70%,其中53%的預(yù)測(cè)故障進(jìn)行了主動(dòng)遷移容錯(cuò),剩余17%的預(yù)測(cè)故障區(qū)別不同情況,分別采用了主動(dòng)接管、主動(dòng)避錯(cuò)等方法避免潛在故障中斷課題運(yùn)行.

    使用神威太湖之光經(jīng)典流體力學(xué)應(yīng)用Open-Foam進(jìn)行測(cè)試,主動(dòng)遷移過(guò)程的時(shí)間開(kāi)銷(xiāo)如圖9所示.每次遷移一個(gè)節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)內(nèi)存32 GB.由于單個(gè)節(jié)點(diǎn)的內(nèi)存大小固定,網(wǎng)絡(luò)帶寬不變,數(shù)據(jù)遷移的時(shí)間基本沒(méi)有變化.隨著作業(yè)規(guī)模的增加,消息和IO一致性驅(qū)動(dòng)器和凍結(jié)處理的時(shí)間開(kāi)銷(xiāo)也會(huì)增加,但是總時(shí)間開(kāi)銷(xiāo)仍然在可接受的范圍內(nèi).通過(guò)采取主動(dòng)遷移容錯(cuò),提前干預(yù)處理,將故障預(yù)測(cè)節(jié)點(diǎn)上的任務(wù)進(jìn)程遷移到健康節(jié)點(diǎn)上,以較小的遷移容錯(cuò)開(kāi)銷(xiāo)為代價(jià),有效避免了因節(jié)點(diǎn)瞬間故障導(dǎo)致的程序中斷損失,該容錯(cuò)過(guò)程對(duì)系統(tǒng)可見(jiàn),但對(duì)應(yīng)用完全透明,從而提高了應(yīng)用可感知的系統(tǒng)平均無(wú)故障時(shí)間.統(tǒng)計(jì)分析系統(tǒng)容錯(cuò)數(shù)據(jù)庫(kù)中的歷史遷移容錯(cuò)日志,得到應(yīng)用程序感知到的系統(tǒng)平均無(wú)故障時(shí)間為24.2 h,相對(duì)系統(tǒng)平均無(wú)故障時(shí)間,提升約1倍.

    Fig.9 Active migration fault tolerance time overhead

    Fig.10 Job local degradation fault tolerance time overhead

    對(duì)于因預(yù)測(cè)失敗而產(chǎn)生的瞬態(tài)故障,通過(guò)自動(dòng)容錯(cuò)評(píng)估決策,按需采用任務(wù)局部降級(jí)與作業(yè)回卷容錯(cuò).任務(wù)局部降級(jí)可以應(yīng)用于具有動(dòng)態(tài)任務(wù)分配屬性的多個(gè)應(yīng)用程序.局部降級(jí)模型本質(zhì)上只涉及多節(jié)點(diǎn)間具有良好可擴(kuò)展性的協(xié)同控制,并不存在復(fù)雜的大量數(shù)據(jù)遷移過(guò)程.經(jīng)測(cè)試,典型情況下神威太湖之光任務(wù)局部降級(jí)時(shí)間開(kāi)銷(xiāo)如圖10所示.可以看出,局部降級(jí)容錯(cuò)時(shí)間開(kāi)銷(xiāo)小,且對(duì)作業(yè)規(guī)模不敏感,是一種非常有效的被動(dòng)容錯(cuò)技術(shù).通過(guò)采取被動(dòng)容錯(cuò),雖然沒(méi)有降低系統(tǒng)應(yīng)用可感知的平均無(wú)故障時(shí)間,但有效控制了故障的影響范圍,使課題可以帶錯(cuò)繼續(xù)運(yùn)行并得到正確結(jié)果,減少了因系統(tǒng)故障而增加的應(yīng)用課題回卷執(zhí)行時(shí)間.統(tǒng)計(jì)分析系統(tǒng)數(shù)據(jù)庫(kù)中的歷史降級(jí)容錯(cuò)日志,可以發(fā)現(xiàn),針對(duì)可降級(jí)容錯(cuò)課題,局部降低容錯(cuò)可將平均單個(gè)節(jié)點(diǎn)故障導(dǎo)致的應(yīng)用課題容錯(cuò)損失(因降級(jí)增加的執(zhí)行時(shí)間相比因回卷容錯(cuò)增加的執(zhí)行時(shí)間)降低90%以上.

    因此,神威太湖之光超級(jí)計(jì)算機(jī)系統(tǒng)基于多層次主被動(dòng)統(tǒng)一的容錯(cuò)控制體系,通過(guò)采用面向不同應(yīng)用場(chǎng)景的多樣化容錯(cuò)技術(shù),實(shí)現(xiàn)了融合故障預(yù)測(cè)、評(píng)估決策、容錯(cuò)控制于一體的全流程自動(dòng)按需容錯(cuò),降低容錯(cuò)時(shí)間開(kāi)銷(xiāo),有效提升神威太湖之光超級(jí)計(jì)算機(jī)系統(tǒng)的可用性水平.

    5 技術(shù)展望

    不難預(yù)測(cè),未來(lái)E級(jí)計(jì)算機(jī)將對(duì)系統(tǒng)可靠性與可用性提出極高的要求.這里,本文以神威太湖之光超級(jí)計(jì)算機(jī)系統(tǒng)可靠性與可用性研究分析為基礎(chǔ),分別從硬件和軟件2個(gè)層次,提出未來(lái)E級(jí)計(jì)算機(jī)系統(tǒng)高可靠與高可用技術(shù)發(fā)展建議.

    5.1 可靠性技術(shù)

    5.1.1 高密度組裝

    顯而易見(jiàn),系統(tǒng)元器件數(shù)量越多,系統(tǒng)整體基礎(chǔ)可靠性越低.神威太湖之光超級(jí)計(jì)算機(jī)采用3維高密度組裝,每個(gè)運(yùn)算機(jī)倉(cāng)共安裝1 024個(gè)CPU,組裝密度達(dá)到世界領(lǐng)先的523.10TFLOPS/m3.得益于高密度組裝,神威太湖之光超級(jí)計(jì)算機(jī)運(yùn)算機(jī)倉(cāng)數(shù)量?jī)H40個(gè),系統(tǒng)部件及元器件數(shù)量得到有效縮減,十分有助于提升系統(tǒng)的整體可靠性.E級(jí)計(jì)算機(jī)系統(tǒng)規(guī)模不斷擴(kuò)大,迫切需要在封裝、PCB板、背板等不同層次廣泛應(yīng)用高密度組裝技術(shù),提高系統(tǒng)集成度,平衡機(jī)倉(cāng)規(guī)模數(shù)量,這不僅有利于提升系統(tǒng)基礎(chǔ)可靠性,同時(shí)對(duì)于系統(tǒng)硬件設(shè)計(jì)實(shí)現(xiàn)以及可擴(kuò)展性都具有極其重要的作用.

    5.1.2 高效冷卻

    隨著高性能處理器功耗與系統(tǒng)規(guī)模的不斷提升,E級(jí)計(jì)算機(jī)系統(tǒng)能耗預(yù)計(jì)將達(dá)到幾十至上百M(fèi)W量級(jí),系統(tǒng)冷卻成本和使用成本顯著增加,同時(shí)對(duì)系統(tǒng)穩(wěn)定性與可靠性提出極大挑戰(zhàn).當(dāng)前以相變冷卻、2.5/3D封裝微通道冷卻等為代表的新型高效冷卻技術(shù),對(duì)于降低計(jì)算節(jié)點(diǎn)眾核處理器等核心器件芯片結(jié)溫,提高計(jì)算節(jié)點(diǎn)與主機(jī)系統(tǒng)可靠性與可用性具有重要的作用,在未來(lái)E級(jí)計(jì)算機(jī)系統(tǒng)中具有廣闊的應(yīng)用前景.

    5.1.3 主存防護(hù)

    計(jì)算節(jié)點(diǎn)存儲(chǔ)系統(tǒng)故障失效在神威太湖之光硬件系統(tǒng)失效中占據(jù)了較高的比重.隨著E級(jí)計(jì)算機(jī)系統(tǒng)訪存帶寬與主存容量需求的不斷提高,存儲(chǔ)系統(tǒng)元器件數(shù)量與規(guī)模也不斷增加,計(jì)算節(jié)點(diǎn)主存防護(hù)對(duì)于提升系統(tǒng)整體可靠性至關(guān)重要.基于序列模式挖掘的主存故障特征識(shí)別方法[30],通過(guò)建立計(jì)算節(jié)點(diǎn)主存失效序列規(guī)則模型,從而實(shí)現(xiàn)對(duì)存儲(chǔ)系統(tǒng)故障特別是MBE故障的有效預(yù)測(cè),是一種具有啟發(fā)性的技術(shù)發(fā)展思路.此外,GPU+高帶寬存儲(chǔ)(high bandwidth memory, HBM)已成為化解E級(jí)計(jì)算訪存墻問(wèn)題的主流解決方案.HBM顆粒針對(duì)數(shù)據(jù)與命令信號(hào)設(shè)計(jì)了冗余微凸點(diǎn),可以在發(fā)生故障時(shí),為HBM堆疊芯片提供冗余互連通道,提高芯片可靠性.未來(lái)需要研究采用更為有效的故障避錯(cuò)與容錯(cuò)技術(shù),構(gòu)建穩(wěn)定魯棒的存儲(chǔ)系統(tǒng),確保E級(jí)計(jì)算機(jī)系統(tǒng)穩(wěn)定可靠運(yùn)行.

    5.2 可用性技術(shù)

    5.2.1 輕量級(jí)修復(fù)技術(shù)

    輕量級(jí)修復(fù)是一種能夠在環(huán)境發(fā)生軟硬件故障時(shí)快速恢復(fù)的技術(shù).局部硬件復(fù)位是在計(jì)算核、計(jì)算陣列等局部硬件故障時(shí)軟件驅(qū)動(dòng)的快速修復(fù)方法,通過(guò)局部復(fù)位來(lái)避免全芯片復(fù)位,以降低系統(tǒng)開(kāi)銷(xiāo),對(duì)于網(wǎng)絡(luò)設(shè)備或端口故障,也可以采用類(lèi)似的快速化局部復(fù)位修復(fù)機(jī)制.在發(fā)生軟環(huán)境故障或異常時(shí),則可以通過(guò)虛擬機(jī)或容器的重置與接管來(lái)避免硬件初始化的開(kāi)銷(xiāo),從而快速將軟件環(huán)境恢復(fù)至可用狀態(tài).

    5.2.2 應(yīng)用級(jí)容錯(cuò)算法與模型

    基于數(shù)據(jù)冗余分布的新型容錯(cuò)算法[31]與模型、基于進(jìn)程和線程級(jí)的任務(wù)冗余機(jī)制等是近年來(lái)發(fā)展迅速的應(yīng)用級(jí)局部故障容錯(cuò)技術(shù),值得密切關(guān)注.同時(shí),針對(duì)大規(guī)模系統(tǒng)中廣泛使用的保留恢復(fù)技術(shù)容錯(cuò)成本高、效率低的問(wèn)題,業(yè)界研究提出了基于多混合存儲(chǔ)介質(zhì)和數(shù)據(jù)壓縮算法等多級(jí)檢查點(diǎn)技術(shù),有效降低容錯(cuò)開(kāi)銷(xiāo),提高容錯(cuò)算法與模型的實(shí)用性.

    6 結(jié)束語(yǔ)

    故障失效成為高性能計(jì)算機(jī)系統(tǒng)的普遍事件.本文針對(duì)神威太湖之光超級(jí)計(jì)算機(jī)系統(tǒng)可靠性與可用性開(kāi)展全面的研究分析.系統(tǒng)提出神威太湖之光超級(jí)計(jì)算機(jī)可靠性增強(qiáng)技術(shù),分析系統(tǒng)失效與故障間隔時(shí)間分布特性,開(kāi)展系統(tǒng)故障經(jīng)驗(yàn)數(shù)據(jù)與典型壽命周期分布數(shù)據(jù)擬合度分析.系統(tǒng)故障統(tǒng)計(jì)數(shù)據(jù)表明:計(jì)算節(jié)點(diǎn)是神威太湖之光超級(jí)計(jì)算機(jī)硬件系統(tǒng)失效的主要來(lái)源,對(duì)系統(tǒng)可靠性具有最重要的影響作用.由最大似然估計(jì)與K-S檢驗(yàn)可以看出,對(duì)數(shù)正態(tài)分布與系統(tǒng)故障經(jīng)驗(yàn)數(shù)據(jù)取得了較好的擬合度,進(jìn)而建立神威太湖之光系統(tǒng)失效分布模型,通過(guò)計(jì)算故障間隔時(shí)間的數(shù)學(xué)期望值,得到系統(tǒng)平均無(wú)故障時(shí)間.設(shè)計(jì)提出了故障預(yù)測(cè)、主動(dòng)遷移與局部任務(wù)降級(jí)等主被動(dòng)容錯(cuò)技術(shù),建立多層次主被動(dòng)統(tǒng)一、軟硬件協(xié)同的容錯(cuò)系統(tǒng).系統(tǒng)容錯(cuò)數(shù)據(jù)庫(kù)統(tǒng)計(jì)數(shù)據(jù)與課題測(cè)試結(jié)果表明:系統(tǒng)故障預(yù)測(cè)平均準(zhǔn)確率約70%,主動(dòng)遷移容錯(cuò)時(shí)間開(kāi)銷(xiāo)可控,系統(tǒng)應(yīng)用可感知的平均無(wú)故障時(shí)間可提升約1倍,局部降級(jí)容錯(cuò)對(duì)作業(yè)規(guī)模不敏感,可以有效控制故障的影響范圍,平均單個(gè)節(jié)點(diǎn)故障導(dǎo)致的應(yīng)用課題容錯(cuò)損失可降低90%以上.通過(guò)有效協(xié)同多種容錯(cuò)技術(shù),顯著提升神威太湖之光超級(jí)計(jì)算機(jī)系統(tǒng)的穩(wěn)定性與可用性.最后,以神威太湖之光超級(jí)計(jì)算機(jī)可靠性與可用性研究分析為基礎(chǔ),從硬件和軟件2個(gè)層次,歸納提出了E級(jí)計(jì)算機(jī)系統(tǒng)高可靠與高可用技術(shù)發(fā)展建議.后續(xù)我們將繼續(xù)針對(duì)系統(tǒng)級(jí)高效容錯(cuò)機(jī)制開(kāi)展研究分析.

    猜你喜歡
    神威超級(jí)計(jì)算機(jī)可用性
    基于文獻(xiàn)計(jì)量學(xué)的界面設(shè)計(jì)可用性中外對(duì)比研究
    包裝工程(2023年24期)2023-12-27 09:18:26
    超級(jí)計(jì)算機(jī)
    基于輻射傳輸模型的GOCI晨昏時(shí)段數(shù)據(jù)的可用性分析
    流翔高鈣顯神威 科學(xué)種植促增收
    超級(jí)計(jì)算機(jī)及其在航空航天領(lǐng)域中的應(yīng)用
    科技傳播(2019年22期)2020-01-14 03:06:36
    美國(guó)制造出全球最快超級(jí)計(jì)算機(jī)
    每秒100億億次 中國(guó)超級(jí)計(jì)算機(jī)
    三角函數(shù)結(jié)論求值顯神威
    空客A320模擬機(jī)FD1+2可用性的討論
    河南科技(2015年7期)2015-03-11 16:23:13
    《神威啟示錄》系列報(bào)道三 神威現(xiàn)代中藥研發(fā)的新思考
    51国产日韩欧美| 免费在线观看成人毛片| 国产深夜福利视频在线观看| 伊人久久精品亚洲午夜| 岛国毛片在线播放| 日韩免费高清中文字幕av| 亚洲精品国产成人久久av| 国产精品三级大全| 久久久精品94久久精品| 国产亚洲欧美精品永久| 中国国产av一级| 国产综合精华液| 国产精品三级大全| 777米奇影视久久| 国产亚洲91精品色在线| 伦理电影免费视频| 成人漫画全彩无遮挡| 久久ye,这里只有精品| 国产精品爽爽va在线观看网站| 各种免费的搞黄视频| 777米奇影视久久| 九色成人免费人妻av| 99九九线精品视频在线观看视频| 亚洲精品久久午夜乱码| 久久青草综合色| 好男人视频免费观看在线| 日韩欧美精品免费久久| 久久久久网色| 久久精品夜色国产| 欧美成人午夜免费资源| 国产色婷婷99| 岛国毛片在线播放| 天堂中文最新版在线下载| 亚洲av日韩在线播放| av视频免费观看在线观看| 国产白丝娇喘喷水9色精品| 久久这里有精品视频免费| av女优亚洲男人天堂| 少妇人妻精品综合一区二区| 久久人人爽人人片av| 99热全是精品| 中文字幕免费在线视频6| 老女人水多毛片| 国产高清三级在线| 午夜免费男女啪啪视频观看| 亚洲无线观看免费| 亚洲在久久综合| 不卡视频在线观看欧美| 在线精品无人区一区二区三 | 岛国毛片在线播放| 国产有黄有色有爽视频| 天堂中文最新版在线下载| 午夜日本视频在线| 又大又黄又爽视频免费| 最近最新中文字幕免费大全7| av国产久精品久网站免费入址| 亚洲图色成人| 大话2 男鬼变身卡| 国产精品爽爽va在线观看网站| 亚洲精品第二区| 亚洲第一av免费看| 亚洲av中文av极速乱| 精品一区在线观看国产| 特大巨黑吊av在线直播| 亚洲成人av在线免费| 少妇人妻久久综合中文| 久久久久精品性色| 18+在线观看网站| 亚洲精品日韩在线中文字幕| 嫩草影院新地址| 丰满少妇做爰视频| 欧美成人午夜免费资源| 成人高潮视频无遮挡免费网站| 制服丝袜香蕉在线| 亚洲精品国产成人久久av| 亚洲精品第二区| 国产伦理片在线播放av一区| 亚洲av成人精品一二三区| 美女内射精品一级片tv| 老女人水多毛片| 制服丝袜香蕉在线| 偷拍熟女少妇极品色| 欧美3d第一页| 国产成人精品福利久久| 国产男人的电影天堂91| 久久人人爽人人片av| 人妻一区二区av| 欧美精品一区二区免费开放| 午夜福利视频精品| 日本欧美视频一区| 亚洲一区二区三区欧美精品| 久久97久久精品| 国产爽快片一区二区三区| 成人免费观看视频高清| 高清日韩中文字幕在线| 免费黄色在线免费观看| 亚洲性久久影院| 国产真实伦视频高清在线观看| 国产综合精华液| 日产精品乱码卡一卡2卡三| 精品久久久久久电影网| 国产老妇伦熟女老妇高清| 精品一品国产午夜福利视频| 日日啪夜夜撸| 成人影院久久| 亚洲av不卡在线观看| 色综合色国产| 五月玫瑰六月丁香| 天堂俺去俺来也www色官网| 久久亚洲国产成人精品v| 亚洲精品日韩av片在线观看| 国语对白做爰xxxⅹ性视频网站| 成人美女网站在线观看视频| av网站免费在线观看视频| av一本久久久久| 国产精品99久久99久久久不卡 | 少妇人妻一区二区三区视频| 汤姆久久久久久久影院中文字幕| 欧美一区二区亚洲| 老师上课跳d突然被开到最大视频| 欧美三级亚洲精品| 18禁在线播放成人免费| 内地一区二区视频在线| 中文天堂在线官网| 免费观看性生交大片5| 国产久久久一区二区三区| 日本免费在线观看一区| 国产视频首页在线观看| 久热久热在线精品观看| 你懂的网址亚洲精品在线观看| 在线观看三级黄色| 国产精品伦人一区二区| 免费观看av网站的网址| 99九九线精品视频在线观看视频| 亚洲精品国产av蜜桃| 成人亚洲精品一区在线观看 | 热re99久久精品国产66热6| 免费大片黄手机在线观看| 久久久成人免费电影| 久久久色成人| 免费看光身美女| 日本wwww免费看| 亚洲四区av| 日韩在线高清观看一区二区三区| 少妇被粗大猛烈的视频| 大香蕉97超碰在线| 亚洲国产精品999| 亚洲欧美成人综合另类久久久| 春色校园在线视频观看| 国产精品国产av在线观看| 亚洲精品日韩av片在线观看| 亚洲国产精品成人久久小说| 女性生殖器流出的白浆| 欧美另类一区| 亚洲国产精品国产精品| 汤姆久久久久久久影院中文字幕| 日本一二三区视频观看| 99国产精品免费福利视频| 久久久成人免费电影| 丝袜脚勾引网站| 亚洲久久久国产精品| www.色视频.com| 国产淫片久久久久久久久| 97超碰精品成人国产| 视频区图区小说| 婷婷色综合www| 国产伦精品一区二区三区四那| 黄片无遮挡物在线观看| 亚洲国产最新在线播放| 亚洲性久久影院| 国产成人91sexporn| 日韩 亚洲 欧美在线| 人妻一区二区av| 七月丁香在线播放| 三级国产精品片| 亚洲色图av天堂| 一级片'在线观看视频| 国产乱来视频区| 亚洲色图av天堂| 国产精品人妻久久久影院| 91久久精品国产一区二区三区| 亚洲欧美中文字幕日韩二区| 亚洲av在线观看美女高潮| 九草在线视频观看| 五月伊人婷婷丁香| 卡戴珊不雅视频在线播放| 亚洲av在线观看美女高潮| .国产精品久久| 久久热精品热| av国产久精品久网站免费入址| 日韩欧美一区视频在线观看 | av卡一久久| 大又大粗又爽又黄少妇毛片口| 欧美日韩在线观看h| 欧美xxxx黑人xx丫x性爽| 精品久久久噜噜| 日本av免费视频播放| 国产成人a∨麻豆精品| 成人综合一区亚洲| 美女主播在线视频| 一级黄片播放器| 成年女人在线观看亚洲视频| 日韩av在线免费看完整版不卡| 在线观看美女被高潮喷水网站| 国产精品蜜桃在线观看| 午夜视频国产福利| 成年美女黄网站色视频大全免费 | 亚洲精品亚洲一区二区| a级毛片免费高清观看在线播放| 男人和女人高潮做爰伦理| 免费看不卡的av| 久久国产乱子免费精品| 噜噜噜噜噜久久久久久91| 18禁动态无遮挡网站| 成年美女黄网站色视频大全免费 | 男的添女的下面高潮视频| 免费不卡的大黄色大毛片视频在线观看| 亚洲欧美中文字幕日韩二区| 久久久精品免费免费高清| 身体一侧抽搐| 亚洲精品日韩av片在线观看| 校园人妻丝袜中文字幕| 亚洲精品456在线播放app| 欧美高清成人免费视频www| 天天躁夜夜躁狠狠久久av| 亚洲欧美日韩无卡精品| av又黄又爽大尺度在线免费看| 欧美成人a在线观看| 亚洲不卡免费看| 国产成人一区二区在线| 亚洲av欧美aⅴ国产| 亚洲欧洲日产国产| 99热6这里只有精品| 久久av网站| 你懂的网址亚洲精品在线观看| 精品午夜福利在线看| 热99国产精品久久久久久7| 欧美成人精品欧美一级黄| 日本黄色日本黄色录像| 亚洲天堂av无毛| 91在线精品国自产拍蜜月| 18禁动态无遮挡网站| 成人亚洲欧美一区二区av| 高清日韩中文字幕在线| 欧美成人一区二区免费高清观看| 草草在线视频免费看| 久久97久久精品| 国产乱人偷精品视频| 插逼视频在线观看| 国产成人精品婷婷| 麻豆成人午夜福利视频| 亚洲美女搞黄在线观看| www.av在线官网国产| 搡女人真爽免费视频火全软件| 美女内射精品一级片tv| 精品亚洲成a人片在线观看 | 国产男人的电影天堂91| 国产精品熟女久久久久浪| 一个人免费看片子| 国产免费福利视频在线观看| 啦啦啦在线观看免费高清www| 黄色视频在线播放观看不卡| 亚洲第一av免费看| freevideosex欧美| 舔av片在线| 人妻系列 视频| 人妻一区二区av| 26uuu在线亚洲综合色| 亚洲欧美日韩卡通动漫| 女的被弄到高潮叫床怎么办| 免费av不卡在线播放| 午夜福利网站1000一区二区三区| 亚洲精品国产成人久久av| 国产精品一二三区在线看| kizo精华| 中文字幕av成人在线电影| 超碰av人人做人人爽久久| 精品亚洲乱码少妇综合久久| 成人国产麻豆网| 韩国高清视频一区二区三区| 国产精品国产三级专区第一集| 丰满少妇做爰视频| 老司机影院毛片| 久久精品久久精品一区二区三区| 国产成人一区二区在线| 成人漫画全彩无遮挡| 国产乱人偷精品视频| 久久久午夜欧美精品| 一级a做视频免费观看| 久久99热这里只有精品18| 久久久久久久精品精品| 国产爽快片一区二区三区| 99视频精品全部免费 在线| 黄片wwwwww| 日本一二三区视频观看| 免费黄频网站在线观看国产| 久久久久久九九精品二区国产| 国产精品女同一区二区软件| 久久99热6这里只有精品| 十八禁网站网址无遮挡 | 人体艺术视频欧美日本| 国产精品三级大全| 乱系列少妇在线播放| 中文资源天堂在线| 精品久久久久久久久亚洲| 婷婷色综合www| 免费看不卡的av| 亚洲av男天堂| 狂野欧美激情性bbbbbb| 人人妻人人澡人人爽人人夜夜| 色婷婷av一区二区三区视频| 欧美精品亚洲一区二区| 亚洲,欧美,日韩| 免费不卡的大黄色大毛片视频在线观看| 秋霞在线观看毛片| 欧美激情极品国产一区二区三区 | 亚洲av免费高清在线观看| 99国产精品免费福利视频| 美女国产视频在线观看| 亚洲四区av| 黄色欧美视频在线观看| 男女边摸边吃奶| 国产视频首页在线观看| 久热久热在线精品观看| 国产有黄有色有爽视频| 欧美精品国产亚洲| 亚洲精品第二区| 人人妻人人澡人人爽人人夜夜| 国产成人91sexporn| 亚洲欧美中文字幕日韩二区| 中文资源天堂在线| 久久久成人免费电影| 午夜老司机福利剧场| 成人综合一区亚洲| 成人黄色视频免费在线看| 久久国产亚洲av麻豆专区| 亚洲av成人精品一区久久| 高清黄色对白视频在线免费看 | 18禁裸乳无遮挡免费网站照片| 少妇的逼水好多| 日日撸夜夜添| 香蕉精品网在线| 亚洲不卡免费看| 亚洲色图av天堂| 亚洲精品乱久久久久久| 成年av动漫网址| 在线观看免费日韩欧美大片 | 国产av码专区亚洲av| av一本久久久久| 久久久久久久大尺度免费视频| 人妻夜夜爽99麻豆av| 亚洲欧美日韩卡通动漫| 国产伦精品一区二区三区四那| 亚洲欧美成人综合另类久久久| 日韩亚洲欧美综合| 精品视频人人做人人爽| 精品人妻偷拍中文字幕| 好男人视频免费观看在线| 亚洲丝袜综合中文字幕| 欧美精品一区二区大全| 啦啦啦视频在线资源免费观看| 精品久久久噜噜| 国产精品福利在线免费观看| 免费观看无遮挡的男女| 在线观看免费视频网站a站| 亚洲成人中文字幕在线播放| 夜夜骑夜夜射夜夜干| 亚洲av中文字字幕乱码综合| 欧美日韩在线观看h| 日韩一区二区视频免费看| 一区在线观看完整版| 三级国产精品片| 在线观看免费日韩欧美大片 | 久久久久精品性色| 亚洲精品日韩在线中文字幕| 欧美丝袜亚洲另类| 街头女战士在线观看网站| 国产69精品久久久久777片| 中文欧美无线码| 国产一级毛片在线| 3wmmmm亚洲av在线观看| 精品亚洲乱码少妇综合久久| 日韩三级伦理在线观看| 国产伦精品一区二区三区四那| 黑人猛操日本美女一级片| 国产精品人妻久久久久久| 久久影院123| 伦精品一区二区三区| 天美传媒精品一区二区| 女人久久www免费人成看片| 亚洲成人手机| 欧美xxⅹ黑人| 最近的中文字幕免费完整| 亚洲精品亚洲一区二区| 亚洲av综合色区一区| 哪个播放器可以免费观看大片| 久久久久久久大尺度免费视频| 在线观看一区二区三区| 国产亚洲av片在线观看秒播厂| 亚洲av.av天堂| 丝袜喷水一区| 国产国拍精品亚洲av在线观看| 人妻 亚洲 视频| 在线观看国产h片| 国产伦理片在线播放av一区| 日日摸夜夜添夜夜爱| 久久女婷五月综合色啪小说| 99久国产av精品国产电影| 亚洲欧美精品自产自拍| 午夜激情福利司机影院| 观看av在线不卡| 欧美成人午夜免费资源| 亚洲精品色激情综合| 亚洲丝袜综合中文字幕| 美女xxoo啪啪120秒动态图| 伊人久久精品亚洲午夜| 毛片一级片免费看久久久久| 日本-黄色视频高清免费观看| 亚洲国产精品成人久久小说| 免费高清在线观看视频在线观看| 中文字幕亚洲精品专区| 色婷婷av一区二区三区视频| 青春草视频在线免费观看| 欧美少妇被猛烈插入视频| 欧美日本视频| 国产成人免费无遮挡视频| 欧美日韩综合久久久久久| 夜夜骑夜夜射夜夜干| 91久久精品电影网| 国产精品一二三区在线看| 婷婷色综合大香蕉| 精品亚洲成a人片在线观看 | 欧美激情极品国产一区二区三区 | 汤姆久久久久久久影院中文字幕| 特大巨黑吊av在线直播| 十分钟在线观看高清视频www | 成人高潮视频无遮挡免费网站| 大片免费播放器 马上看| 免费观看在线日韩| 狂野欧美激情性bbbbbb| 免费观看a级毛片全部| 亚洲精品乱码久久久v下载方式| 一级毛片 在线播放| 日韩视频在线欧美| 偷拍熟女少妇极品色| 黄色一级大片看看| 中文字幕精品免费在线观看视频 | 熟妇人妻不卡中文字幕| 精品午夜福利在线看| 亚洲人成网站在线观看播放| 久久久久人妻精品一区果冻| 大香蕉久久网| 一本一本综合久久| 日本与韩国留学比较| 久久久久久人妻| 我的女老师完整版在线观看| 小蜜桃在线观看免费完整版高清| 精品少妇久久久久久888优播| .国产精品久久| 国产老妇伦熟女老妇高清| 免费大片黄手机在线观看| 中文字幕av成人在线电影| 中文字幕精品免费在线观看视频 | 草草在线视频免费看| 特大巨黑吊av在线直播| 国产精品无大码| 免费在线观看成人毛片| 国产乱人视频| 久久久色成人| 免费观看在线日韩| 一级毛片我不卡| 夫妻性生交免费视频一级片| 亚洲欧美日韩卡通动漫| 中文资源天堂在线| 成人影院久久| av视频免费观看在线观看| 色哟哟·www| 国产一区有黄有色的免费视频| 亚洲av男天堂| 国产成人精品一,二区| 成人影院久久| 一个人看的www免费观看视频| 在现免费观看毛片| 久久热精品热| 亚洲人与动物交配视频| 日韩av在线免费看完整版不卡| 狂野欧美激情性bbbbbb| 看十八女毛片水多多多| 多毛熟女@视频| 亚洲av中文字字幕乱码综合| 亚洲成人中文字幕在线播放| 午夜老司机福利剧场| 欧美最新免费一区二区三区| 天天躁日日操中文字幕| 成人免费观看视频高清| 卡戴珊不雅视频在线播放| 黄色一级大片看看| 卡戴珊不雅视频在线播放| 五月开心婷婷网| 91久久精品国产一区二区成人| 国产成人freesex在线| 一级毛片久久久久久久久女| 中文资源天堂在线| 欧美日韩视频高清一区二区三区二| 国产伦理片在线播放av一区| 亚洲国产精品一区三区| 国产成人一区二区在线| 少妇裸体淫交视频免费看高清| 91狼人影院| 日韩成人av中文字幕在线观看| 日韩,欧美,国产一区二区三区| 国精品久久久久久国模美| 精品酒店卫生间| 国产亚洲精品久久久com| 午夜日本视频在线| 伊人久久国产一区二区| 噜噜噜噜噜久久久久久91| .国产精品久久| 狂野欧美白嫩少妇大欣赏| 在线观看一区二区三区| 午夜免费观看性视频| 成人影院久久| 国产成人一区二区在线| 永久免费av网站大全| 国产精品久久久久久av不卡| h日本视频在线播放| 亚洲,一卡二卡三卡| 久久久久久久久久久免费av| 偷拍熟女少妇极品色| 少妇 在线观看| 亚洲一区二区三区欧美精品| a级毛色黄片| 日本av免费视频播放| 内地一区二区视频在线| 国产一区二区在线观看日韩| 亚洲精品一区蜜桃| av免费在线看不卡| 国产日韩欧美在线精品| 日韩大片免费观看网站| 中文字幕人妻熟人妻熟丝袜美| 99久久中文字幕三级久久日本| 又黄又爽又刺激的免费视频.| 欧美精品国产亚洲| a级一级毛片免费在线观看| 欧美性感艳星| 97超碰精品成人国产| 欧美一区二区亚洲| 99re6热这里在线精品视频| 91在线精品国自产拍蜜月| 黄色一级大片看看| 天天躁日日操中文字幕| 国产成人精品久久久久久| 欧美精品亚洲一区二区| 2022亚洲国产成人精品| 亚洲成人一二三区av| 亚洲欧洲国产日韩| 极品少妇高潮喷水抽搐| 精品午夜福利在线看| 日韩欧美一区视频在线观看 | 国产成人91sexporn| 亚洲图色成人| 免费不卡的大黄色大毛片视频在线观看| 国产成人精品一,二区| 国产国拍精品亚洲av在线观看| 小蜜桃在线观看免费完整版高清| 激情五月婷婷亚洲| 色5月婷婷丁香| 一区二区三区四区激情视频| 成人亚洲欧美一区二区av| 日本欧美国产在线视频| 亚洲精品亚洲一区二区| 国产精品久久久久久精品古装| 最新中文字幕久久久久| 精品人妻一区二区三区麻豆| 亚洲国产欧美在线一区| 大又大粗又爽又黄少妇毛片口| 亚洲精品国产色婷婷电影| 十八禁网站网址无遮挡 | 丝袜脚勾引网站| 黄片无遮挡物在线观看| 国产深夜福利视频在线观看| 在线观看三级黄色| 中国美白少妇内射xxxbb| 亚洲色图综合在线观看| 美女脱内裤让男人舔精品视频| 亚洲国产精品成人久久小说| 免费人妻精品一区二区三区视频| 纯流量卡能插随身wifi吗| 日韩大片免费观看网站| 小蜜桃在线观看免费完整版高清| 嫩草影院新地址| 国产熟女欧美一区二区| 国产成人aa在线观看| 亚洲天堂av无毛| 老女人水多毛片| 91久久精品国产一区二区三区| 成人高潮视频无遮挡免费网站| 国语对白做爰xxxⅹ性视频网站| 午夜福利网站1000一区二区三区| 国产精品久久久久久精品古装| 国产精品三级大全| 插逼视频在线观看| 女的被弄到高潮叫床怎么办| 伦理电影免费视频| 国产免费福利视频在线观看| 欧美成人午夜免费资源| 超碰av人人做人人爽久久| 欧美精品人与动牲交sv欧美| 国产在线一区二区三区精| 日韩成人av中文字幕在线观看| 日韩人妻高清精品专区| 国产色爽女视频免费观看| 91久久精品国产一区二区成人| 一区二区三区精品91| 成年女人在线观看亚洲视频|