毛 偉,陳利學(xué)
(西南石油大學(xué) 計算機(jī)科學(xué)學(xué)院,四川 成都 610500)
頭發(fā)渲染在圖形圖像渲染中越來越受到人們的關(guān)注。在當(dāng)今人體虛擬和仿真技術(shù)里,頭發(fā)可以給人體模型一種真實感,而且在電影和動畫游戲領(lǐng)域里都有廣泛的應(yīng)用。動態(tài)三維頭發(fā)渲染一直是計算機(jī)圖形學(xué)的一大難題,頭發(fā)的最終形態(tài)、光澤度、顏色以及種類數(shù)量都是非常難以控制的。本文討論了基于GPU編程技術(shù)的高質(zhì)量動態(tài)頭發(fā)實時渲染,其中主要討論和解決了動態(tài)頭發(fā)的建模、動力學(xué)和碰撞以及最終的著色渲染幾個關(guān)鍵問題。
受控發(fā)絲的結(jié)構(gòu)用于粗略地描繪整個發(fā)型。從Maya內(nèi)建的表示“頭皮”的專用幾何體(渲染時不可見)“生長”出受控發(fā)絲。受控發(fā)絲從頭皮的每個頂點沿著法線生長出來。為了程序上能讓頭發(fā)運動,一旦有了一組受控發(fā)絲,就讓它們服從物理、動力學(xué)和碰撞的計算。在模擬頭發(fā)運動的系統(tǒng)里,運動完全依賴于動力學(xué),它是一個人工控制系統(tǒng),需要能“假造”或者“修正”頭發(fā)的行為。
頭發(fā)幾乎每一幀都有動作和變化,所以需要在每一幀中重建最終渲染頭發(fā)的集合。要得到平滑曲線,首先將動態(tài)受控的受控發(fā)絲轉(zhuǎn)換成貝塞爾曲線,并鑲嵌成平滑線條,然后通過插值來增加頭發(fā)的密度,插值后的頭發(fā)集合被送到引擎來做最終幀的渲染。其中使用了一個動態(tài)的頂點緩沖區(qū)來容納這些頂點數(shù)據(jù)。
1.3.1 鑲嵌
頭發(fā)的鑲嵌處理是通過在每根受控發(fā)絲上添加頂點以平滑化受控發(fā)絲來完成的。這會增加5倍以上的頂點,從7個頂點增加到36個頂點。為了計算新頂點的位置,計算切線并使用這些切線來計算貝塞爾控制點,將受控發(fā)絲轉(zhuǎn)換成貝塞爾曲線。通過貝塞爾曲線,計算額外頂點位置,從而使受控發(fā)絲更加平滑。經(jīng)過平滑處理的受控發(fā)絲通過插值來復(fù)制,以生成一把稠密的頭發(fā),為最終渲染作好準(zhǔn)備。
1.3.2 插值
插值的頭發(fā)是由頭皮網(wǎng)格拓?fù)鋪砩傻?,如圖1所示。每個三角形的末端都會有3條平滑的受控發(fā)絲,要把三角形內(nèi)部的表面用頭發(fā)絲來填充,所以把受控發(fā)絲的坐標(biāo)每3個一組地進(jìn)行插值,以構(gòu)造新的平滑頭發(fā)。平滑的受控發(fā)絲和插值的頭發(fā)具有同樣數(shù)量的頂點。利用重心坐標(biāo)來生成新的插值發(fā)絲,填滿每一個三角形。如插值頭發(fā)K是基于3個重心系數(shù)(X1,X2,X3)來計算的,其中,X1+X2+X3=1, 且 K=A×X1+B×X2+C×X3.
在區(qū)間[0,1]里生成兩個隨機(jī)數(shù),若它們的和大于1,則用1減去較大的數(shù),然后用1減去這兩個數(shù)得到第3個數(shù),所以這3個數(shù)的和就為1,這樣就可以確定生成密集頭發(fā)的位置了。
頭發(fā)的動力學(xué)是基于粒子系統(tǒng)的,把每一根沒有插值的受控發(fā)絲的頂點當(dāng)成一個粒子運動。這些粒子不是均勻分布在一根頭發(fā)上的。這些受控發(fā)絲上的片段隨著和頭顱距離的增大而增大。這樣,不必添加太多的頂點就可以生長出更長的頭發(fā)。對于這個粒子的運動,利用Verlet積分來計算,它簡單而且穩(wěn)定。在粒子不停移動的同時,受控發(fā)絲的長度也必須保持不變,以免拉伸。因此,在受控發(fā)絲的粒子之間使用一些約束條件。若粒子靠得太近,這些約束條件就會使它們相互排斥;當(dāng)它們距離太遠(yuǎn)時,會使片段縮短。當(dāng)然,當(dāng)拉開一個粒子時,與之鄰接片段的長度就會變得無效,所以這樣的修改就會重復(fù)地使用。當(dāng)多次迭代之后,這個系統(tǒng)就會向期望的結(jié)果收斂,最終保持發(fā)根長度為常數(shù)。為了保證頭發(fā)看起來真實,最后就是頭發(fā)的碰撞問題。在頭發(fā)的碰撞檢測中,受控發(fā)絲的碰撞數(shù)據(jù)中引入一種“珍珠結(jié)構(gòu)”,利用球體來進(jìn)行碰撞檢測,每個球體會與另一個定位在粒子上的球體碰撞,而不是與一個點碰撞。
頭發(fā)的著色問題可以分成頭發(fā)的局部發(fā)射模型和計算頭發(fā)之間的自陰影的方法兩部分。
局部反射模型選用Marschner模型,它是一個全面的基于物理的頭發(fā)發(fā)射表示。Marschner反射模型可以通過一個四維的雙向散射函數(shù)來闡明:
其 中 ,θi∈[-π/2,π/2]和 φi∈[0,2π]是 在 極 坐 標(biāo) 中 的 輸入方向,φo∈[0,2π]和 θo∈[-π/2,π/2]是極坐標(biāo)中的光線方向。
函數(shù)S完整地描述了一根毛發(fā)纖維是如何散射和反射光線的。計算這個函數(shù),就能計算出在任何光源位置的表面著色。計算S的開銷較高,為了避免對每個像素都進(jìn)行計算,把S的結(jié)果保存在查找表里,在運行時讀取,這個查找表就可以編譯成一個紋理,并可以在Pixel shader中訪問。但函數(shù)S有4個參數(shù),而GPU本身是不支持四維紋理的。把1個四維函數(shù)編碼成二維紋理,小心地處理查找表,就能僅用1個較小的二維映射來對四維函數(shù)進(jìn)行編碼。
Marschner模型把每根獨立的毛發(fā)纖維當(dāng)作半透明的圓柱體,并考慮可能穿透頭發(fā)的光線路徑。對于3種類型的軌跡,每種都按軌跡符號給了不同的標(biāo)記。每一道光都以一個字符串來代表其光線和表面的相互作用的類型。R軌跡表示從頭發(fā)纖維表面反射出來的光向著觀察者;TT軌跡表示光折射入頭發(fā),而且再次折射出的光向著觀察者;TRT軌跡表示光折射入頭發(fā)纖維,在內(nèi)表面反射,再次折射出的光向著觀察者。其中,“R”表示光線反射,“T”表示光線穿過表面的折射。圖2展示了這3種反射軌跡的頭發(fā)外觀。
因此,這個反射模型的形式為:
每個SP項可以進(jìn)一步分解為兩個函數(shù)的積:函數(shù)MP描述了θ角在反射中的影響,函數(shù)NP捕獲了θ方向上的反射。若有一根完美的圓柱形頭發(fā)纖維,就能把M和N寫成更小的一組角。若定義輔助角θ=(θ-θ)和dioφd=φi-φo,那么式(2)的每一項就可以寫成:
其中,P=R、TT、TRT。
在這種形式里,只有函數(shù)M和N且它們都只有兩個參數(shù)。這意味著能對每個函數(shù)構(gòu)造查找表,并將其編碼成二維紋理。盡管存儲了6個函數(shù),但大多數(shù)都是單通道的,可以存儲在相同紋理中。MR、MTT和MTRT每個只占一個通道,所以打包入第一個查找紋理中。NR是單通道的,但NTT和 NTRT每個都占 3個通道。把 NTT和 NTRT同放在第二個查找紋理中。為了改進(jìn)性能和減少紋理使用,做一個簡單的假設(shè):MTT(θi,θo)=MTRT(θi,θo)。 這就允許把NTT和NTRT保存在相同的紋理中,并把紋理的數(shù)目從3減少到2。雖然這個模型是以角度來描述的,從向量計算出角度需要用反三角函數(shù),這樣開銷很大,所以不把θi和θo從第一次查找傳下來,而是計算正弦值:
這能把 M寫成 sinθi和 sinθo的函數(shù), 節(jié)省了著色處理的計算,加上點工作,也可以計算cosφd。首先把視線和光線向量正交投射到頭發(fā)上:
然后從下式:
就 能 計 算 出 cosφd:
這就剩下 θd還未計算了, 把 θd定義成 θi和 θo的函數(shù)。因為θi和θo來編址的查找表已經(jīng)準(zhǔn)備好了,可以向這個查找表加上一個額外的通道來存儲θd。查找表是CPU計算的,使用每分量 8 bit的128×128紋理。8 bit格式需要把數(shù)值調(diào)整到區(qū)間[0,1],還必須在著色器中添加一個額外的調(diào)整因子來抵消相關(guān)的飽和度。雖然可以把毛發(fā)發(fā)射模型用于渲染以帶線條表示的頭發(fā)上,但也可以擴(kuò)展成實體幾何來表示,使用表面主切線中的一個。最后考慮表面的自遮擋,這可以通過乘以一個額外的項(wrap+dot(N,L)/(1+wrap)得到,其中 dot(N,L)是光和法線的點積,wrap的范圍在 0~1之間,控制了光允許環(huán)繞模型多遠(yuǎn),簡單地近似模擬了毛發(fā)之間的光照混合。
實時應(yīng)用程序里的陰影通常有模板陰體和陰影圖兩種計算。不過它們對于高精度幾何體的陰影圖會出現(xiàn)嚴(yán)重失真。所以在計算時,用一種針對渲染頭發(fā)陰影設(shè)計的近視陰影。非透明的陰影圖擴(kuò)展了一般的陰影圖,可處理物體及反失真。不透明的陰影圖允許分?jǐn)?shù)的陰影值,它不是簡單地進(jìn)行二元遮擋測試,需要知道在給定像素上有多少光穿透到了深度Z(在光空間)。這些通過式(8)給出:
其中,T(x,y,z)是光在像素位置(x,y)上得到深度 Z 的部分 ,α 被稱為不透明度,r(x,y,z)則是用來描述在每一個點(x,y,z)上的單元距離內(nèi)被吸收的百分比,值 k是當(dāng)α=1時選擇的一個常量,T近似于0(在數(shù)值精度上)。這就允許忽略范圍在[0,1]之外的α值。不透明陰影圖的思想是,在一個離散的 z值集合z0,…,z1中計算α值,然后通過在兩個近似的值之間插值來確定α值,方程如下:
其中,zi<z<zi+1。
這是一個合理的近似,因為α是z的一個嚴(yán)格遞增函數(shù),取n=6,z0是光空間中最近平面,而z15是光空間中的最遠(yuǎn)平面,其他平面均勻地分布,因此zi=z0+idz。當(dāng)dz=(z15-z0)/16 時,r=0時,表示在頭發(fā)外面,不管 x和 y取什么值,α(x,y,z)=0,因此只需在 z=z1,…,z15時保存 α 的值。
對于特定的不透明陰影圖,在給定不透明陰影圖的分片后,必須在點(x,y,z)上計算 T的值。 通過在兩個相鄰的分片上線性插值α的值來完成。
α(x,y,z)的值是 α(x,y,z0),…,α(x,y,zn)的線性合并。
可以為所有16個數(shù)值在頂點著色器里計算wi=|zzi|/dz。為了提高效率,在頂點著色器中計算這些權(quán)重,把它們盡快直接傳遞到片段著色器中,一旦計算出了權(quán)重,和的計算為wiα(x,y,zi),數(shù) 據(jù) 是 對 齊 的 ,所 以 單 個點積計算為wiα(x,y,zi)。
最后,從光學(xué)密度上計算傳遞,得到一個在 0~1之間的值來表示光源到達(dá)點(x,y,z)的光照分量。把著色值乘上這個值來得到頭發(fā)的最終顏色。
本文演示了從動力學(xué)來渲染和著色頭發(fā),不透明陰影圖除了對渲染頭發(fā)非常有用,還能用在深度圖失效的情況。隨著GPU越來越靈活,它不僅能承擔(dān)典型的并行任務(wù)(如鑲嵌和插值),也包括CPU涉及的碰撞檢測和物理設(shè)置,從而達(dá)到較為逼真的渲染效果。最后希望在下一代程序里可以看到更逼真的頭發(fā)。
[1]GREEN S.Real-time approximations to subsurface scattering[A].In GPU Gems, edited by Randima Fernando, 2004:263-278.
[2]KIM T Y,NEUMANN U.Opacityshadow maps[C].Proceedings of SIGGRAPH2001, 2001:177-182.
[3]MARSCHNER S R,JENSEN H W,CAMMARANO M,et al.Lightscattering from human hairfibers [C].ACM Transactions on Graphics-Proceedings of SIGGRAPH 2003,2003,22(3):780-791.
[4]MCCOOL M D.Homomorphic factorizations of BRDFs for high-performance rendering[C].Proceedings of SIGGRAPH 2001, 2001:171-178
[5]唐勇,劉強(qiáng),呂夢雅.一種頭發(fā)動態(tài)模擬方法[J].計算機(jī)仿真,2006,27(7),211-213.