王選 張欣 李曉歐 嚴加勇 白寶丹 查雨彤 單純玉
[摘 要] MATLAB是工程計算中應用非常廣泛的一種軟件,熟練掌握MATLAB是大部分工科類學生所必備的技能。通過對MATLAB教材中習題的解答,分析了cast和typecast兩個函數(shù),介紹了大端和小端兩種字節(jié)序類型,以及整數(shù)及浮點數(shù)在計算機中的存儲格式。由此,可以使學生學會使用MATLAB函數(shù),并了解數(shù)據(jù)在計算機中存儲格式。
[關鍵詞] MATLAB;IEEE 754;字節(jié)序;數(shù)據(jù)格式
[基金項目] 上海市教委重點課程建設項目“數(shù)字信號處理”(B1-0200-19-309411);上海健康醫(yī)學院教學建設項目“基于穿戴式醫(yī)療技術與器械工程研究中心的生物醫(yī)學工程本科創(chuàng)新能力個性化培養(yǎng)‘四個一工程”(B1-0200-19-309302)
[作者簡介] 王 選,博士,上海健康醫(yī)學院醫(yī)療器械學院講師,主要從事生物醫(yī)學信號的分析與處理研究;單純玉,博士,上海健康醫(yī)學院醫(yī)療器械學院教授(通信作者),主要從事醫(yī)學儀器設計與開發(fā)研究。
[中圖分類號] G642.0 ? ?[文獻標識碼] A ? ?[文章編號] 1674-9324(2020)29-0363-03 ? ?[收稿日期] 2019-10-10
MATLAB是美國MathWorks公司出品的商業(yè)數(shù)學軟件,用于算法開發(fā)、數(shù)據(jù)可視化、數(shù)據(jù)分析以及數(shù)值計算的高級技術計算語言和交互式環(huán)境。MATLAB課程在很多高校中已成為工科類學生必修的專業(yè)基礎課,熟練掌握MATLAB已成為相關專業(yè)學生必備的技能之一。
一、教材中的習題
在教學中,我們的教材采用了張威編著的《MATLAB基礎與編程入門》(第三版),該教材受中國電子教育學會高教分會推薦,是普通高等教育電子信息類”十三五“規(guī)劃教材。該教材第3章數(shù)據(jù)類型的章后練習第1題為[1]“在進行數(shù)值類型數(shù)據(jù)轉(zhuǎn)換時,可以使用cast或typecast函數(shù),例如a=-1,若使用這兩個函數(shù)將變量a轉(zhuǎn)換為無符號的8位整數(shù),計算的結(jié)果是什么?”
針對此題,我們利用MATLAB 2015b運行如下的代碼
a=-1;
b=cast(a,'uint8')
c=typecast(a,'uint8')
得到結(jié)果為
b=0
c=0 ? ?0 ? ?0 ? ?0 ? ?0 ? ?0 ? ?240 ? ?191
雖然結(jié)果運行出來,但是為何會出現(xiàn)這個結(jié)果?這個結(jié)果令學生比較困惑,本文將對問題進行解答,同時介紹數(shù)據(jù)在計算機中的存儲格式。
二、cast函數(shù)和typecast函數(shù)
查詢MATLAB的幫助文檔,可知cast函數(shù)會截取數(shù)據(jù)以適應新的數(shù)據(jù)類型,它會改變內(nèi)存中的數(shù)據(jù)。已知無符號8位整數(shù)‘uint8的數(shù)值表示范圍為0~2^8-1,即0~255。故a=-1時,則得到運行結(jié)果b=0。對如下數(shù)值進行轉(zhuǎn)換,有cast(-2.5,'uint8')=0;cast(25.5,'uint8')=26;%四舍五入cast(300,'uint8')=255;%最大為255同理對于有符號16位整數(shù)‘int16,其數(shù)值表示范圍為-2^15~2^15-1,有cast(-20.5,'int16')=-21cast(-65536,'int16')=-32768,即-2^15.
查詢MATLAB的幫助文檔,可知typecast函數(shù)與cast函數(shù)不同,它在進行數(shù)據(jù)類型轉(zhuǎn)換時,不會截取數(shù)據(jù),不會改變內(nèi)存中數(shù)據(jù)。對其結(jié)果的解釋需要了解數(shù)據(jù)在內(nèi)存中的存儲格式。
三、內(nèi)存中的數(shù)據(jù)存儲格式
(一)大端和小端字節(jié)序
字節(jié)序是指整數(shù)在內(nèi)存中保存的順序,有大端(big-endian)和小端(little-endian)兩種類型。1980年,Danny Cohen在其著名的論文“On Holy Wars and a Plea for Peace”中為了平息一場關于在消息中字節(jié)該以什么樣的順序進行傳送的爭論而引用了大端和小端兩個詞。[2]他非常形象貼切地把支持從一個消息序列的最高位開始傳送的那伙人叫作Big-Endians,支持從最低位開始傳送的相對應的叫作Little-Endians。
在計算機的內(nèi)存中,小端字節(jié)序?qū)⒌托蜃止?jié)存儲在起始地址(低位編址),而大端是將高序字節(jié)存儲在起始地址(高位編址)。例如對于857的存儲,兩種字節(jié)序的存儲方式如表1所示。
小端字節(jié)序最符合人的思維,即地址低位存儲值的低位,地址高位存儲值的高位。而大端字節(jié)序是最直觀的字節(jié)序,即地址低位存儲值的高位,地址高位存儲值的低位。只需要把內(nèi)存地址從左到右按照由低到高的順序?qū)懗?,把值按照通常的高位到低位的順序?qū)懗?兩者對照,一個字節(jié)一個字節(jié)的填充進去。
計算機中不同的CPU有不同的字節(jié)序類型,x86系列的CPU都是小端的字節(jié)序。
(二)整數(shù)類型
1.正數(shù)。數(shù)據(jù)在內(nèi)存中是以補碼存儲的,正數(shù)的補碼與原碼相同。
對于數(shù)值1,其補碼為“0000 0001”,則typecast函數(shù)保持其補碼不變,故為typecast(int8(1),'uint8')=1。同理,對于有符號32位整數(shù)來說,256的補碼為“0000 ?0000 ?0000 ?0000 ?0000 ?0001 ?0000 ?0000”。
如果將其轉(zhuǎn)換為無符號8位整數(shù),則上述補碼以8位為一個單位進行分隔,得到“0000 ?0000,0000 ?0000, 0000 ?0001, 0000 ?0000”。
以小端字節(jié)序看待,低位地址存值的低位,高位地址存高位。故執(zhí)行命令typecast(int32(256),'uint8')得到結(jié)果為“0 ?1 ?0 ?0”。
如果將256轉(zhuǎn)換為無符號16位整數(shù),則補碼以16位為一個單位進行分隔,得到“0000 ?0000 ?0000 ?0000, 0000 ?0001 ?0000 ?0000”。
再以小端字節(jié)序看待,故執(zhí)行命令typecast(int32(256),'uint16')得到結(jié)果為“256 ?0”。
3.負數(shù)。對于負數(shù),補碼與原碼不同。
例如于有符號8位整數(shù),-2的原碼為“1000 0010”,反碼為“1111 1101”,補碼為“1111 1110”。
typecast函數(shù)保持其補碼不變,故將其轉(zhuǎn)換為無符號8位整數(shù)時,故為typecast(int8(-2),'uint8')=254。
若-2為有符號16位整數(shù),則原碼為“1000 ?0000 0000 0010”,反碼為“1111 1111 1111 1101”,補碼為“1111 1111 1111 1110”,將其轉(zhuǎn)換為無符號8位整數(shù)時,則8位為一個單位進行分隔,有“1111 ?1111,1111 ?1110”。以小端字節(jié)序看待,故執(zhí)行倒序typecast(int16(-2),'uint8')得到結(jié)果為254 255。
(三)浮點數(shù)
對于浮點數(shù)的表示,IEEE(Institute of Electrical and Electronics Engineers,電子電氣工程師協(xié)會)在1985年制定了二進制浮點數(shù)算術標準(ANSI/IEEE Std 754-1985),又稱IEC 60559:1989,它是微處理器系統(tǒng)的二進制浮點數(shù)算術。[3,4]根據(jù)此標準,一個單精度浮點數(shù)用32位二進制數(shù)存儲,最高位第32位為符號位,中間的第24-31位為指數(shù)部分,最后第1-23位為小數(shù)部分。雙精度浮點數(shù)用64位二進制數(shù)存儲,最高位第64位為符號位,中間的第53-63位為指數(shù)部分,最后第1-52位為小數(shù)部分,如表2所示。
即二進制為“1011 1111 1111 0000 0000 ……”。
將其轉(zhuǎn)換為無符號8位整數(shù),則以8位為一個單位進行分隔,得到“1011 1111,1111 0000,0000 ……”。以小端字節(jié)序看待,故執(zhí)行命令typecast(-1,'uint8')得到結(jié)果為“0 ?0 ?0 ?0 ?0 ?0 ?240 ?191”。即之前的運行結(jié)果。
同理若將其轉(zhuǎn)換為無符號16位整數(shù),則以16位為一個單位進行分隔,得到“1011 ?1111 ?1111 ?0000,0000 ……”。以小端字節(jié)序看待,故執(zhí)行命令typecast(-1,'uint16')得到結(jié)果為“ 0 ?0 ?0 ?49136”。
四、結(jié)果與討論
通過以上對MATLAB的運行結(jié)果的解釋,我們介紹了兩個函數(shù)的特點,以及整數(shù)及浮點數(shù)在內(nèi)存的存儲格式。因為MATLAB默認的格式為雙精度浮點數(shù),故本文對雙精度浮點數(shù)作了詳細介紹,單精度浮點數(shù)的情況類似。此外,我們只針對習題分析了雙精度浮點數(shù)轉(zhuǎn)換為無符號整數(shù)的情況,如果要轉(zhuǎn)換為其他類型的數(shù)據(jù),同理可以進行分析。
總之,通過以上分析,加深了學生對數(shù)據(jù)格式的理解,并啟發(fā)學生面對困惑,要查找資料進行解決。
參考文獻
[1]張威.MATLAB基礎與編程入門[M].第3版.西安:西安電子科技大學出版社,2017.
[2]Cohen D.On Holy Wars and a Plea for Peace[J].Computer,1981(14):48-54.
[3]朱亞超.基于IEEE754的浮點數(shù)存儲格式分析研究[J].計算機與信技術,2006(9):50-52.
[4]楊軍.基于IEEE的浮點數(shù)格式分析及轉(zhuǎn)換方法研究[J].甘肅科技縱橫,2009,38(5):19-20.