陸婧 張兆遠
摘? 要:隨著數(shù)字化的不斷深入、大數(shù)據(jù)和計算機技術(shù)的迅速發(fā)展,統(tǒng)計計算成為高等教育中不可或缺的一門課程。在高等教育的統(tǒng)計計算課程中,如何選擇合適的編程語言和工具成為教育工作者和學者面臨的問題。該文旨在對比分析R語言與Python在統(tǒng)計計算課程中的應(yīng)用,探討各自的優(yōu)勢和局限性,為教師提供有益的指導(dǎo)以選擇最適合其教學目的和內(nèi)容的統(tǒng)計分析工具。建議研究者和教師在選擇計算機語言時,不僅要考慮其功能和特性,還要考慮課程的長期發(fā)展和學生的學習需求。該文期望為高校教師在統(tǒng)計計算課程的教學提供有益的參考。
關(guān)鍵詞:R語言;Python;統(tǒng)計計算;教育統(tǒng)計;教學;高等教育
中圖分類號:G642? ? ? ? 文獻標志碼:A? ? ? ? ? 文章編號:2096-000X(2024)08-0058-05
Abstract: As digitalization continues to advance rapidly alongside the development of big data and computer technologies, Statistical Computing has become an indispensable course in higher education. In the context of higher education statistical computing courses, the choice of a suitable programming language and tools poses a significant question for educators and scholars. This article aims to compare and analyze the applications of R language and Python in statistical computing courses, exploring their respective strengths and limitations, providing valuable guidance to educators in selecting the most appropriate statistical analysis tools for their teaching objectives and content. It is suggested that researchers and educators, when choosing a programming language, should consider not only its functionality and features but also the long-term development of the course and the learning needs of students. This article hopes to offer beneficial insights for university educators in the teaching of statistical computing courses.
Keywords: R; Python; statistical computing; educational statistics; teaching; higher education
隨著高等教育的普及和發(fā)展,統(tǒng)計計算[1]課程在大學中占據(jù)越發(fā)重要地位。為了提高統(tǒng)計計算課程的教學質(zhì)量和滿足日益復(fù)雜的數(shù)據(jù)分析需求,選擇合適的編程語言和工具顯得尤為關(guān)鍵。現(xiàn)在R語言和Python已經(jīng)成為統(tǒng)計計算領(lǐng)域的主流選擇。本文將針對R語言與Python在高等教育的統(tǒng)計計算課程中的應(yīng)用進行深入探討和對比。R語言起源于20世紀90年代初,專為統(tǒng)計計算和圖形展示而設(shè)計。它受到統(tǒng)計學家和數(shù)據(jù)分析師的喜愛,并廣泛應(yīng)用于統(tǒng)計課程中。Python則是一個多功能的編程語言,從20世紀90年代初起源。隨著其在科學計算和數(shù)據(jù)科學領(lǐng)域的工具庫的不斷發(fā)展,Python逐漸成為統(tǒng)計和數(shù)據(jù)分析的另一主要選擇。在統(tǒng)計計算課程中,R語言以其專業(yè)性和深入的統(tǒng)計功能受到歡迎,而Python因其多功能性和易學性也得到廣泛應(yīng)用。此外,與傳統(tǒng)的統(tǒng)計分析軟件SPSS相比,R語言和Python均具有開源、可擴展和高度自定義的特點,能夠為學生和教師提供更廣泛的數(shù)據(jù)分析方法和更多先進或定制化的分析需求。同時,盡管其他計算機語言如C語言、C++、Java和Fortran等也能實現(xiàn)定制化的工作任務(wù),但它們往往在統(tǒng)計計算教學中顯得過于復(fù)雜,并缺乏與R語言和Python相匹敵的開源、豐富和友好的共享資源環(huán)境。因此,在選擇適合的統(tǒng)計計算課程教學工具時,R語言和Python成為了不二之選??傊?,根據(jù)統(tǒng)計計算課程的具體需求和教學目標,教師可以在R語言和Python之間做出恰當?shù)倪x擇,以確保學生能夠獲得最佳的學習體驗和實踐能力。
一? R語言在統(tǒng)計計算中的應(yīng)用
R語言是20世紀90年代初由統(tǒng)計學家為統(tǒng)計計算和圖形繪制而創(chuàng)造的。與其他編程語言相比,R語言的主要優(yōu)勢在于其為數(shù)據(jù)分析提供的專用功能和豐富的包生態(tài)系統(tǒng)。其語法結(jié)構(gòu)被設(shè)計得非常適合數(shù)據(jù)操作使得學生和研究者能夠輕松地進行數(shù)據(jù)探索和可視化。例如,R中的dplyr包為數(shù)據(jù)清洗提供了一系列便捷的函數(shù)幫助研究者更高效地處理數(shù)據(jù);ggplot2包則提供了一個靈活且強大的繪圖系統(tǒng)使得創(chuàng)建高質(zhì)量的可視化圖形變得簡單快捷。
在高等教育統(tǒng)計研究中,尤其是當涉及復(fù)雜的統(tǒng)計模型和算法時,R語言的功能尤為突出。例如,項目反應(yīng)理論(IRT)是教育測量中的重要領(lǐng)域,它致力于評估學生的能力和試題的難度。在R語言環(huán)境中,諸如ltm、mirt和IRTShiny等包為IRT模型提供了全面的支持,涵蓋了2PL、GRM、GPCM等常用模型。而這些模型在教育研究中,特別是在學生成績和試題分析中,都有著重要的價值。除了IRT,R語言在多變量分析、混合效應(yīng)模型、因子分析和聚類分析等多個統(tǒng)計領(lǐng)域中都有強大的工具和包支持。對于高等教育研究者而言,R不僅提供了豐富的統(tǒng)計方法,而且其開源的特性也鼓勵了全球統(tǒng)計學家和研究者之間的合作與分享,促進了統(tǒng)計方法和工具的持續(xù)創(chuàng)新和完善。
總的來說,為了確保統(tǒng)計計算課程的質(zhì)量及滿足學生的實踐需求,教育機構(gòu)和教師需要根據(jù)研究內(nèi)容和目標選擇最合適的計算工具。而R語言,憑借其在統(tǒng)計計算和數(shù)據(jù)可視化方面的出色表現(xiàn),無疑是此類課程中的首選之一。
二? Python在統(tǒng)計計算中的應(yīng)用
在20世紀90年代初Python作為一種通用編程語言被創(chuàng)立。隨著時間的推移,尤其是隨著科學計算和數(shù)據(jù)科學工具庫的迅速發(fā)展,Python已經(jīng)在統(tǒng)計計算課程中取得了顯著的地位。其清晰和簡潔的語法對于初學者,特別是學生和研究者來說,具有很大的吸引力。隨著pandas、numpy、scipy和matplotlib等庫的引入,Python已經(jīng)成為統(tǒng)計分析和數(shù)據(jù)可視化的主力工具。對于統(tǒng)計計算課程,它提供了一種靈活且強大的方式來處理和分析大型數(shù)據(jù)集。此外,Python也在機器學習和深度學習領(lǐng)域取得了顯著的地位,特別是通過TensorFlow、Keras和scikit-learn等庫。
在教育統(tǒng)計的具體應(yīng)用中,Python使用py-irt庫或其他庫進行IRT模型分析,這在項目反應(yīng)理論的研究中特別有價值;利用statsmodels或pymer4進行多層次模型分析為跨學段或跨學科的研究提供了方法支持;使用statsmodels的混合線性模型來處理嵌套或分層數(shù)據(jù);使用semopy庫進行結(jié)構(gòu)方程建模和路徑分析對于探討變量之間的復(fù)雜關(guān)系尤為有效;而PySAL庫和networkx庫則分別支持空間數(shù)據(jù)和社交網(wǎng)絡(luò)數(shù)據(jù)的分析。
綜上所述,Python在統(tǒng)計計算課程中的應(yīng)用不僅豐富了教學內(nèi)容,而且為學生提供了跨領(lǐng)域的實踐機會。其開源、可擴展的特性以及活躍的社區(qū)環(huán)境使Python成為教育研究者和學生的首選工具之一。
三? R語言與Python語言的對比分析
在統(tǒng)計計算課程中,選擇適當?shù)挠嬎愎ぞ卟粌H能夠確保教學質(zhì)量,還能滿足學生在統(tǒng)計實踐中的多樣化需求。作為統(tǒng)計學與數(shù)據(jù)科學領(lǐng)域的主要工具,R語言和Python兩者都在教育研究中扮演著重要的角色。但它們的歷史背景、特性和適用領(lǐng)域都有所不同,因此,在課程設(shè)計時需要仔細考量。下面從使用群體、開發(fā)環(huán)境與社區(qū)支持、性能、可擴展性與模塊化、代碼的簡潔性與易讀性、統(tǒng)計計算和教育統(tǒng)計的應(yīng)用等方面對比R語言和Python的優(yōu)劣,以期為研究者、教師和學生選擇適當?shù)墓ぞ咛峁﹨⒖贾笇?dǎo)。
(一)? 使用群體
R語言主要的使用群體是統(tǒng)計學家和數(shù)據(jù)分析師。隨著時間的推移R語言的用戶在持續(xù)增加,雖然R語言在數(shù)據(jù)科學領(lǐng)域內(nèi)得到了廣泛應(yīng)用,但其核心用戶群仍然是專注于統(tǒng)計和圖形的研究者。
Python是一種通用編程語言,被廣泛應(yīng)用于Web開發(fā)、軟件開發(fā)、科學計算等多個領(lǐng)域。近年來,隨著pandas、numpy和scikit-learn等庫的發(fā)展,Python在數(shù)據(jù)分析和機器學習領(lǐng)域也獲得了廣大用戶的青睞。
(二)? 開發(fā)環(huán)境與社區(qū)支持
RStudio是R語言的主要開發(fā)環(huán)境,為用戶提供了一套完整的開發(fā)工具,支持數(shù)據(jù)分析、可視化和報告生成。R語言的社區(qū)CRAN提供了上萬個包覆蓋了從基本數(shù)據(jù)處理到復(fù)雜統(tǒng)計分析的各種需求。
Python的開發(fā)環(huán)境豐富多樣,包括Jupyter Notebook、PyCharm和VS Code等。Python的官方包管理工具是pip,與其伴隨的PyPI倉庫提供了大量的第三方庫。Python的社區(qū)也是開放的且擁有大量的在線資源,如Stack Overflow和GitHub,為用戶提供強大的支持。
(三)? 性能
R語言是基于內(nèi)存的,運算時需要先將全部數(shù)據(jù)加載到內(nèi)存中,處理的最大數(shù)據(jù)量取決于內(nèi)存大小的限制,R語言是單線程的,但可以通過加載包進行多線程運算,因此,R語言適合處理小規(guī)?;蛑械纫?guī)模的數(shù)據(jù)。對于大規(guī)模數(shù)據(jù)或計算密集型任務(wù),R語言可能會面臨性能瓶頸,運算速度變慢。但R語言可以通過調(diào)用C語言、C++或Fortran代碼進行性能優(yōu)化。
Python的執(zhí)行速度通??煊赗語言,尤其是當使用numpy或pandas進行數(shù)據(jù)操作時。Python也支持調(diào)用C語言或C++來優(yōu)化性能,且有像Cython這樣的工具可以進一步提高執(zhí)行效率。
(四)? 可擴展性與模塊化
R語言具有強大的擴展性,CRAN倉庫里有上萬個可用包供用戶下載和使用。由于R語言的設(shè)計初衷是統(tǒng)計計算和數(shù)據(jù)分析,許多高度專業(yè)化的統(tǒng)計方法已經(jīng)被封裝成了包。
Python也是高度模塊化的,它擁有豐富的庫和框架,涵蓋了從Web開發(fā)到機器學習的各個領(lǐng)域。通過pip和conda等工具,Python的庫和模塊安裝變得非常簡單。
(五)? 代碼的簡潔性與易讀性
R語言擅長于數(shù)據(jù)分析,提供了許多簡潔的函數(shù)式命令,也允許個人編制函數(shù)式命令。但使用R語言需要一些專業(yè)的統(tǒng)計學知識,這有時可能對沒有統(tǒng)計學背景的人來說較為困難。
Python以其簡潔和易讀的代碼風格著稱,其語法更加通用,易于學習和理解。使用像pandas這樣的庫使得Python在數(shù)據(jù)操作上表現(xiàn)得十分簡潔。
(六)? 統(tǒng)計計算中的應(yīng)用
R語言是統(tǒng)計學家和研究者的首選工具。例如,線性回歸可以簡單地使用lm()函數(shù)來實現(xiàn)。它有廣泛的統(tǒng)計包,如lme4用于混合效應(yīng)模型。
盡管Python也可以進行統(tǒng)計計算,例如使用statsmodels,但它在傳統(tǒng)統(tǒng)計分析中不如R語言那樣直觀和豐富。對于機器學習和深度學習,Python的scikit-learn和TensorFlow等庫則具有顯著的優(yōu)勢。
(七)? 教育統(tǒng)計中的應(yīng)用
在項目反應(yīng)理論(IRT)中,R語言提供了ltm和mirt等包來分析和模型化學生的答題行為。使用lavaan包研究者可以進行結(jié)構(gòu)方程模型分析。
Python在教育統(tǒng)計中的應(yīng)用較少,但也存在一些如py-irt庫用于IRT分析。由于Python的機器學習能力較為強大,它可以被用來預(yù)測學生的未來表現(xiàn)或進行學生聚類分析。
(八)? 相互調(diào)用
在使用R語言與Python的過程中有時候用戶可能希望在一個環(huán)境中調(diào)用另一個環(huán)境中的函數(shù)。這樣可以充分利用兩者的優(yōu)勢。以下是R語言與Python之間的相互調(diào)用的常見方法。
在R中調(diào)用Python,使用reticulate包是R中調(diào)用Python的常用工具。在Python中調(diào)用R,使用rpy2是Python中調(diào)用R的常用庫。此外,rpy2還提供了接口來直接在Python中使用R數(shù)據(jù)框和其他數(shù)據(jù)結(jié)構(gòu),還可以導(dǎo)入R函數(shù)和包。如果在Jupyter Notebook中工作,可以同時使用Python和R,還可以使用%load_ext rpy2.ipython魔法命令來啟用R。這些方法使R語言和Python用戶能夠在一個統(tǒng)一的環(huán)境中工作,從而結(jié)合兩種語言的功能和庫。
四? R語言和Python教材選擇思路
教授一門課程并使學生學有所獲,選擇一本合適的教材是至關(guān)重要的第一步[2]。然而,無論任何教材,其內(nèi)容都受到作者偏好和篇幅的制約,不可能覆蓋學科的每一個細節(jié)。面對多樣化的學生群體,一本教材難以全面滿足每位學生的學習需求和興趣點。因此,作為教師除了提供主要的教學用教材,還應(yīng)該為學生提供一系列參考教材和資料。這樣做不僅可以幫助學生拓展知識視野,還可以為他們提供更多不同的學習視角和方法,省去他們四處尋找參考資料的麻煩,從而更高效地吸收和整合知識。
R語言和Python這兩大編程語言因各自的特點和適用范圍的差異,在高等教育中的應(yīng)用和教學策略五花八門,相關(guān)教材和資源層出不窮,給教師帶來了選擇難題。當前,許多高校和培訓(xùn)機構(gòu)對編程語言的教學策略過于單一化,可能過度偏向某一語言或教材,導(dǎo)致忽視了另一種語言的獨特優(yōu)勢。在實際教學中,首先要確保有足夠的教學時間,其次是要充分利用各種教材和資源,確保學生從多角度學習和理解。尤為關(guān)鍵的是編程語言的學習并不僅僅是語法和代碼,更多地是邏輯和思維的訓(xùn)練,因此實際操作和編程練習顯得尤為重要。很多學生聽課時感覺理解了,但真正編寫代碼時卻常常感到無從下手。原因很簡單就是練習不足,必須經(jīng)過實際應(yīng)用的訓(xùn)練才能真正地掌握。
不同高校和培訓(xùn)機構(gòu)根據(jù)其學科和教學重點都應(yīng)該定制適合自己的編程教材。這些教材不僅需要囊括經(jīng)典的基礎(chǔ)知識,還要結(jié)合當下的研究動態(tài)和行業(yè)應(yīng)用,確保學生能夠緊跟時代脈搏。同時不同學生根據(jù)自身發(fā)展的規(guī)劃對教材的難易程度和深入程度需求不同。這些都需要教師不斷地嘗試、反饋和修正,確保教材內(nèi)容的前沿性和實用性。為了幫助教師更好地進行課程設(shè)計,本文列舉比較了幾本R語言和Python的教材,僅供大家參考,希望能為教師選擇教材提供一些有價值的思路。
(一)? R語言教材
文獻[3]是一本以統(tǒng)計為核心的R語言全面教材。從數(shù)據(jù)的初步處理到復(fù)雜的高級統(tǒng)計分析,作者都為讀者提供了清晰的指導(dǎo)和實例,非常適合統(tǒng)計學及相關(guān)領(lǐng)域的學者和專業(yè)人員。
文獻[4]深入探討了R的高級功能和編程技術(shù)。本書特別關(guān)注函數(shù)式編程、面向?qū)ο缶幊碳靶阅軆?yōu)化等方面,通過詳細的案例和實際應(yīng)用,幫助讀者掌握R語言的核心和高級內(nèi)容。
文獻[5]為數(shù)據(jù)科學家提供了關(guān)于R編程的核心技術(shù)和方法。書中不僅有理論知識,更多的是實踐和應(yīng)用,使得讀者可以更快地在實際工作中應(yīng)用所學。
文獻[6]為讀者提供了深入而全面的R語言在統(tǒng)計計算中的應(yīng)用。它涵蓋了從基礎(chǔ)到高級的各種統(tǒng)計技術(shù)和方法,并展示如何在R環(huán)境中實現(xiàn)它們。這本書特別適合那些希望提高其在R中的統(tǒng)計計算能力的研究者、學生和統(tǒng)計學家。文獻[7]是該教材的中文譯本。
文獻[8]以通俗易懂的方式為讀者展現(xiàn)了R語言在統(tǒng)計分析和數(shù)據(jù)可視化方面的強大功能。通過豐富的圖表和實例使讀者不僅能掌握技術(shù)還能欣賞到數(shù)據(jù)可視化的藝術(shù)魅力。
文獻[9]主要關(guān)注R語言在編程和算法設(shè)計方面的深入內(nèi)容。本書結(jié)構(gòu)清晰,實例豐富,特別適合計算機科學和工程專業(yè)的學生學習和參考。
(二)? Python教材
文獻[10]主要介紹了Python在數(shù)據(jù)分析中的應(yīng)用,特別是如何有效地使用pandas庫。通過實際案例,作者為讀者展示了Python數(shù)據(jù)分析的全過程。
文獻[11]為讀者提供了Python在數(shù)據(jù)科學全領(lǐng)域的應(yīng)用,從數(shù)據(jù)清洗、統(tǒng)計分析到機器學習和高級可視化技術(shù),都有詳盡的介紹。
文獻[12]從基礎(chǔ)出發(fā)逐步引導(dǎo)讀者使用Python構(gòu)建數(shù)據(jù)科學項目,特別注重實際操作和應(yīng)用,適合有一定基礎(chǔ)又希望深入實踐的讀者。
文獻[13]中不僅提供了原書的內(nèi)容,還加入了許多實用技巧和中文讀者常見的問題解答,極大地增強了實用性。
文獻[14]是為有經(jīng)驗的Python程序員設(shè)計的高級教材。書中詳細介紹了Python的高級編程技術(shù)和最佳實踐,通過深入淺出的案例,幫助讀者提高Python編程水平。
文獻[15]為Python初學者提供了一個完整的學習路徑。從語言基礎(chǔ)到實際應(yīng)用,作者都為讀者提供了清晰的指導(dǎo)和豐富的練習,確保讀者可以扎實地掌握Python編程技能。
(三)? 教材對比研究
1? 適用人群
R語言教材文獻[3-9]主要針對統(tǒng)計學家、數(shù)據(jù)分析師和學術(shù)研究者,特別是文獻[3-5],它們?yōu)橐延薪y(tǒng)計基礎(chǔ)的人提供了更高階的技術(shù)。Python教材[10-15]涵蓋了從初學者到高級開發(fā)者的所有人群,文獻[15]更適用于無基礎(chǔ)的初學者。
2? 難易程度
R語言教材文獻[3-4]的內(nèi)容從初級到高級都有涉及,文獻[5-8]則處于中間難度。Python教材中文獻[15]是入門級別,而文獻[10-13]更偏向中高級,文獻[14]為高級。
3? 特點
R語言教材強調(diào)統(tǒng)計學和數(shù)據(jù)分析的應(yīng)用特別是文獻[3]和文獻[4],文獻[6]側(cè)重于統(tǒng)計計算的應(yīng)用,而文獻[8]更聚焦于實用技巧和圖形可視化。Python教材則更多地強調(diào)編程和實際應(yīng)用,其中文獻[10-12]提供了豐富的數(shù)據(jù)處理和分析工具,而文獻[13-15]強調(diào)Python編程技巧。
4? 小結(jié)
R語言和Python都是統(tǒng)計和數(shù)據(jù)分析領(lǐng)域的強大工具,對應(yīng)的教材都有各自的特色和重點。R語言更側(cè)重于統(tǒng)計學和學術(shù)研究,而Python更多地著眼于編程和應(yīng)用開發(fā)。選擇哪種語言和相應(yīng)的教材應(yīng)根據(jù)學習者的需求和背景來決定。
五? 結(jié)束語
在統(tǒng)計計算和教育統(tǒng)計的課程教學中,研究者或教師可以根據(jù)研究的具體內(nèi)容和學生的需求選擇R語言或Python。例如,當涉及文本分析和情感分析時,R語言的tm包和textmineR包提供了豐富的工具。同時,Python也有類似的功能,如NLTK和TextBlob。R語言的另一個優(yōu)點是其編程能力,允許研究者快速實現(xiàn)和測試新的統(tǒng)計模型。這種靈活性鼓勵了學術(shù)共享的文化,其他研究者可以受益于這些開源工具。Python也支持這種創(chuàng)新,但更注重通用性。
盡管R語言在統(tǒng)計和學術(shù)研究領(lǐng)域具有廣泛的用戶群,但在處理性能密集型任務(wù)時可能顯得不夠高效,但它仍可以通過集成C語言、C++和Fortran來彌補這一不足。另一方面,Python也在統(tǒng)計計算課程中扮演著重要角色。與R語言不同,Python是一種多用途的編程語言,隨著其在數(shù)據(jù)科學領(lǐng)域的發(fā)展,Python也逐漸成為統(tǒng)計計算的一個強大工具。對比R語言與Python,盡管兩者都能完成教育統(tǒng)計中的常規(guī)任務(wù),如成績分析、線性回歸等,但R語言的特點在于其專業(yè)性和靈活性。相對于R語言,Python的一個顯著特點是其廣泛的應(yīng)用范圍,從數(shù)據(jù)分析到Web開發(fā)、自動化和AI。這為統(tǒng)計計算課程提供了更廣泛的應(yīng)用場景,使學生能夠?qū)⒔y(tǒng)計方法應(yīng)用于不同的實際問題中。此外,Python在處理大數(shù)據(jù)和機器學習方面可能更具有優(yōu)勢。
總之,R語言和Python都為統(tǒng)計計算課程提供了寶貴的工具和資源,也為高等教育統(tǒng)計領(lǐng)域的研究提供了有力的工具。R語言與Python各有優(yōu)劣,R語言更傾向于傳統(tǒng)統(tǒng)計計算和研究及數(shù)據(jù)可視化,而Python則更為靈活,在數(shù)據(jù)處理、機器學習和深度學習等領(lǐng)域更為出色。選擇哪種語言取決于具體的課程內(nèi)容和學生需求,但不可否認的是,這兩種語言都為統(tǒng)計教育帶來了革命性的改變。研究者選擇哪一種工具應(yīng)根據(jù)具體研究需要、數(shù)據(jù)類型和技術(shù)背景來確定。
參考文獻:
[1] 許王莉,朱利平.數(shù)據(jù)科學統(tǒng)計計算[M].北京:中國人民大學出版社,2022.
[2] 劉紅.隨機過程實踐教學的新思考[J].高教學刊,2020(20):104-106.
[3] MICHAEL J C. The R book[M].Chichester:John Wiley & Sons,2012.
[4] WICKHAM H. Advanced R[M].Boca Raton: CRC Press,2016.
[5] PENG R D. R programming for data science[M].Victoria: Leanpub,2016.
[6] RIZZO M L. Statistical computing with R[M].Boca Raton: CRC Press,2019.
[7] [美]瑪利亞L·里佐.統(tǒng)計計算使用R[M].胡銳,李義,譯.北京:機械工業(yè)出版社,2019.
[8] [美]哈德利·威克姆.ggplot2:數(shù)據(jù)分析與圖形藝術(shù)[M].黃俊文,王小寧,于嘉傲,等譯.北京:西安交通大學出版社,2021.
[9] Adler,J. R語言核心技術(shù)手冊[M].劉思喆,李艦,陳鋼,等譯.北京:電子工業(yè)出版社,2014.
[10] MCKINNEY W. Python for Data Analysis[M].Sebastopol:O'Reilly Media,2018.
[11] VANDERPLAS J. Python Data Science Handbook[M].Sebastopol: O'Reilly Media,2016.
[12] GRUS J. Data Science from Scratch with Python[M].Sebastopol:O'Reilly Media,2019.
[13] [美]杰克·萬托布拉斯. Python數(shù)據(jù)科學手冊[M].陶俊杰,陳小莉,譯.北京:人民郵電出版社,2020.
[14] [波蘭]賈沃斯基,[法]萊德. Python高級編程[M].張亮,阿信,譯.北京:人民郵電出版社,2020.
[15] [美]埃里克·馬瑟斯.Python編程從入門到實踐[M].袁國忠,譯.北京:人民郵電出版社,2020.
基金項目:國家自然科學基金青年科學基金項目“計算機化測驗中異常數(shù)據(jù)與缺失數(shù)據(jù)的統(tǒng)計建模與方法研究”(12001091);伊犁師范大學2023年研究生教育教學改革研究項目“通過項目式教學改革提高研究生科研創(chuàng)新能力的探索與實踐”(YS2023YG07)
第一作者簡介:陸婧(1990-),女,漢族,吉林長春人,博士,副教授,碩士研究生導(dǎo)師。研究方向為教育統(tǒng)計與心理測量。
*通信作者:張兆遠(1980-),男,回族,新疆伊寧人,博士,副教授,碩士研究生導(dǎo)師。研究方向為教育統(tǒng)計與心理測量。