隨著 NLP 技術(shù)的成熟(自然語言處理,Natural Language Processing,是研究人與計算機交互的語言問題的一門學(xué)科),不少人文社科領(lǐng)域的專家也呼吁結(jié)合相關(guān)技術(shù)進行研究和學(xué)習(xí)。近日,斯坦福大學(xué)發(fā)布了一門明年 1 月的公開課程,主要關(guān)注 AI 中的自然語言處理和社交網(wǎng)絡(luò)的結(jié)合應(yīng)用,適合文科生學(xué)習(xí)。近日,斯坦福大學(xué)的另一門 NLP 公開課程也放出了課程通知,即將于 2020 年 1 月開始授課。
這門課程最大的亮點在于:主講 NLP 和人文社會學(xué)科的結(jié)合。課程對技術(shù)的介紹主要針對的是相關(guān)的應(yīng)用,而非為了技術(shù)而講技術(shù)。同時,課程要求也不高,很適合懂一點編程的文科學(xué)生學(xué)習(xí)。
據(jù)課程頁面介紹,這門課程偏向于學(xué)科交叉。它結(jié)合了自然語言處理、信息抽取和社交網(wǎng)絡(luò),是一項在介紹 NLP 知識的同時融合社交網(wǎng)絡(luò)應(yīng)用的課程。
具體而言,課程會像很多 NLP 基礎(chǔ)課程那樣,介紹自然語言處理的相關(guān)知識。在算法方面包括:樸素貝葉斯、邏輯回歸、詞嵌入、詞向量等內(nèi)容。在應(yīng)用方面則包括了情感分析、信息抽取、推薦系統(tǒng)和對話機器人,主要用于社交網(wǎng)絡(luò)。此外,對于不了解 Python 的人來說,課程提供了一個可選的 Python 指導(dǎo)。
從內(nèi)容來看,課程偏向入門,甚至沒有看到神經(jīng)網(wǎng)絡(luò)之類的復(fù)雜模型。盡管課程要求中提到學(xué)生如果學(xué)習(xí)了斯坦福大學(xué)的 CS107、CS103 或 CS109 課程會很有幫助,但是這些也不是強制的。不過,如果學(xué)生參加過了 106B 的課程,具有一些編程經(jīng)驗會更好。
在教科書方面,課程使用的都是電子版的教科書,分別是以下兩本:
書籍 1:Speech and Language Processing(3rd ed. draft)。這本書是電子版的,可以從網(wǎng)站直接打開。
書籍 2:Introduction to Information Retrieval.(信息檢索概論),作者是著名的 Christopher Manning 等。
斯坦福大學(xué)有一個免費閱讀和下載地址:https://nlp.stanford.edu/IR-book/pdf/irbookonline reading.pdf,課程共有十周,每周兩次課,目前已經(jīng)放出了完整的目錄。
這門課程的主講人是 Dan Jurafsky,是斯坦福大學(xué)的一位教授。主要研究方向是自然語言處理和社會科學(xué)的應(yīng)用。
這位老師曾擔(dān)任了 CS384 等課程的教師,也在 2012 年幫助過 Manning 在 MOOC 上的公開課。從專業(yè)背景來看,讓這位老師教授這門課也就不足為奇了。對于人文社科和 AI 的結(jié)合,近年來已經(jīng)可以看到類似的趨勢,如李飛飛等利用計算機視覺統(tǒng)計社區(qū)車輛類型,進而預(yù)測該社區(qū)在大選中的投票趨勢。斯坦福大學(xué)本次公開這樣一門課程,無疑會鼓勵更多非計算機領(lǐng)域的學(xué)生,利用 AI 技術(shù)推進工作和研究。