摘 要:文章提出一種基于人工智能生成內(nèi)容(AIGC)的營(yíng)養(yǎng)配餐推薦系統(tǒng),結(jié)合通義千問(wèn)(Qwen)大語(yǔ)言模型和LORA技術(shù)對(duì)模型進(jìn)行微調(diào),以實(shí)現(xiàn)更精準(zhǔn)的營(yíng)養(yǎng)建議和配餐推薦。通過(guò)構(gòu)建豐富的營(yíng)養(yǎng)信息和菜譜數(shù)據(jù)的知識(shí)庫(kù),以及利用向量數(shù)據(jù)庫(kù)進(jìn)行高效檢索,系統(tǒng)能夠快速響應(yīng)用戶的查詢請(qǐng)求,并提供個(gè)性化的配餐方案。實(shí)驗(yàn)證明,該系統(tǒng)在推薦準(zhǔn)確性和用戶體驗(yàn)上均優(yōu)于傳統(tǒng)方法。這項(xiàng)研究的貢獻(xiàn)在于提出了一種新的營(yíng)養(yǎng)配餐推薦方法,并通過(guò)實(shí)驗(yàn)證實(shí)了其有效性。
關(guān)鍵詞:人工智能生成內(nèi)容;營(yíng)養(yǎng)配餐推薦系統(tǒng);大語(yǔ)言模型;微調(diào)技術(shù);向量數(shù)據(jù)庫(kù)
中圖分類號(hào):TP18 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-4706(2024)17-0094-06
0 引 言
隨著人工智能的飛速發(fā)展,AIGC(Artificial Intelligence Generated Content)已深入滲透至人們生活的各個(gè)領(lǐng)域[1],特別是在健康管理與營(yíng)養(yǎng)學(xué)方面,AI技術(shù)正深刻改變著個(gè)人的生活方式。隨著大數(shù)據(jù)和機(jī)器學(xué)習(xí)技術(shù)的革新,個(gè)性化營(yíng)養(yǎng)配餐推薦系統(tǒng)成了研究熱點(diǎn),旨在依據(jù)用戶的個(gè)體健康數(shù)據(jù)、飲食喜好及營(yíng)養(yǎng)需求提供精準(zhǔn)的膳食建議。然而,盡管大語(yǔ)言模型[2]在文本生成與理解上取得顯著成就,但在專業(yè)領(lǐng)域的應(yīng)用中仍面臨挑戰(zhàn):模型普遍基于大規(guī)模通用文本預(yù)訓(xùn)練,可能導(dǎo)致其在特定領(lǐng)域的專業(yè)知識(shí)深度不足;同時(shí),缺乏個(gè)性化的上下文感知能力,使得模型難以提供真正有價(jià)值的營(yíng)養(yǎng)指導(dǎo);此外,預(yù)訓(xùn)練數(shù)據(jù)可能存在偏見或不準(zhǔn)確信息,在健康相關(guān)建議生成時(shí)存在風(fēng)險(xiǎn)。
為解決這些問(wèn)題,本研究提出了一項(xiàng)基于AIGC的營(yíng)養(yǎng)配餐推薦系統(tǒng),采用Qwen大語(yǔ)言模型為基礎(chǔ),并結(jié)合專業(yè)的營(yíng)養(yǎng)和菜譜數(shù)據(jù)進(jìn)行微調(diào)優(yōu)化。通過(guò)LORA技術(shù),該系統(tǒng)既能保留模型原有的優(yōu)勢(shì),又能顯著提升其在營(yíng)養(yǎng)配餐領(lǐng)域的專業(yè)性和準(zhǔn)確性。此外,本文還整合了Faiss向量數(shù)據(jù)庫(kù)以實(shí)現(xiàn)對(duì)大量營(yíng)養(yǎng)數(shù)據(jù)和菜譜信息的高效檢索匹配,從而提高推薦系統(tǒng)的精確度和個(gè)性化水平。同時(shí),通過(guò)Prompt Engineering技術(shù)優(yōu)化問(wèn)答功能,使系統(tǒng)能夠更好地理解用戶需求并提供實(shí)用且針對(duì)性強(qiáng)的營(yíng)養(yǎng)建議。
本文的主要貢獻(xiàn)包括:
1)創(chuàng)新性地采用了微調(diào)大語(yǔ)言模型+專業(yè)知識(shí)庫(kù)結(jié)合提示學(xué)習(xí)(Prompt Learning)的方法構(gòu)建問(wèn)答系統(tǒng)。該方法利用精心設(shè)計(jì)的提示引導(dǎo)大模型發(fā)揮在特定領(lǐng)域的專業(yè)能力,同時(shí)保持其在處理一般問(wèn)題時(shí)的強(qiáng)大性能。相較于傳統(tǒng)的微調(diào)范式,本文提出的基于提示學(xué)習(xí)的方式避免了因過(guò)度關(guān)注特定領(lǐng)域而導(dǎo)致的災(zāi)難性遺忘問(wèn)題,通過(guò)引入專業(yè)知識(shí)庫(kù),讓大模型在保有原有通用知識(shí)的基礎(chǔ)上,能更準(zhǔn)確理解和回答專業(yè)領(lǐng)域的問(wèn)題。
2)針對(duì)硬件資源有限的情況,研究探索了如何使用小型大模型部署專業(yè)領(lǐng)域問(wèn)答系統(tǒng)。通過(guò)優(yōu)化提示學(xué)習(xí)策略和知識(shí)庫(kù)整合方式,構(gòu)建出一個(gè)即使在較小配置下也能在專業(yè)領(lǐng)域問(wèn)答性能上媲美甚至超越大型模型的系統(tǒng)。這一成果不僅提高了模型在專業(yè)問(wèn)題上的解答質(zhì)量,而且確保了在資源受限環(huán)境下的系統(tǒng)可用性和AL/sM5jO5ROKvyCspJUvQw==效率。
1 相關(guān)工作
在AI領(lǐng)域,大語(yǔ)言模型(LLM)的問(wèn)答功能已在多行業(yè)得到應(yīng)用驗(yàn)證,但其在深度理解和運(yùn)用特定領(lǐng)域知識(shí)方面存在局限。為此,本研究采用LORA微調(diào)技術(shù)和外掛向量知識(shí)庫(kù)的方法改進(jìn)LLM,通過(guò)引入低秩矩陣調(diào)整模型權(quán)重而不顯著增加參數(shù),實(shí)現(xiàn)不犧牲泛化能力的同時(shí)提升特定領(lǐng)域性能。
在營(yíng)養(yǎng)飲食推薦場(chǎng)景中,研究不僅運(yùn)用了LORA微調(diào)法補(bǔ)充模型知識(shí),還將《中國(guó)居民膳食指南》及豐富菜譜數(shù)據(jù)[3]以向量數(shù)據(jù)庫(kù)形式融入微調(diào)的大語(yǔ)言模型,使模型能夠獲取和利用專業(yè)知識(shí)提供精準(zhǔn)個(gè)性化的營(yíng)養(yǎng)建議。借助Faiss向量數(shù)據(jù)庫(kù),系統(tǒng)能高效檢索和處理營(yíng)養(yǎng)信息,提高了問(wèn)答系統(tǒng)的效能和準(zhǔn)確性。
為增強(qiáng)模型問(wèn)答能力,本研究采用了Prompt工程技術(shù),設(shè)計(jì)了一系列提示詞引導(dǎo)模型解答簡(jiǎn)單或復(fù)雜問(wèn)題,從而讓系統(tǒng)更好地理解用戶營(yíng)養(yǎng)需求,根據(jù)個(gè)體健康狀況、口味偏好及生活習(xí)慣提供定制化飲食建議[4]。
2 系統(tǒng)概述
本系統(tǒng)是基于人工智能生成內(nèi)容(AIGC)的營(yíng)養(yǎng)配餐推薦系統(tǒng),旨在通過(guò)結(jié)合大語(yǔ)言模型和專業(yè)營(yíng)養(yǎng)數(shù)據(jù),為用戶提供個(gè)性化的健康飲食建議。系統(tǒng)采用了阿里巴巴開發(fā)的Qwen大語(yǔ)言模型,通過(guò)結(jié)合LORA技術(shù)針對(duì)性的微調(diào),外掛相關(guān)專業(yè)文檔知識(shí)庫(kù)以提升模型在營(yíng)養(yǎng)配餐領(lǐng)域的專業(yè)性和準(zhǔn)確性。此外,系統(tǒng)整合了Faiss向量數(shù)據(jù)庫(kù)實(shí)現(xiàn)知識(shí)庫(kù)查詢功能,以實(shí)現(xiàn)對(duì)大規(guī)模營(yíng)養(yǎng)數(shù)據(jù)和菜譜信息的高效檢索和匹配。系統(tǒng)還采用了Prompt Engineering技術(shù),通過(guò)精心設(shè)計(jì)的提示詞模型,優(yōu)化模型的問(wèn)答能力,提高用戶交互體驗(yàn)和營(yíng)養(yǎng)建議的準(zhǔn)確性。
基于以上目標(biāo)系統(tǒng)實(shí)現(xiàn)了以下功能:個(gè)性化營(yíng)養(yǎng)建議,智能菜譜推薦,營(yíng)養(yǎng)知識(shí)普及,用戶交互體驗(yàn),數(shù)據(jù)高效檢索和匹配。除此之外,本系統(tǒng)還實(shí)現(xiàn)了用戶友好的交互方式。
如圖1所示,該系統(tǒng)的交互流程如下:
1)用戶通過(guò)想系統(tǒng)提出問(wèn)題后,問(wèn)題被分片分塊抽出Token詞元,再經(jīng)由轉(zhuǎn)化成詞嵌入(Embedding)的形式。
2)專業(yè)知識(shí)向量庫(kù)通過(guò)得到的詞嵌入從知識(shí)庫(kù)[5]里面檢索出相似度最相關(guān)的N個(gè)文本片段作為大模型的參考文本。
3)檢索的文檔數(shù)據(jù)經(jīng)由大語(yǔ)言模型注意力機(jī)制和提示詞工程的作用下,可以增強(qiáng)模型使模型輸出幻覺更少的專業(yè)回答。
這種用戶交互體驗(yàn)的優(yōu)化,能夠提升用戶滿意度和系統(tǒng)的使用便捷性。數(shù)據(jù)高效檢索和匹配是該系統(tǒng)實(shí)現(xiàn)功能的重要基礎(chǔ)。通過(guò)使用向量數(shù)據(jù)庫(kù)Faiss查詢引擎,系統(tǒng)能夠快速高效地處理大量的數(shù)據(jù),確保系統(tǒng)的運(yùn)行效率和響應(yīng)速度。這種數(shù)據(jù)處理方式能夠?yàn)橄到y(tǒng)的穩(wěn)定運(yùn)行提供有力支持。
3 系統(tǒng)構(gòu)建方法
本文從數(shù)據(jù)構(gòu)造與采集、微調(diào)大語(yǔ)言模型、構(gòu)建應(yīng)用、專業(yè)問(wèn)答4個(gè)方面,介紹如何構(gòu)建系統(tǒng)。
本文針對(duì)專業(yè)領(lǐng)域,收集了相關(guān)領(lǐng)域的數(shù)據(jù)進(jìn)行預(yù)處理,設(shè)計(jì)了一套流程用于訓(xùn)練及部署該營(yíng)養(yǎng)領(lǐng)域?qū)I(yè)模型,并探索大語(yǔ)言模型與知識(shí)向量庫(kù)的融合[6]。
圖2以營(yíng)養(yǎng)學(xué)領(lǐng)域的日常問(wèn)題為例展示了該系統(tǒng)的問(wèn)答流程。首先,對(duì)用戶輸入的營(yíng)養(yǎng)學(xué)相關(guān)的文本問(wèn)題用Tokenizer方法進(jìn)行文本切分調(diào)用M3E模型進(jìn)行詞元向量化,即詞嵌入(Embedding),經(jīng)由加權(quán)計(jì)算得到一組向量數(shù)組。然后,通過(guò)LangChain在向量知識(shí)庫(kù)里檢索與提問(wèn)文本有關(guān)的知識(shí)片段,以提示詞的方式和用戶問(wèn)題一起輸入大模型進(jìn)行計(jì)算,由大模型通過(guò)推理生成具備專業(yè)知識(shí)的專業(yè)回答。從而實(shí)現(xiàn)了營(yíng)養(yǎng)學(xué)知識(shí)的專業(yè)問(wèn)答。
3.1 數(shù)據(jù)采集與預(yù)處理
營(yíng)養(yǎng)配餐推薦系統(tǒng)需要大量的營(yíng)養(yǎng)配餐數(shù)據(jù)和認(rèn)知數(shù)據(jù)。營(yíng)養(yǎng)配餐數(shù)據(jù)包括各種菜譜和食品的營(yíng)養(yǎng)信息,認(rèn)知數(shù)據(jù)包括各種食物的營(yíng)養(yǎng)知識(shí)和營(yíng)養(yǎng)需求。相關(guān)介紹如表1數(shù)據(jù)集[7]介紹所示。
本文從以下幾個(gè)渠道收集營(yíng)養(yǎng)配餐數(shù)據(jù):
1)開放數(shù)據(jù)集?;贠penDataLab的開放的專業(yè)營(yíng)養(yǎng)菜譜數(shù)據(jù)集。
營(yíng)養(yǎng)菜譜數(shù)據(jù)來(lái)自網(wǎng)站xiachufang.com一個(gè)被廣泛使用的菜譜分享網(wǎng)站。本數(shù)據(jù)集由2020年12月之前的菜譜構(gòu)成。經(jīng)由OpenDataLab收集后開源的數(shù)據(jù)集。
2)網(wǎng)絡(luò)爬蟲。本文使用RPA工具使用網(wǎng)絡(luò)爬蟲從互聯(lián)網(wǎng)上收集了大量的營(yíng)養(yǎng)膳食建議數(shù)據(jù)。
本文設(shè)計(jì)了一種基于RPA工具的網(wǎng)絡(luò)爬蟲采集算法,來(lái)以此采集相應(yīng)的飲食膳食建議,對(duì)應(yīng)的采集算法1偽代碼設(shè)計(jì)如下:
算法1 基于RPA的網(wǎng)頁(yè)數(shù)據(jù)采集
輸入:檢索文本D(如營(yíng)養(yǎng)膳食建議),知識(shí)分享平臺(tái)X(如知乎)
輸出:基于RPA采集的文檔數(shù)據(jù)R
1)Page_list ← X.find(D)//通過(guò)搜索引擎檢索把相關(guān)網(wǎng)頁(yè)的鏈接存入列表
2)for i := 1 to N do
3)p := request(i)
4)d ← select(D)//在網(wǎng)頁(yè)鎖定包含該關(guān)鍵字的元素
5)text ← analyze(d)//解析元素文本
6)r ← make(text)//將爬蟲所獲的文檔添加進(jìn)文檔數(shù)據(jù)R
7)R←abstract(r)//預(yù)處理數(shù)據(jù),并匯總到R中[8]
8)end for
其中D表示所有的相關(guān)營(yíng)養(yǎng)數(shù)據(jù),X表示一個(gè)知識(shí)共享平臺(tái),R表示所有采集到的文檔數(shù)據(jù),r表示一條生成的數(shù)據(jù)。request根據(jù)鏈接列表提供的網(wǎng)頁(yè)鏈接進(jìn)行請(qǐng)求獲取網(wǎng)頁(yè)內(nèi)容,select表示選擇網(wǎng)頁(yè)下包含關(guān)鍵詞D的網(wǎng)頁(yè)元素,analyze表示根據(jù)解析標(biāo)簽對(duì)得到的文本內(nèi)容,make表示創(chuàng)建臨時(shí)存儲(chǔ)文件保存r,abstract表示通過(guò)預(yù)處理對(duì)r去重清洗后并對(duì)數(shù)據(jù)進(jìn)行匯總[9]。
3.2 微調(diào)大語(yǔ)言模型
大規(guī)模預(yù)訓(xùn)練模型在特定領(lǐng)域知識(shí)遷移時(shí)可能出現(xiàn)的災(zāi)難性遺忘問(wèn)題,本文提出了一種結(jié)合認(rèn)知數(shù)據(jù)問(wèn)答對(duì)和菜譜制作問(wèn)答對(duì)的微調(diào)方法。微調(diào)的具體步驟如下:
1)構(gòu)造營(yíng)養(yǎng)配餐數(shù)據(jù)及認(rèn)知數(shù)據(jù)構(gòu)造訓(xùn)練問(wèn)答數(shù)據(jù)集。其中80%的系統(tǒng)問(wèn)答數(shù)據(jù)來(lái)自現(xiàn)有的數(shù)據(jù)集,如CPND、Recipe_corpus_full等,本文構(gòu)造對(duì)應(yīng)問(wèn)答對(duì)訓(xùn)練數(shù)據(jù)如表2構(gòu)造示例。而20%的相關(guān)問(wèn)答對(duì)訓(xùn)練數(shù)據(jù)使用大模型生成的方式構(gòu)建[10]。
2)構(gòu)建低秩矩陣,將模型的參數(shù)空間分解為低秩矩陣和剩余矩陣兩部分。然后進(jìn)行模型預(yù)訓(xùn)練,得到通義千問(wèn)Qwen-lora模型。在營(yíng)養(yǎng)配餐數(shù)據(jù)上進(jìn)行微調(diào),只更新低秩矩陣和剩余矩陣的參數(shù),其他參數(shù)保持不變。訓(xùn)練配置模型經(jīng)過(guò)微調(diào),Qwen模型在認(rèn)知問(wèn)答和菜譜生成任務(wù)上均顯示出了顯著的性能提升。其問(wèn)答流程如圖3所示。同時(shí),模型在其他非專業(yè)領(lǐng)域的任務(wù)上仍保持了良好的表現(xiàn),表明我們的微調(diào)策略有效地避免了災(zāi)難性遺忘。
3.3 構(gòu)建應(yīng)用
系統(tǒng)構(gòu)建在LangChain-ChatChat應(yīng)用之上,向量數(shù)據(jù)庫(kù)使用Faiss,大語(yǔ)言模型使用微調(diào)后Qwen-chat,實(shí)驗(yàn)機(jī)的硬件配置為,RTX 4080 16 GB顯卡和處理器和i7 13700k和32 GB內(nèi)存的服務(wù)器。
3.3.1 接入LangChain-ChatChat應(yīng)用
LangChain-ChatChat是一種基于LangChain的知識(shí)庫(kù)問(wèn)答構(gòu)建系統(tǒng),能夠進(jìn)行多輪對(duì)話,生成文本,回答問(wèn)題等。本文使用LangChain-ChatChat構(gòu)建營(yíng)養(yǎng)配餐推薦系統(tǒng),用戶可以通過(guò)輸入問(wèn)題,獲取營(yíng)養(yǎng)配餐建議。
3.3.2 文檔載入知識(shí)庫(kù)
在構(gòu)建營(yíng)養(yǎng)配餐推薦系統(tǒng)時(shí),本文需要將營(yíng)養(yǎng)配餐數(shù)據(jù)和認(rèn)知數(shù)據(jù)載入到知識(shí)庫(kù)中。本文使用Faiss向量數(shù)據(jù)庫(kù)進(jìn)行知識(shí)庫(kù)的構(gòu)建和查詢。
本文首先將營(yíng)養(yǎng)配餐數(shù)據(jù)和認(rèn)知數(shù)據(jù)進(jìn)行整理,然后使用Faiss向量數(shù)據(jù)庫(kù)進(jìn)行知識(shí)庫(kù)的構(gòu)建。在知識(shí)庫(kù)構(gòu)建完成后,本文使用向量查詢算法進(jìn)行知識(shí)庫(kù)的查詢,從而獲取相關(guān)的信息。具體步驟如下:
1)數(shù)據(jù)整理。本文對(duì)營(yíng)養(yǎng)配餐數(shù)據(jù)和認(rèn)知數(shù)據(jù)進(jìn)行整理,將數(shù)據(jù)轉(zhuǎn)換為向量格式。
2)知識(shí)庫(kù)構(gòu)建。本文使用Faiss向量數(shù)據(jù)庫(kù)進(jìn)行知識(shí)庫(kù)的構(gòu)建,將整理后的數(shù)據(jù)載入到知識(shí)庫(kù)中。
3)向量查詢。本文使用向量查詢算法進(jìn)行知識(shí)庫(kù)的查詢,從而獲取相關(guān)的信息。
4)信息返回。本文將查詢到的信息返回給用戶,用戶可以根據(jù)查詢結(jié)果進(jìn)行營(yíng)養(yǎng)配餐的推薦。
3.3.3 提示工程
提示工程是模型生成回答的關(guān)鍵步驟,好的提示工程可以讓模型更好地理解問(wèn)題,從而生成更準(zhǔn)確、更人性化的回答。在營(yíng)養(yǎng)配餐推薦系統(tǒng)中,本文需要為模型提供一系列的提示,以便模型能夠更好地理解問(wèn)題,并生成相關(guān)的營(yíng)養(yǎng)配餐建議。
提示工程的實(shí)現(xiàn)主要包括以下幾個(gè)步驟:
1)問(wèn)題分析。本文需要對(duì)問(wèn)題進(jìn)行分析,提取出問(wèn)題的關(guān)鍵信息。例如,如果問(wèn)題是“我想吃一頓健康的早餐,你能給我一些建議嗎?”,本文可以提取出“早餐”“健康”等關(guān)鍵詞。
2)提示設(shè)計(jì)。根據(jù)問(wèn)題分析的結(jié)果,本文可以設(shè)計(jì)出一系列的提示。例如,包括每日所需熱量的計(jì)算、宏觀營(yíng)養(yǎng)素的分配比例、特定營(yíng)養(yǎng)素的補(bǔ)充建議、適合特定健康狀況的食物選擇等。此外,還可以提供具體的餐單設(shè)計(jì),包括早餐、午餐、晚餐和小吃的建議,以及食譜和食物準(zhǔn)備技巧,幫助用戶實(shí)現(xiàn)營(yíng)養(yǎng)均衡和健康目標(biāo)等提示。
4 實(shí)驗(yàn)測(cè)試
本章節(jié)通過(guò)一系列實(shí)驗(yàn)來(lái)評(píng)估LoRA微調(diào)方法對(duì)大型語(yǔ)言模型Qwen在菜譜問(wèn)答任務(wù)中的影響,設(shè)計(jì)了3個(gè)實(shí)驗(yàn)來(lái)展示模型在不同難度級(jí)別的問(wèn)答效果,并通過(guò)多種評(píng)估方式來(lái)量化模型性能的提升。
4.1 展示不同模型問(wèn)答效果
在這一部分,本文將展示基于AIGC的營(yíng)養(yǎng)推薦系統(tǒng)與不同模型的問(wèn)答效果進(jìn)行對(duì)比。本文將準(zhǔn)備一系列問(wèn)題,涵蓋營(yíng)養(yǎng)、健康、食譜等領(lǐng)域的知識(shí),并對(duì)不同模型的回答進(jìn)行比較和分析。從中挑選經(jīng)典回答如表3不同模型回答例子進(jìn)行展示。
4.2 性能評(píng)估
為了驗(yàn)證LoRA微調(diào)方法在大型語(yǔ)言模型Qwen上的性能,我們?cè)O(shè)計(jì)了一系列問(wèn)答實(shí)驗(yàn),以比較微調(diào)前后模型在處理不同難度級(jí)別(簡(jiǎn)單、中等、困難)的菜譜相關(guān)問(wèn)題上的表現(xiàn)。實(shí)驗(yàn)中,我們選取了3組20個(gè)問(wèn)題,分別對(duì)應(yīng)3個(gè)難度級(jí)別,以測(cè)試模型的理解和生成能力,其中簡(jiǎn)單組為日常的營(yíng)養(yǎng)常識(shí)及建議為主;中等組為在某些消極條件下的食療問(wèn)題為主;困難組是在有較為嚴(yán)重的疾病的飲食營(yíng)養(yǎng)規(guī)劃或其他較為復(fù)雜的情況為主。
4.2.1 測(cè)試有效性評(píng)估
本文通過(guò)計(jì)算模型對(duì)各個(gè)問(wèn)題的有效回答率來(lái)評(píng)估其性能。有效回答率是指模型生成的答案與提問(wèn)的相關(guān)性和準(zhǔn)確性。為了量化這一指標(biāo),我們定義了以下評(píng)估標(biāo)準(zhǔn):
1)相關(guān)性。答案必須與問(wèn)題直接相關(guān),不能偏離主題。
2)準(zhǔn)確性。答案中的信息必須是正確無(wú)誤的,不能包含錯(cuò)誤或誤導(dǎo)性的內(nèi)容。
3)完整性。答案應(yīng)當(dāng)提供足夠的信息來(lái)全面回答問(wèn)題,而不是片面或不完整的信息。
我們對(duì)微調(diào)前后的Qwen模型在回答這20個(gè)問(wèn)題時(shí)的表現(xiàn)進(jìn)行了對(duì)比。每個(gè)問(wèn)題的答案都由獨(dú)立評(píng)估員根據(jù)上述標(biāo)準(zhǔn)進(jìn)行評(píng)分,以確定答案的有效性。實(shí)驗(yàn)結(jié)果如表4所示,經(jīng)過(guò)LoRA微調(diào)的Qwen營(yíng)養(yǎng)大模型在所有難度級(jí)別的問(wèn)題上都有更高的有效回答率,尤其是在困難問(wèn)題上,模型的表現(xiàn)有顯著提升。
4.2.2 用戶客觀評(píng)估
本文將邀請(qǐng)一定數(shù)量的用戶參與實(shí)驗(yàn),向他們提供本文的營(yíng)養(yǎng)推薦系統(tǒng),并要求他們提出問(wèn)題并評(píng)價(jià)系統(tǒng)的回答質(zhì)量。本文將收集用戶的反饋意見,包括對(duì)系統(tǒng)回答的滿意度、易用性方面的評(píng)價(jià),根據(jù)用戶的意見得出圖4模型對(duì)比圖。其中用戶對(duì)于營(yíng)養(yǎng)大模型的評(píng)價(jià)較高,均超過(guò)主流的大模型,因此本文設(shè)計(jì)的系統(tǒng)更受用戶喜歡。
4.3 專業(yè)性評(píng)估
本次評(píng)估還邀請(qǐng)了幾位營(yíng)養(yǎng)領(lǐng)域的專家對(duì)微調(diào)后模型的輸出進(jìn)行評(píng)估。專家們基于回答的專業(yè)性、創(chuàng)造性和實(shí)用性給出了反饋評(píng)價(jià)。如圖5專家評(píng)估效果圖,專家評(píng)估結(jié)果表明,LoRA微調(diào)方法使得Qwen模型在理解復(fù)雜菜譜概念和術(shù)語(yǔ)方面有了顯著進(jìn)步,專家們對(duì)微調(diào)后模型的專業(yè)性給予了高度評(píng)價(jià)。
5 結(jié) 論
本文研究表明,即使在大型預(yù)訓(xùn)練模型已經(jīng)取得了顯著進(jìn)步的情況下,針對(duì)性的微調(diào)仍然能夠?yàn)槟P蛶?lái)額外的性能提升。LoRA微調(diào)方法通過(guò)局部參數(shù)更新,有效避免了全面重訓(xùn)練帶來(lái)的計(jì)算成本和災(zāi)難性遺忘問(wèn)題,以及通過(guò)外掛知識(shí)庫(kù)的方式連接向量數(shù)據(jù)庫(kù)對(duì)問(wèn)題進(jìn)行檢索返回。這種方法的成功應(yīng)用,為未來(lái)在其他專業(yè)領(lǐng)域內(nèi)定制化模型提供了一條可行的路徑。
參考文獻(xiàn):
[1] 白雪.數(shù)智化投研實(shí)踐與新趨勢(shì) [J].人工智能,2023(2):90-99.
[2] 馮志偉,張燈柯,饒高琦.從圖靈測(cè)試到ChatGPT——人機(jī)對(duì)話的里程碑及啟示 [J].語(yǔ)言戰(zhàn)略研究,2023,8(2):20-24.
[3] 黃昇.基于Python的高校電子文檔管理系統(tǒng) [J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2021,30(4):69-76.
[4] 張鶴譯,王鑫,韓立帆,等.大語(yǔ)言模型融合知識(shí)圖譜的問(wèn)答系統(tǒng)研究 [J].計(jì)算機(jī)科學(xué)與探索,2023,17(10):2377-2388.
[5] 胡政.基于文本和語(yǔ)音的中文分詞研究 [D].南京:東南大學(xué),2022
[6] 王蘭蘭,康利娟.大數(shù)據(jù)中基于Web的知識(shí)圖譜系統(tǒng)設(shè)計(jì) [J].信息記錄材料,2023,24(4):156-158.
[7] 潘雨黛,張玲玲,蔡忠閩,等.基于大規(guī)模語(yǔ)言模型的知識(shí)圖譜可微規(guī)則抽取 [J].計(jì)算機(jī)科學(xué)與探索,2023,17(10):2403-2412.
[8] 陳書雨,曹集翔,姚寒冰.一種中文分詞的預(yù)處理技術(shù) [J].計(jì)算機(jī)時(shí)代,2023(5):123-126.
[9] 張偉男,劉挺.ChatGPT技術(shù)解析及通用人工智能發(fā)展展望 [J].中國(guó)科學(xué)基金,2023,37(5):751-757.
[10] 賀廣福,薛源海,陳翠婷,等.基于容忍因子的近似最近鄰混合查詢算法 [J].大數(shù)據(jù),2024,10(1):17-34.
作者簡(jiǎn)介:陳鉆凱(2000—),男,漢族,廣東陸豐人,本科在讀,主要研究方向:大語(yǔ)言模型應(yīng)用;王志林(2003—),男,漢族,廣東興寧人,本科在讀,主要研究方向:自然語(yǔ)言處理、數(shù)據(jù)庫(kù)管理和開發(fā);朱潤(rùn)鍵(2004—),男,漢族,廣東汕頭人,本科在讀,主要研究方向:軟件開發(fā);曾沛樂(lè)(2004—),男,漢族,廣東潮陽(yáng)人,本科在讀,主要研究方向:軟件開發(fā)。
DOI:10.19850/j.cnki.2096-4706.2024.17.018
收稿日期:2024-01-26
基金項(xiàng)目:國(guó)家級(jí)大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃項(xiàng)目(DCXM2023042)
Research on Nutritional Meal Recommendation System Based on AIGC
CHEN Zuankai, WANG Zhilin, ZHU Runjian, ZENG Peile
(Software Engineering Institute of Guangzhou, Guangzhou 510990, China)
Abstract: This paper proposes a nutrition meal recommendation system based on Artificial Intelligence Generated Content (AIGC), which combines the Qwen large language model and LORA technology for fine-tuning to achieve more accurate nutrition advice and meal recommendations. By constructing a rich knowledge base of nutrition information and recipe data, and utilizing vector databases for efficient retrieval, the system can quickly respond to user queries and provide personalized meal plans. Experimental results demonstrate that the system outperforms traditional methods in recommendation accuracy and user experience. The contribution of this research lies in proposing a new method for nutrition meal recommendations and validating its effectiveness through experiments.
Keywords: AIGC; nutrition meal recommendation system; large language model; fine-tuning technology; vector database