基于過程數據的學習預警模型設計與功能實現

分類:論文范文 發表時間:2021-09-10 10:29

  摘要:隨著教育大數據的興起,學習預警技術為教育信息化提供了有力支撐。基于此,文章首先充分利用在線學習過程中產生的海量數據,設置了學習預警的相關指標,并給出了定義與算法,在此基礎上將學習預警的維度確定為積極程度、作業成績和作業質量。隨后,文章通過模型權重調參,確定了各維度、指標的權重值,得到預警線閾值,并實證檢驗了其有效性。最后,文章設計了學習預警模型,搭建了一個基于過程數據的學習預警平臺,其投入使用結果顯示預警效果良好。基于過程數據的學習預警模型的提出與學習預警平臺的應用,大大提升了教學質量,降低了學生的掛科風險,有效實現了預警功能。

  關鍵詞:過程數據;學習預警;學習分析;教學管理;數據可視化

  隨著“互聯網+”理念的逐步發展,線上學習成為了一種主流的學習方式,各類線上學習平臺在教育領域的應用愈加廣泛[1],同時也產生了大量的過程數據——過程數據是在教學過程中產生的具有代表性、能反映學生學習情況的數據。而如何充分地利用這些過程數據,對學習中有困難或有掛科風險的學生及時、準確地進行預警,是當前研究的一大熱點[2]。考慮到學習預警是預測出有掛科風險學生群體的重要途徑[3],本研究針對學習過程中收集的相關數據,設計了一個基于過程數據的學習預警模型,并搭建了相應的網絡平臺,以實現預警功能。

基于過程數據的學習預警模型設計與功能實現

  一學習預警相關研究

  梳理近年來國內外學習預警的相關研究成果,本研究認為學習預警研究聚焦于以下三方面:

  ①學習預警技術和方法。研究者大多會有效結合機器學習和數據挖掘技術進行學習預警,其中以決策樹和多元線性回歸等方法較為常用、分類和聚類技術最為典型[4]。例如,Xu等[5]采用比基準法性能更好的、基于過程聚類的潛在因子法預警;吳青等[6]根據學生在Moodle平臺上的學習數據,采用決策樹、貝葉斯網絡、神經網絡、支持向量機方法進行預警;胡建紅等[7]基于K-Means聚類算法,獲取“雨課堂”在線學習平臺提供的數據進行預警。

  ②學習預警模型。很多學者從不同角度思考,設計了不同類型的學習預警模型。例如,肖君等[8]從目標(Object)、數據(Data)、分析(Analysis)、服務(Service)四個方面提出“ODAS”開放學習分析概念模型,并構建出學習者畫像;武法提等[9]設計了包括學習內容分析、學習行為分析和學習預測分析三個模塊的學習效果預測框架;而金義富等[10]設計了一種基于離群數據挖掘技術的課程、課堂、課外“三位一體”預警模型。

  二學習預警模型指標與維度的設置

  1指標的設置設置不同指標是為了從多方面反映學生的學習情況,使學習預警模型考慮的因素更全面,從而使學習預警更有效。學生每次在線上完成作業都會產生大量數據,本研究篩選出能反映學生學習成效并具有典型意義的數據,依此設置了學習預警的相關指標,給出了定義與算法。

  (1)開始時間排名

  (C1)①定義:C1表示學生開始在線做作業的時間先后排名。②計算方法:獲取該學生登錄平臺開始在線做作業的時間,首次做題時間越早,C1越靠前。

  (2)完成用時排名(C2)①定義:C2表示學生完成本次作業的用時長短排名。②計算方法:學生完成本次作業的用時長短計算如公式(1)所示,用時越短,C2越靠前。其中,C2(0)為該學生完成本次作業的用時在班級中的排名,C2’則為排名附加值。考慮到有學生未做完題目而只提交了部分作業的情況,本研究分情況設置C2’值:若該學生全部提交,則設C2’值為0;若該學生未做完所有題目,則獲取未做題目的數量和總題目量,然后按公式(2)計算該學生本次作業的完成度——若完成度值處于[0.9,1)區間,則設C2’值為5;若完成度值處于[0.8,0.9)區間,則設C2’值為10……以此類推,若完成度值低于0.6,則設C2’值為25。

  2維度的設置

  現有的學習預警大都不具備多學科的知識結構和研究手段,且未有效借鑒教育學、心理學等領域的理論研究成果[16]。本研究運用文獻分析法和案例選取法,查閱大量相關文獻并結合實驗數據來源,將學習預警的維度確定為:積極程度(含C1、C2兩個指標)、作業成績(含C3、C4兩個指標)、作業質量(含C5、C6兩個指標)。

  三實驗設計與結果分析

  1數據來源

  本研究以江西省N大學軟件工程專業8個班的280名學生為研究對象,選取他們在程序設計類實驗輔助教學平臺上提交12次作業所產生的過程數據為數據源。作業題型有選擇題、程序填空題、編程題等,每次作業滿分為100分。選擇題和程序填空題均由線上學習平臺根據參考答案進行評分,編程題則由測試點(代碼執行時需通過的測試用例)進行評分。

  2模型權重調參

  能選取最貼合學生真實掛科結果的參數,往往是決定預警效果的關鍵。學習預警模型各參數權重的確定采用枚舉法:先將3個維度、6個指標的權重占比依次進行排列組合,再與上個年度多個班級期末考試的總評成績進行對比計算,搜索最優參數配置。具體的調參步驟如下:①通過導入操作,將從實驗輔助教學平臺獲得的過程數據上傳至預警模型。②不斷改變各權重占比,計算當前參數值下學習的總預警值與期末考試總評成績的均方誤差(MSE),如公式(8)所示。其中,yt為期末考試總評成績,yp為總預警值。實驗數據按照訓練集與驗證集7:3劃分,本研究選取5個班級共171名學生的過程數據作為訓練集,計算MSE值并排序。③根據排序結果,選出MSE值較小的一組數據。

  四學習預警模型與學習預警平臺

  1學習預警模型的設計

  根據各項指標與維度的設定,以及本實驗得出的預警線閾值,本研究設計了學習預警模型,如圖3所示。學習預警模型包含四個主要模塊:①數據收集模塊。從在線學習平臺上采用數據采集技術(如爬蟲)獲得學生產生的大量學習過程數據,然后進行數據清洗,解析出有用的數據進行存儲。②參數調優模塊。根據實驗結果確定各維度、指標的權重,并選取合適的預警線閾值。③學習預警模塊。根據本研究提出的各指標和各維度算法計算出預警值,據此判斷該學生是否存在學習危機——若存在危機,就采取人工介入、發送電子郵件等方式進行預警干預。④可視化模塊。對學生的線上學習情況進行多方位展示,使用大量圖表將在線學習平臺上的學習過程數據予以可視化,以直觀地呈現學生的學習狀態與學習效果。

  2學習預警平臺的功能設計及其實現

  依托學習預警模型,本研究搭建了一個基于過程數據的學習預警平臺,現已在江西省N大學投入使用,學習預警效果良好。學習預警平臺的主要功能如下:

  ①學生個人預警。考慮到教師和學生本人需掌握個人近期的學習情況,故學習預警平臺圍繞學生個人預警功能進行了設計。學生個人預警功能包括查看近期學習預警值、情緒分析報告、學習風險報告、作業平均分、各次作業得分變化與班級平均分的對比、各類題型的正答率、編程函數題得分情況、每題代碼平均提交次數等,所用圖表多采用雷達圖、折線圖、儀表盤展示。

  ②班級學情分析。教師應了解各班級情況及其差異,以便及時調整教學。班級學情分析功能包括查看班級預警情況、班級每次作業的平均分、得分中位數、高位/低位平均成績、不同分數段的人數及其占比、每次作業超過/低于平均分的人數、每次作業對該班學生而言的難易度與區分度等,所用圖表多采用箱型圖、餅圖、柱狀圖展示。

  結語

  本研究參考學生積極程度、作業成績和作業質量方面的數據進行建模,設計了學習預警模型,并搭建了一個基于過程數據的學習預警平臺。學習預警模型是一個通用型模型,其權重參數可以根據不同范圍的預警需要進行調整。同時,學習預警模型可與其它線上教學系統進行融合,以發掘出更多的預警維度指標,如從整合型教育數據系統中獲取數據,增加學生的社會與人口統計學特征、學生個人特征、學生投入度、學生近期作業是否進步、是否存在代碼抄襲現象等維度,結合實驗課上機表現,真實反映學生的線上學習情況并及時預警,以有效提高教學質量、降低學生的掛科風險。而學習預警平臺將學生在平臺上的過程數據做可視化處理,通過清晰、明了的圖表,來多角度、直觀地反映學生的學習狀態,其投入使用結果顯示預警效果良好。需要指出的是,現階段的實驗數據量不夠大,會在一定程度上影響學習預警模型結果的準確性。基于此,后續研究將考慮引入機器學習算法,獲取更多的數據投入訓練集,以進一步完善學習預警模型,實現基于多模態、全過程學習數據的學習預警。

  參考文獻

  [1]HuYH,LoCL,ShihSP.Developingearlywarningsystemstopredictstudents’onlinelearningperformance[J].ComputersinHumanBehavior,2014,(36):469-478.

  [2]蔣卓軒,張巖,李曉明.基于MOOC數據的學習行為分析與預測[J].計算機研究與發展,2015,(3):614-628.

  [3]王林麗,葉洋,楊現民.基于大數據的在線學習預警模型設計——“教育大數據研究與實踐專欄”之學習預警篇[J].現代教育技術,2016,(7):5-11.

  [4][16]朱鄭州,李政輝,劉煜,等.學習預警研究綜述[J].現代教育技術,2020,(6):39-46.

  楊豐玉陳雨安[通訊作者]聶偉鄭巍樊鑫

上一篇:基于模塊化教學的商務英語教學探索 下一篇:生態農業中植物保護新技術的應用研究

18以下岁禁止1000部免费