好的教育大數(shù)據(jù)怎樣才能挖掘出來 豐富多樣的教育大數(shù)據(jù)如何處理
來源:好上學(xué) ??時間:2023-07-31
*總理在今年的*工作報告中指出:“實(shí)施大數(shù)據(jù)發(fā)展行動,加強(qiáng)新一代人工智能研發(fā)應(yīng)用,在醫(yī)療、養(yǎng)老、教育、文化、體育等多領(lǐng)域推進(jìn)‘互聯(lián)網(wǎng)+’。”當(dāng)前,發(fā)展教育大數(shù)據(jù)已成為推進(jìn)我國當(dāng)前教育領(lǐng)域深化改革和創(chuàng)新發(fā)展的戰(zhàn)略選擇。
黨的十九大報告提出,努力讓每個孩子都能享有公平而有質(zhì)量的教育。在教育領(lǐng)域?qū)嵤┐髷?shù)據(jù)發(fā)展行動中,好的教育大數(shù)據(jù)怎樣才能挖掘出來,又該進(jìn)行怎樣的分析處理?大數(shù)據(jù)怎樣為教育助力使其更加公平優(yōu)質(zhì)?對此,記者對相關(guān)專家和從業(yè)人員進(jìn)行了深入采訪。
訪談嘉賓:
戚萬學(xué) 曲阜師范大學(xué)黨委書記、中國教育大數(shù)據(jù)研究院院長
甘健侯 云南師范大學(xué)民族教育信息化教育部重點(diǎn)實(shí)驗(yàn)室常務(wù)副主任
方海光 首都師范大學(xué)教育技術(shù)系教授、遠(yuǎn)程教育研究所所長
李 超 學(xué)堂在線總裁
好的教育大數(shù)據(jù)怎樣才能挖掘出來
記者:當(dāng)前,“大數(shù)據(jù)”成了一個時髦名詞。好的教育大數(shù)據(jù)是什么樣?教育數(shù)據(jù)數(shù)量越多越好嗎?
戚萬學(xué):大數(shù)據(jù)之“大”,我們一般理解為“數(shù)量”規(guī)模之大,通常數(shù)據(jù)樣本量越大,越有利于對數(shù)據(jù)進(jìn)行多維的聚類、聚合、聚集分析,更有利于“掃描”和“透視”看似毫無價值、毫無關(guān)聯(lián)數(shù)據(jù)之中的相關(guān)性、邏輯性直至規(guī)律性,從而可以進(jìn)行評價和趨勢預(yù)測。大數(shù)據(jù)之“大”,還有一種理解是處理技術(shù)的“大”。對于教育大數(shù)據(jù)而言,需要數(shù)據(jù)的不斷累積和增多,同時也需要相應(yīng)大數(shù)據(jù)挖掘分析技術(shù)不斷提高。教育大數(shù)據(jù)的價值在于幫助決策,一般而言,好的教育大數(shù)據(jù)要具備精確、完整、可靠性、視覺化呈現(xiàn)、存取性高等特征。
甘健侯:教育大數(shù)據(jù)之“大”并非只是數(shù)量之大,更為強(qiáng)調(diào)的是數(shù)據(jù)蘊(yùn)含的“價值”之大。實(shí)質(zhì)上,教育大數(shù)據(jù)并不是越多越好。對于數(shù)據(jù)科學(xué)家來說,重要的不是得到最多的數(shù)據(jù),而是看通過哪些數(shù)據(jù)可以得出真正有價值的結(jié)果。教育大數(shù)據(jù)大致分為教學(xué)資源類大數(shù)據(jù)、教育教學(xué)管理大數(shù)據(jù)、教與學(xué)行為大數(shù)據(jù)、教育教學(xué)評估大數(shù)據(jù)四類。教育大數(shù)據(jù)并非包括所有數(shù)據(jù),因?yàn)榻逃顒舆^程中也會產(chǎn)生大量無意義的“噪聲”數(shù)據(jù),需要根據(jù)教育的應(yīng)用目的進(jìn)行數(shù)據(jù)過濾和“清洗”,為后期深度挖掘和分析做準(zhǔn)備。因此,好的教育大數(shù)據(jù)一定是科學(xué)、客觀、準(zhǔn)確、有用的,要把數(shù)據(jù)與人的差異化有機(jī)結(jié)合起來。
方海光:教育大數(shù)據(jù)并非越多越好,教育大數(shù)據(jù)要能服務(wù)教育發(fā)展、具有教育目的性,而非盲目地囊括一切數(shù)據(jù)。教育大數(shù)據(jù)是以業(yè)務(wù)應(yīng)用導(dǎo)向?yàn)樵u判標(biāo)準(zhǔn)的,即應(yīng)用是檢驗(yàn)教育大數(shù)據(jù)的唯一標(biāo)準(zhǔn)。好的教育大數(shù)據(jù)可以在提升教育質(zhì)量、促進(jìn)教育公平、實(shí)現(xiàn)個性化學(xué)習(xí)、優(yōu)化教育資源配置、輔助教育科學(xué)決策等方面發(fā)揮重要作用。
記者:教育大數(shù)據(jù)豐富多樣、種類繁多,在海量的教育數(shù)據(jù)中,怎樣挖掘出好的教育大數(shù)據(jù)?
戚萬學(xué):教育過程中每分每秒都在產(chǎn)生大量豐富、復(fù)雜且多樣的信息,這些信息必須經(jīng)過深入的挖掘才能轉(zhuǎn)化成可以運(yùn)用的教育數(shù)據(jù)。如何挖掘教育大數(shù)據(jù)一直是擺在教育研究者與*面前的重要課題,也是一個難題。好的教育大數(shù)據(jù)是憑借數(shù)據(jù)挖掘者敏銳的洞察力與先進(jìn)的挖掘技術(shù)來獲得的。好的教育大數(shù)據(jù)必須有好的理念、好的問題意識、有趣的研究設(shè)計,然后才是好的挖掘技術(shù)。在數(shù)據(jù)挖掘過程中,應(yīng)該避免唯技術(shù)化和工具化傾向。
李超:大數(shù)據(jù)挖掘不能離開教育實(shí)踐,無論是在線教育還是課堂教學(xué),我們都不能為了抓數(shù)據(jù)而去抓數(shù)據(jù),而要從貼近教師的教學(xué)需要、滿足學(xué)生的學(xué)習(xí)需要出發(fā),真正以學(xué)習(xí)者為中心去獲取大數(shù)據(jù)。非結(jié)構(gòu)化的教育數(shù)據(jù)如圖片文本,需要通過充分利用好現(xiàn)在的信息技術(shù)手段,通過人工智能、模式分析、行為分析的了解和認(rèn)知科學(xué)的發(fā)展、教育技術(shù)的最新理念,把它們轉(zhuǎn)換成結(jié)構(gòu)化的教育數(shù)據(jù)。更關(guān)鍵的是要能夠把這些非結(jié)構(gòu)化數(shù)據(jù),通過模型在教育過程中去指導(dǎo)、幫助教師以及指導(dǎo)整個系統(tǒng)開發(fā),然后再去獲取數(shù)據(jù)優(yōu)化模型,通過往復(fù)的過程以后,可以真正實(shí)現(xiàn)科學(xué)化指導(dǎo)。
甘健侯:好的教育大數(shù)據(jù)需要對教育數(shù)據(jù)進(jìn)行深度挖掘。這個過程中需要綜合運(yùn)用數(shù)學(xué)統(tǒng)計、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘和人工智能等多交叉領(lǐng)域的技術(shù)和方法,對教育大數(shù)據(jù)進(jìn)行處理和分析。通過數(shù)據(jù)建模,發(fā)現(xiàn)學(xué)習(xí)者學(xué)習(xí)結(jié)果與學(xué)習(xí)內(nèi)容、學(xué)習(xí)資源和教學(xué)行為等變量的相關(guān)關(guān)系,來預(yù)測學(xué)習(xí)者未來的學(xué)習(xí)趨勢,促進(jìn)學(xué)習(xí)者有效學(xué)習(xí)的發(fā)生。
方海光:好的教育大數(shù)據(jù)也是重要的教育資源之一。為使數(shù)據(jù)資源物盡其用,當(dāng)前最需要的就是挖掘能夠促進(jìn)共建共享的教育大數(shù)據(jù)。共建共享不僅有利于加速教育大數(shù)據(jù)產(chǎn)品的應(yīng)用和開發(fā),也有利于降低成本優(yōu)化體驗(yàn)。對于半結(jié)構(gòu)化或非結(jié)構(gòu)化的數(shù)據(jù),可以采用自然語言理解、模式識別等人工智能手段進(jìn)行信息抽取,還可以通過專家人為地進(jìn)行協(xié)同標(biāo)簽處理,這樣可以將其轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù)。對于雜質(zhì)較多的數(shù)據(jù),可以在數(shù)據(jù)挖掘時進(jìn)行數(shù)據(jù)清洗。對于實(shí)時產(chǎn)生的數(shù)據(jù)可以使用自動獲取效率優(yōu)先的方式來采集數(shù)據(jù)。
豐富多樣的教育大數(shù)據(jù)如何處理
記者:在云存儲和云計算的基礎(chǔ)上,如何利用信息技術(shù)等手段對非結(jié)構(gòu)化和半結(jié)構(gòu)化教育數(shù)據(jù)進(jìn)行有效處理?
戚萬學(xué):非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),是大數(shù)據(jù)產(chǎn)生效力的重要途徑。常見的教育大數(shù)據(jù),都是非結(jié)構(gòu)化的類型,能直接進(jìn)行數(shù)據(jù)分析的結(jié)構(gòu)化數(shù)據(jù)反而較少。舉例而言,教師的教學(xué)視頻、學(xué)生的作業(yè)等都屬于非結(jié)構(gòu)化的數(shù)據(jù)。要解決非結(jié)構(gòu)化數(shù)據(jù)帶來的挑戰(zhàn),就是利用信息技術(shù)進(jìn)行數(shù)據(jù)轉(zhuǎn)化。在數(shù)據(jù)分析方面,目前已經(jīng)有相當(dāng)成熟的分析方式,包括傳統(tǒng)統(tǒng)計學(xué)的回歸分析、類別分析和決策樹等,真正面臨的挑戰(zhàn)反而是數(shù)據(jù)的清洗及去敏的處理,關(guān)鍵是確保數(shù)據(jù)與數(shù)據(jù)產(chǎn)生者之間的匿名性,即在經(jīng)過數(shù)據(jù)清洗后,無法通過數(shù)據(jù)去辨識出該數(shù)據(jù)所屬者的信息。如此,才能確保學(xué)生個人的信息不外流,符合一般教學(xué)及研究的倫理守則。
李超:在教育大數(shù)據(jù)的挖掘和分析上,在整個教育教學(xué)過程中,現(xiàn)有的手段能夠收集到的信息還不夠。在大量占有這些數(shù)據(jù)的時候,我們一定要利用人工智能或者最新的神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)等技術(shù),基于實(shí)踐數(shù)據(jù)去進(jìn)行處理總結(jié)和分析,同時要把這些結(jié)果和總結(jié)分析反哺到教育過程中去。
甘健侯:教育數(shù)據(jù)的處理可分為教育數(shù)據(jù)的獲取與抽取、教育數(shù)據(jù)的存儲與管理、教育數(shù)據(jù)的分析與挖掘三個階段。在云存儲和云計算的基礎(chǔ)上,傳統(tǒng)關(guān)系數(shù)據(jù)庫無論從描述能力上還是從管理數(shù)據(jù)的規(guī)模上,都無法應(yīng)對非結(jié)構(gòu)化和半結(jié)構(gòu)化的數(shù)據(jù)管理要求,因此如何利用信息技術(shù)建立有效的非結(jié)構(gòu)化和半結(jié)構(gòu)化教育數(shù)據(jù)管理平臺是關(guān)鍵。首先,針對半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)存儲和分析的需求,建立統(tǒng)一的數(shù)據(jù)模型。其次,利用云存儲和云計算,構(gòu)建分布式與并行處理模型和架構(gòu),支持高度并行化與可擴(kuò)展性,從而保證教育大數(shù)據(jù)的高效處理。再其次,支持查詢語言與數(shù)據(jù)可視化功能,滿足用戶對教育大數(shù)據(jù)進(jìn)行訪問與分析的接口需要,以提升教育數(shù)據(jù)處理的有效性。
標(biāo)簽:好的教育大數(shù)據(jù)怎樣才能挖掘出來??豐富多樣的教育大數(shù)據(jù)如何處理??