शैक्षिक डेटा खनन: परिचय

नेल्सन मंडेला ने कहा: “शिक्षा सबसे शक्तिशाली हथियार है
जिसका उपयोग आप दुनिया को बदलने के लिए कर सकते हैं। ”

भाग्य की इच्छा से, हम डेटा माइनिंग कोर्स ( गेमचेंजर्स प्रोग्राम, सेंट पीटर्सबर्ग ) में प्रतिभागियों में से एक बनने के लिए भाग्यशाली थे। पाठ्यक्रम का उद्देश्य आईटी उद्योग के विभिन्न क्षेत्रों में डेटा प्रसंस्करण के लिए विधियों और प्रौद्योगिकियों का अध्ययन करना है। व्याख्यान सबसे बड़ी आईटी कंपनियों के विशेषज्ञों द्वारा दिए गए हैं, और छात्र वास्तविक कार्यों और परियोजनाओं पर काम कर रहे हैं।
और ऐसा हुआ कि इस पाठ्यक्रम के ढांचे के भीतर, हमारा कार्य समूह शैक्षिक डेटा खनन के क्षेत्र में एक परियोजना विकसित कर रहा है।

रूस में, अब तक, कुछ लोग इस दिशा के अस्तित्व से अवगत हैं, इसलिए शुरुआत के लिए हम ईडीएम के बारे में सामान्य शब्दों में सभी रूपरेखाएँ करेंगे: सामान्य लक्ष्य, जो इसका उपयोग कर सकते हैं और क्यों।

शैक्षिक डेटा खनन



"शैक्षिक डेटा खनन: कला की स्थिति की समीक्षा" लेख के अनुसार, ईडीएम शैक्षिक निर्णय लेने के लिए शैक्षिक डेटा के शोध के लिए तरीके विकसित कर रहा है।
// उदाहरण के लिए, छात्रों और उन "दृष्टिकोणों" को समझने के लिए जिनके द्वारा वे सीखते हैं।
यह स्पष्ट है कि डीएम और ईडीएम दोनों डेटा में छिपे हुए पैटर्न को खोजने में लगे हुए हैं। लेकिन क्या ईडीएम अन्य डेटा माइनिंग सबरीज़ से अलग है?

खैर, सबसे पहले, ये लक्ष्य हैं। ईडीएम शैक्षिक प्रक्रिया को बेहतर बनाने के लिए, छात्रों को सही दिशा में निर्देशित करने के लिए, शिक्षकों को सिफारिशें देने के लिए और, इसके अलावा, शिक्षा की घटना के बहुत सार में तल्लीन करने की कोशिश कर रहा है - यह समझने के लिए कि हम कैसे जानकारी को अवशोषित करते हैं, कौशल और योग्यता हासिल करते हैं।

दूसरे, डेटा। ईडीएम द्वारा उपयोग किए जाने वाले लोगों के पास काफी जटिल आंतरिक शब्दार्थ हैं। पदानुक्रम के कई महत्वपूर्ण स्तर और विभिन्न प्रकार के डेटा के बीच संबंध हैं।
ईडीएम के लिए ऑन-लाइन सिस्टम अक्सर लॉग फाइल का उपयोग करते हैं जिसमें साइट पर उपयोगकर्ता के काम के बारे में सभी जानकारी होती है (क्लिक, क्लिक, क्लिक, रेटिंग और बहुत कुछ)। यह ध्यान देने योग्य है कि ईडीएम का उपयोग न केवल ऑनलाइन सिस्टम में किया जा सकता है, बल्कि पारंपरिक स्कूलों और विश्वविद्यालयों में भी किया जा सकता है। एक और बात यह है कि इस मामले में हमारे पास बहुत खंडित और अपर्याप्त जानकारी है। जबकि ऑनलाइन पाठ्यक्रम में सब कुछ पहले से ही एक एकल इलेक्ट्रॉनिक प्रारूप में है और ऐसे संसाधनों पर दर्शकों का पैमाना जैसे कि कसेरा मानक कक्षा से कई गुना अधिक है। यह इन आयामों के लिए है जो डीएम में मशीन लर्निंग एल्गोरिदम का उपयोग करने के लिए समझ में आता है।

और तीसरा, ये स्वयं विधियाँ हैं। मानक डेटा माइनिंग विधियों के अतिरिक्त: क्लस्टरिंग, वर्गीकरण, प्रतिगमन, सहसंबंध, विज़ुअलाइज़ेशन, सांख्यिकी, एसोसिएशन के नियमों की खोज ..., EDM भी कुछ विशिष्ट लोगों का उपयोग करता है, उदाहरण के लिए, साइकोमेट्रिक्स के क्षेत्र से। विकिपीडिया के अनुसार, साइकोमेट्री मनोवैज्ञानिक माप के सिद्धांत और पद्धति का अध्ययन करती है और आँकड़ों का हिस्सा है। ईडीएम में, इस अनुशासन के तरीकों से छात्रों को सूचना धारणा समूहों ( एमबीटीआई टाइपोलॉजी देखें) में विभाजित करने में मदद मिलती है, जो बदले में आपको छात्र को शैक्षिक प्रक्रिया को अनुकूलित करने की अनुमति देता है: उपयुक्त प्रकार की सामग्री का चयन करें और इसे एक निश्चित तरीके से व्यवस्थित करें।
वरीयताओंस्पष्टीकरण (जोर देने वाले क्या हैं)
बहिर्मुखता - अंतर्मुखताचेतना का झुकाव
अनुभूति - अंतर्ज्ञानएक स्थिति में अभिविन्यास का रास्ता
सोच - विचारनिर्णय लेने का आधार
निर्णय - धारणानिर्णय लेने का तरीका
देखें [ मायर्स-ब्रिग्स टाइपोलॉजी ]

और अब, शायद, ईडीएम किसके लिए और क्यों उपयोग किया जाता है, इसके बारे में कुछ शब्द।

"लक्ष्य श्रोता"


एजुकेशनल डेटा माइनिंग के उपयोगकर्ताओं के कई मुख्य समूह हैं, उदाहरण के लिए प्रसिद्ध कोर्टेरा पोर्टल का उपयोग करके उन पर विचार करें।



इसलिए, हमारे पास एक छात्र है जो समझना चाहता है कि कैसे प्रोग्रामर को प्रोग्राम करना है।
एक छात्र कौरसेरा में प्रवेश करता है और स्टैनफोर्ड विश्वविद्यालय के प्रोफेसर एलेक्स एकेन से कंपाइलर्स पाठ्यक्रम में प्रवेश करता है।
आइए देखें कि प्रशिक्षण और उनके व्यक्तिगत डेटा के बारे में जानकारी के आधार पर, ईडीएम उसे क्या पेशकश कर सकता है, जिसे वह प्रोफ़ाइल में भरता है या पाठ्यक्रम के उत्तरों के जवाब से।



1. छात्र / छात्राएं / छात्र


छात्र को कंपाइलर पाठ्यक्रम को सफलतापूर्वक पूरा करने और आगे के प्रशिक्षण के लिए लौटने के लिए, कोर्टसेरा प्लेटफॉर्म निम्नलिखित कार्य कर सकता है:

जब कोई छात्र इंटरनेट पर ज्ञान प्राप्त करना चाहता है, तो वह एक ऑनलाइन शैक्षणिक प्रणाली का उपयोग करता है। वह व्यक्तिगत सामग्री और अनुरूप मदद प्रदान करते हुए, छात्र के साथ बातचीत करती है।


सिस्टम इस बारे में विस्तृत जानकारी एकत्र करता है कि छात्र किस सामग्री को सबसे अधिक बार खोलता है (कार्य, वीडियो, पाठ), साथ ही इसे देखने की गति, अवधि और आवृत्ति। डेटाबेस में सहेजने के बाद।


प्राप्त जानकारी संसाधित है और प्राप्त प्रशिक्षण मॉडल के आधार पर, सिस्टम छात्र को पाठ्यक्रम को सर्वोत्तम रूप से अनुकूलित करने की कोशिश करता है।



प्रणाली अन्य पाठ्यक्रमों के लिए सिफारिशें भी प्रदान कर सकती है। बड़ी संख्या में अनुशंसा एल्गोरिदम हैं जिनका आप उपयोग कर सकते हैं। स्निक्लेंको हब में सिफारिश प्रणालियों के एल्गोरिदम के बारे में बहुत अच्छी तरह से लिखा गया है



यदि प्रणाली यह देखती है कि छात्र क्विज़ और होमवर्क से बहुत जल्दी निपटता है, तो सीखने की सामग्री को जल्दी से छोड़ देता है, तो वह उसे पाठ्यक्रम के लिए "वर्कअराउंड" (छोटा) मार्ग प्रदान कर सकता है - अधिक जटिल कार्य, परीक्षा पास करते समय अधिक कठिन स्तर से गुजरना आदि।



अन्यथा, यह एक अनुकूलित टूलटिप उत्पन्न करने में मदद करेगा। यदि किसी छात्र को पाठ्यक्रम के किसी भी भाग के साथ समस्या है (यह क्विज़, होमवर्क और फोरम पर प्रश्नों में त्रुटियों के आधार पर समझा जा सकता है), सिस्टम अतिरिक्त सामग्री पर एक सिफारिश दे सकता है या इसे संबंधित अध्याय पर पुनर्निर्देशित कर सकता है।




2. शिक्षक / प्रशिक्षक


उसी समय, एलेक्स एकेन जैसे शिक्षकों को भी पाठ्यक्रम में सुधार करने के लिए जानकारी और उपकरण की आवश्यकता होती है। सिस्टम शिक्षक को निम्नलिखित जानकारी दे सकता है:

पाठ्यक्रम बनाते समय, मौजूदा पाठ्यक्रमों के विश्लेषण के आधार पर, शिक्षक अग्रिम में छात्र के व्यवहार की भविष्यवाणी करने और उसकी जरूरतों के लिए सामग्री को अनुकूलित करने में सक्षम होगा।




पाठ्यक्रम के दौरान, सीखने की प्रक्रिया के बारे में एक फिटबैक (प्रतिक्रिया) प्राप्त करना बहुत महत्वपूर्ण है। उदाहरण के लिए, यह एक अभिन्न मूल्यांकन या दर पर छात्रों के काम की गतिशीलता (पूर्ण प्रश्नोत्तरी, होमवर्क, आदि) हो सकता है।


साथ ही, शिक्षक के पास छात्रों को समूहों में वर्गीकृत करने का अवसर होता है, उदाहरण के लिए, शैक्षणिक प्रदर्शन, गतिविधि, लिंग, आयु, पृष्ठभूमि आदि में।




सिस्टम त्रुटियों की आवृत्ति और वितरण के लिए उपकरण प्रदान करता है जो छात्र बनाते हैं। अतिरिक्त मापदंडों का उपयोग करना, जैसे कि
देखे गए विषय, पिछली रेटिंग आदि, त्रुटियों के कारणों को समझना संभव है।




3. डेवलपर्स / शोधकर्ताओं


एंड्रयू एनए और डफ़ने कोल्लर, मंच के निर्माता के रूप में, पाठ्यक्रम में मांग में रुचि रखते हैं और छात्र नया ज्ञान प्राप्त कर रहे हैं, इसलिए, शोधकर्ताओं के एक समूह (कंप्यूटर विज्ञान की दिशा से) के साथ मिलकर, वे ईडीएम उपकरण विकसित कर रहे हैं जिसके लिए वे प्रयास करते हैं:



छात्र सीखने में सुधार करें। उदाहरण के लिए, चयनित पाठ्यक्रमों के आंकड़ों के अनुसार, छात्रों को आगे की शिक्षा के लिए सिफारिशें दी जा सकती हैं, एक अनुसूची + जो सब कुछ ऊपर वर्णित है, उसे तैयार किया जा सकता है।


पाठ्यक्रम सामग्री की संरचना और सीखने की प्रक्रिया में इसकी प्रभावशीलता का आकलन करें। डेवलपर्स की आंखों से पहले, संसाधन पर क्या हो रहा है, इसकी पूरी तस्वीर। सफल पाठ्यक्रमों को छोड़ना और सुधार करना और जानकारी पेश करने का सबसे अच्छा तरीका चुनना उनके हित में है।



स्वचालित रूप से छात्र और संरक्षक मॉडल बनाएं। शिक्षकों और छात्रों के बारे में डेटा के आधार पर, साइकोमेट्रिक्स यहां मदद करेंगे, आप छात्र-संरक्षक के सर्वोत्तम संयोजनों को चुन सकते हैं, जिससे सामग्री की पाचनशक्ति बढ़नी चाहिए।



4. संगठन: विश्वविद्यालय / कंपनियां / ... | 5. शैक्षिक प्रक्रिया / प्रणाली प्रशासकों के प्रशासक


उच्च शिक्षा संस्थानों जैसे स्टैनफोर्ड, ईडीएम कार्यान्वयन में मदद मिलेगी:

छात्रों के समूहों को विशिष्ट पाठ्यक्रमों की पेशकश करें जो उपयोगी साबित हो सकते हैं, जिससे कक्षाओं की सामग्री अधिक लागत प्रभावी हो सकती है।




छात्र प्रशिक्षण की गुणवत्ता में सुधार। ईडीएम का उपयोग करते हुए, प्रशासक को शिक्षकों, पाठ्यक्रम, और यह समझने के लिए नए उपकरण मिलते हैं कि सीमित संसाधनों (शिक्षकों, डेवलपर्स और सामग्रियों) का बेहतर उपयोग कैसे किया जाए।



ईडीएम एल्गोरिदम सिस्टम प्रशासकों को बताएगा कि कब पीक नेटवर्क लोड की उम्मीद है, और उपयोगकर्ताओं के लिए उन्हें अनुकूल करके वेब सेवाओं का अनुकूलन कैसे करें।




अंत में, ईडीएम का उपयोग।


विकास के मुख्य क्षेत्रों को आरेख में दिखाया गया है। हम इस तथ्य पर आपका ध्यान आकर्षित करते हैं कि डेटा 2009 तक 300 कार्यों पर एकत्र किए जाते हैं।



विषय के अधिक विस्तृत परिचय के लिए, मैं अनुशंसा करता हूं:
  1. आलेख:
  2. कौरसेरा : coursera.org
  3. टाइम्स ऑफ बुक: सी। रोमेरो, एस। वेंचुरा एट अल। शैक्षिक डेटा खनन की पुस्तिका। 2010 (अमेज़न)
  4. पुस्तक दो: सी। रोमेरो और एस। वेंचुरा। ई-लर्निंग में डाटा माइनिंग। 2006 (अमेज़न)
  5. टेड ऑनलाइन शिक्षा: डाफ्ने कोल्लर: हम ऑनलाइन शिक्षा से क्या सीख रहे हैं

यदि विषय दिलचस्प है, तो यह पद ईडीएम पदों की एक श्रृंखला का पहला हिस्सा हो सकता है। मुझे बताइए।

Source: https://habr.com/ru/post/In181053/


All Articles