È immaginabile o addirittura auspicabile che degli algoritmi (e, quindi, dei computer) valutino in maniera automatica il livello di apprendimento raggiunto dagli studenti universitari? Si, secondo una nuova disciplina, denominata «Educational data mining». Proviamo a capirci qualcosa di più.

1) Il fenomeno. Con l’espressione «data mining» si fa riferimento a quel processo computazionale che crea modelli analizzando i dati quantitativi da diverse prospettive e dimensioni, classificandoli ed enucleando potenziali relazioni e impatti. «Data mining» significa estrarre conoscenza dai dati: è il terreno proprio della «data science». L’aggettivo «educational» ci dice che tale attività viene applicata al mondo della formazione, in particolare a quello della didattica online e dei cosiddetti MOOC (acronimo che sta per «Massive Open Online Courses», ovvero «Corsi aperti online su larga scala»). Gli studiosi di «Educational data mining» sostengono che è possibile dedurre conoscenze accurate dalla mole enorme di dati generati da ogni studente nelle proprie attività di apprendimento a distanza. In particolare essi ritengono che si possano prevedere le prestazioni e gli apprendimenti degli allievi in base alla valutazione dei loro risultati, della partecipazione, dell’impegno, dei voti e delle conoscenze disciplinari in un lavoro di apprendimento.

2) Le modalità. Ogni studente impegnato in attività di apprendimento a distanza «genera» tanti dati. Ad esempio: il tempo trascorso sulle piattaforme che erogano corsi online, il tipo di interazioni che si sono poste in essere, l’attività svolta sulla singola pagina consultata, le modalità di utilizzo del mouse, la velocità e il tipo di movimento degli occhi sullo schermo. Tali dati vengono elaborati attraverso le tecniche tipiche del «data mining». Tra di esse si possono ricordare: la «classificazione» attraverso la quale si possono mappare i dati in diverse classi predefinite così da conoscere i rendimenti, gli abbandoni, i comportamenti problematici, il livello di motivazione e così via; oppure il «clustering» che consente di trovare gruppi di studenti con caratteristiche di apprendimento simili in base al contenuto delle pagine visitate e dei loro modelli di navigazione online; o, ancora, «l’association rule» usata per scoprire regole di apprendimento in base alle caratteristiche e alle competenze degli studenti.

3) I vantaggi. I paladini di questo tipo di studi sottolineano le utilità che possono derivare dall’analizzare i «big data» relativi alla formazione. Gli studenti possono personalizzare l’apprendimento e migliorare il loro rendimento aumentando la consapevolezza di sé; i professori, grazie ai continui feedback sul lavoro svolto, possono fare interventi mirati per migliorare l’efficacia dell’insegnamento e fronteggiare per tempo la possibile emersione di difficoltà (a tacere della possibilità di sperimentare strategie didattiche innovative come il «collaborative learning»); le agenzie educative sono in grado di monitorare l’intero processo formativo per migliorarlo anche attraverso la riprogettazione dei piani di studio, la riduzione del tasso di abbandono, l’individuazione degli «studenti a rischio»; i genitori possono ottenere informazioni più specifiche circa le attività di studio dei propri figli.

4) Le criticità. Ma non manca chi evidenzia le tante perplessità innescate da questo tipo di approccio. In particolare si rimarca l’esistenza di problemi: a) tecnici: davvero possiamo ritenere attendibili dei dati raccolti in questo modo? Quale qualità, quale accuratezza, quale significato statistico possono avere dati accumulati in maniera massiva ma grezza? b) giuridici: c’è ovviamente il tema della tutela dei dati personali: chi può accedere ai dati degli studenti? per quanto tempo? che garanzie ci sono che essi non vengano utilizzati per profilare i ragazzi per le più svariate finalità più o meno commendevoli? c) etici: siamo sicuri che sia moralmente corretto affidare la valutazione degli apprendimenti a procedimenti totalmente automatizzati? può l’essere umano essere giudicato da una macchina? d) pedagogici: la valutazione degli apprendimenti è legata a filo doppio alle diverse teorie dell’apprendimento; se non c’è una chiara definizione delle finalità dell’insegnamento non si può avviare nessuna procedura di valutazione meno che mai una procedura basata sulla mera raccolta massiva di dati disomogenei.

5) Per non concludere. Gli studi di «Educational data mining» pongono l’ennesima nuova sfida. Le tecnologie schiudono possibilità inimmaginabili fino a poco tempo fa: la valutazione dell’apprendimento, non solo quello a distanza e non solo quello universitario, può essere affidato ad algoritmi. Possiamo demonizzare questo dato di realtà con il solo risultato di lasciare che le cose accadano senza controllo. Oppure si può assumere un atteggiamento più pragmatico: cercare di capire i fenomeni al fine di valorizzarne gli aspetti positivi e, soprattutto, essere in grado di contrastare quelli negativi.

 

l’Adige 13 ottobre 2020

 

Bibliografia

C. Romero, S. Ventura, Educational data mining: A survey from 1995 to 2005, Expert Systems with Applications, Volume 33, Issue 1, 2007, Pages 135-146, ISSN 0957-4174, https://doi.org/10.1016/j.eswa.2006.04.005.

 

Banihashem, S., Aliabadi, K., Pourroostaei Ardakani, S., Delaver, A., Nili Ahmadabadi, M. (2018). ‘Learning Analytics: A Systematic Literature Review‘, Interdisciplinary Journal of Virtual Learning in Medical Sciences, 9(2), pp. -. doi: 10.5812/ijvlms.63024

 

Wintrup, J. Higher Education’s Panopticon? Learning Analytics, Ethics and Student Engagement. High Educ Policy 30, 87–103 (2017). https://doi.org/10.1057/s41307-016-0030-8

 

Hanan Aldowah, Hosam Al-Samarraie, Wan Mohamad Fauzy, Educational data mining and learning analytics for 21st century higher education: A review and synthesis, Telematics and Informatics, Volume 37, 2019, Pages 13-49, ISSN 0736-5853, https://doi.org/10.1016/j.tele.2019.01.007.

 

Rajeshwari M., & Krishna Prasad K. (2020). Application of IoT in Analyzing Cognitive Skills of Students-A Systematic Literature Review. International journal of management, technology, and social sciences (IJMTS), 5(1), 158–184. http://doi.org/10.5281/zenodo.3821143

 

Qiujie Li, Rachel Baker, Mark Warschauer, Using clickstream data to measure, understand, and support self-regulated learning in online courses, The Internet and Higher Education, Volume 45, 2020, 100727,
ISSN 1096-7516, https://doi.org/10.1016/j.iheduc.2020.100727.

 

Skip to content