Introduzione all'analisi multivariata dei dati
Introduzione all'analisi multivariata dei dati
Descrizione del corso
Il corso offre un’introduzione ai concetti fondamentali dell’analisi multivariata, con un focus sulle principali tecniche di esplorazione e modellazione dei dati complessi. Dopo una panoramica della regressione multipla, il corso approfondisce metodi di riduzione dimensionale come l'analisi delle componenti principali e l'analisi delle corrispondenze, per concludere con tecniche di cluster analysis. Particolare attenzione è dedicata all’interpretazione dei risultati, alla scelta della tecnica più appropriata e ai principali limiti metodologici nell’applicazione pratica.
Carico di lavoro totale del corso: 16 ore
Questo MOOC è stato prodotto nell’ambito del progetto Edvance - Digital Education Hub per la Cultura Digitale Avanzata. Il progetto è finanziato dall’Unione europea - Next Generation EU, Componente 1, Investimento 3.4 “Didattica e competenze universitarie avanzate".
Risultati di Apprendimento Attesi
Al termine di questo corso, sarai in grado di:
- Comprendere i concetti fondamentali dell'analisi multivariata: Conoscere le principali tecniche di analisi dei dati multivariati, tra cui regressione multipla, analisi delle componenti principali, analisi delle corrispondenze e clustering.
- Applicare le principali tecniche di analisi dei dati multivariati in contesti empirici: Utilizzare le tecniche apprese per affrontare problemi concreti e situazioni reali, scegliendo in modo consapevole lo strumento più adatto per il tipo di dati e per gli obiettivi specifici dell'analisi.
- Integrare le tecniche di analisi multivariata in un'analisi completa: Combinare diverse tecniche apprese per analizzare e interpretare set di dati complessi.
- Interpretare criticamente i risultati dell'analisi multivariata: Riconoscere i limiti metodologici e le assunzioni alla base di ciascuna tecnica, e comunicare i risultati dell’analisi in modo chiaro e coerente.
In particolare, in conformità della classificazione ESCO (Classificazione europea di abilità/competenze, qualifiche e occupazioni) sarai in grado di:
- Area: Machine Learning e Analisi Dati
- sviluppare abilità e competenze relative a “tecnologie dell'informazione e della comunicazione (tic)”
- Area: Matematica e Statistica
- usare modelli matematici e statistici per descrivere fenomeni e prendere decisioni
- Area: Etica, Governance e Normativa
- sviluppare abilità e competenze relative a “normativa sulla sicurezza e protezione dei dati”
Prerequisiti
Conoscenza base dei fondamenti di Statistica
Attività
Oltre a fruire dei contenuti del corso, costituiti da video e da altri tipi di risorse online, saranno proposte varie tipologie di attività che contribuiranno a rendere più ricca e completa l’esperienza di studio: attività di riflessione sui contenuti proposti, quiz non valutati, discussioni nel forum.
Schema della sezione
-
-
Questa prima week introduce i concetti fondamentali dell'analisi multivariata e la distinzione tra variabili quantitative e qualitative. Presenta la matrice dei dati e la sfida di analizzare dati complessi, soprattutto quando si tratta di variabili qualitative con la tabella di contingenza, e introduce l'analisi delle corrispondenze come tecnica esplorativa visuale per rilevare strutture nascoste.
-
Questa seconda week approfondisce l'analisi delle corrispondenze e la costruzione della mappa fattoriale, con esempi specifici su come interpretarli. Introduce l'analisi delle corrispondenze multiple (ACM) per più variabili qualitative e sintetizza i concetti appresi.
-
La terza week introduce i due principali approcci di apprendimento dai dati: supervisionato e non supervisionato. Spiega la regressione lineare semplice e multipla come tecnica principale per l'apprendimento supervisionato, compresa la diagnosi della collinearità tra predittori.
-
L'ultima week presenta le tecniche dell'apprendimento non supervisionato: la PCA per la riduzione della dimensionalità e il clustering (K-means e gerarchico) per scoprire gruppi o segmenti naturali nei dati. Conclude con una guida su come scegliere la tecnica appropriata, i concetti chiave da ricordare e la mentalità dell'analista dati.
-
-
Trascrizioni video Cartella
-
Dispense Cartella
-
Valutazione
Il corso prevede l’erogazione di un Open Badge, ottenibile sulla base del punteggio raggiunto rispondendo ai quiz valutati. Hai tentativi illimitati di risposta per ciascun quiz ma dovrai attendere 15 minuti. Il corso si considera completato in modo adeguato all'ottenimento del certificato se raggiungerai almeno il 60% del punteggio complessivo in ciascuno dei quiz valutati. Il punteggio massimo ottenibile in ciascun quiz è indicato all’inizio del quiz stesso. Puoi vedere il punteggio che hai ottenuto nel quiz in corrispondenza dell’ultimo tentativo fatto oppure nella pagina “Valutazione”.
Attestato
Il corso prevede l’erogazione di un Open Badge rispondendo correttamente ad almeno il 60% delle domande in ciascuno dei quiz valutati e rispondendo al questionario finale.
Una volta completate le attività richieste potrai accedere a “Ottieni l’Open Badge”, avviando il rilascio del badge. Le indicazioni per accedere al badge saranno inviate al tuo indirizzo e-mail.
L’Open Badge non è un certificato ufficiale e non dà diritto a crediti universitari, a voti o a diplomi.
Accesso al corso e disponibilità dei materiali
Il corso è erogato in modalità online e gratuito.
Docenti del corso
Alfonso Carfora
Docente
Ricercatore presso l’Università di Macerata, Dipartimento di Economia e Diritto, insegna Calcolo delle probabilità e inferenza, Statistica economica big data e micro-dati e Panel data analysis. Svolge attività di consulenza per il Ministero dell'Economia e delle Finanze presso il Dipartimento della Ragioneria Generale dello Stato nell’analisi e valutazione della spesa pubblica. Ha conseguito il Dottorato in Statistica applicata al territorio presso l’Università di Napoli Parthenope, dove è stato anche assegnista di ricerca. Dal 2013 al 2023 ha lavorato all’Agenzia delle Entrate, ricoprendo ruoli di funzionario statistico-economico e di responsabile dell’Ufficio studi e valutazione dell’impatto normativo.
Luisa Scaccia
Docente
Docente di Statistica e Inferenza statistica presso l’Università degli Studi di Macerata, svolge anche attività di formazione post-universitaria in Master e Dottorati in Italia e all’estero. Ha conseguito la laurea in Statistica economica all’Università La Sapienza di Roma, un Master in Statistics presso l’University of Sheffield e il Dottorato in Metodi statistici e matematici per la ricerca economica e sociale all’Università di Perugia. La sua attività di ricerca si concentra su metodologia statistica, modelli di analisi dei dati e tecniche computazionali. I principali ambiti di studio includono misture di modelli, metodi Monte Carlo Markov Chain, Modelli a scelta discreta e modelli per dati spaziali. Ha partecipato a progetti di interesse nazionale su Metodi statistici per ordinamenti stocastici con applicazioni sociosanitarie ed ambientali, Modelli marginali per variabili categoriche con applicazioni all'analisi causale, Cambiamento strutturale e Crescita.
Contatti
Per qualsiasi informazioni sul corso o per problemi tecnici scrivi a pok@polimi.it o consulta la pagina delle FAQ.