Strumenti Utente

Strumenti Sito


tdm:tdm-2007-2008

Tecniche di Data Mining a.a. 2007-2008

News

Prossima sessione di esami orali: Lunedi 21 luglio 2008, ore 15:00, studio Pedreschi

Seconda verifica: Giovedi 5 Giugno 2008 - risultati pdf

Prima verifica: risultati pdf

Appelli sessione estiva

  • 12 Giugno 2008 9.30 - 12.30 aula C1 Risultati rtf txt
  • 2 Luglio 2008 9.00 - 12.00 aula D1
  • 18 Luglio 2008 15.00 - 18.00 aula C1
  • 11 Settembre 2008 9.30 - 12.30 aula D1

Docente

Obiettivi del corso

La grande disponibilità di dati provenienti da database relazionali, dal web o da altre sorgenti motiva lo studio di tecniche di analisi dei dati che permettano una migliore comprensione ed un più facile utilizzo dei risultati nei processi decisionali. L'obiettivo del corso è quello di fornire un'introduzione ai concetti di base del processo di estrazione di conoscenza, alle principali tecniche di data mining ed ai relativi algoritmi, concentrandosi su quelli più diffusi e consolidati, ma discutendo anche gli aspetti avanzati ed ancora al limite fra tecnologia metura e ricerca. Si discutono esempi di uso delle tecniche di data mining in contesti applicativi realistici, quali la market basket analysis ed il rilevamento di frodi. Il corso si conclude con cenni sugli aspetti di privacy ed etici inerenti all’utilizzo di tecniche inferenza sui dati e dei quali l’analista deve essere a conoscenza. Il corso consiste delle seguenti parti:

  1. i concetti di base del processo di estrazione della conoscenza;
  2. le principali tecniche di datamining (regole associative, classificazione e clustering). Di queste tecniche si studieranno gli aspetti formali e implementativi, sia nelle versioni standard che avanzate;
  3. alcuni casi di studio nell’ambito del marketing e del supporto alla gestione clienti, del rilevamento di frodi e di studi epidemiologici.
  4. cenni sugli aspetti di privacy ed etici e delle tecnologie di analisi privacy-preserving.

Orario

  • Lunedì 14-16, Aula A1
  • Giovedì 16-18, Aula A

Libro di Testo

• Pang-Ning Tan, Michael Steinbach, Vipin Kumar, Introduction to DATA MINING, Pearson - Addison Wesley, ISBN 0-321-32136-7, 2006

Riferimenti bibliografici

  • Jiawei Han, Micheline Kamber, Data Mining: Concepts and Techniques, Morgan Kaufmann Publishers, 2000 http://www.mkp.com/books_catalog/catalog.asp?ISBN=1-55860-489-8
  • U. Fayyad, G. Piatetsky-Shapiro, P. Smyth, R. Uthurusamy (editors). Advances in Knowledge discovery and data mining, MIT Press, 1996.
  • Barry Linoff Data Mining Techniques for Marketing Sales and Customer Support, John Wiles & Sons, 2002

Calendario delle lezioni

Giorno/ora Aula Argomento Materiale didattico Docente
1. Lunedì, Febbraio 18 A1 Presentazione del corso lucidi Pedreschi
2. Giovedì, Febbraio 21 A Cosa è il Data Mining, Motivazioni, Classi di applicazioni, I principali metodi di datamining Pedreschi
3. Lunedì, Febbraio 25 A1 Il processo di estrazione della conoscenza, esempi: previsione di frodi fiscali, analisi competitiva, etc. lucidi Pedreschi
4. Giovedì, Febbraio 28 A I dati: i tipi di dato, la qualità dei dati, la preparazione dei dati lucidi Pedreschi
5. Lunedì, Marzo 3 A1 Misure di similarità e dissimilarità lucidi Pedreschi
6. Giovedì, Marzo 6 A Esplorazione dei dati: dalla statistica descrittiva alla visualizzazione lucidiPedreschi
7. Lunedì, Marzo 10 A1 Clustering - Algoritmo k-means lucidi Mirco Nanni
8. Giovedì, Marzo 13 A Clustering - Algoritmi gerarchici e density-based Pedreschi
9. Lunedì, Marzo 17 A1 Classificazione con alberi di decisione, Algoritmo C4.5 Pedreschi
10. Giovedì, Marzo 20 A Classificazione con alberi di decisione, Algoritmo C4.5 Pedreschi
11. Giovedì, Marzo 27 A Esercitazione Pedreschi
12. Lunedi, Marzo 31 A1 Ricevimento collettivo e preparazione verifica lucidi Pedreschi
13. Giovedì, Aprile 3, 16-18 A PRIMA VERIFICA
14. Lunedì, Aprile 7 A1 Classificazione con alberi di decisione, Esercitazione con strumenti software data mining lucidi Pedreschi
15. Giovedì, Aprile 10 A Classificazione e clustering - casi di studio Pedreschi
16. Giovedì, Aprile 17 A Gestione del processo di KDD con strumenti commerciali e open-source Pedreschi
17. Lunedì, Aprile 21 A1 Altri algoritmi di classificazione: modelli a regole, K-nearest neighbors.
18. Giovedì, Aprile 24 A Pattern discovery e regole associative. Maurizio Atzori
19. Lunedi, Aprile 28 A1 Pattern discovery e regole associative. Maurizio Atzori
20. Lunedì, Maggio 5 A1 Regole Associative: concetti basici, algoritmi A-Priori e FP-Growth lucidi lucidi Pedreschi
21. Giovedì, Maggio 8 A Itemset frequenti con vincoli lucidi Pedreschi
22. Giovedì, Maggio 15 A Mobility data mining Pedreschi
23. Lunedì, Maggio 19 A1 Privacy-preserving data mining ed aspetti etici lucidi lucidi Giannotti - Pedreschi
24. Giovedì, Giugno 5, 16-18 A SECONDA VERIFICA

Verifiche anni precedenti

Seminari e progetti di esame

da definire

Appelli di esame

da definire

Edizioni anni precedenti

tdm/tdm-2007-2008.txt · Ultima modifica: 23/02/2009 alle 12:40 (10 anni fa) da Dino Pedreschi