Strumenti Utente

Strumenti Sito


dm:blog.progetti.2008

F.A.Q. Progetti Data Mining

Domande generali

  • Non riesco ad aprire il dataset con Excel: Excel, a parte le versioni più recenti, ha un limite nel numero di righe gestibili. Si consiglia di utilizzare un DBMS (Access, SQL Server, MySQL) su cui importare il database. Se le operazioni che si intende fare sono realizzabili già dagli strumenti di data mining scelti, è possibile caricare i dati direttamente dai file forniti, senza passare dal database.

Domande Progetto 1

  • E' normale che il campo “Eta_id” abbia tutti i valori 0? Il campo età a zero è evidentemente un errore dei dati. E' possibile ricavare il valore corretto dalla data di nascita del cliente (quando è disponibile) in relazione alla data in cui è stato effettuato l'acquisto.
  • Esistono reparti differenti aventi lo stesso codice (es.: carne e pesce hanno lo stesso codice). Lo stesso accade per le sotto-categorie e i segmenti. E' normale? Per le categorie marketing quello che notate è perfettamente normale. Le categorie marketing sono viste come un albero la cui gerarchia (dalla radice) è: settore, reparto, categoria, sottocategoria, segmento. I reparti di ogni settore, ad esempio, sono numerati indipendentemente dai reparti degli altri settori, lasciando la possibilità di “omonimie”, risolvibili semplicemente tenendo conto del settore di provenienza.
  • Cosa rappresentano i campi “Pres_mkt” e “Rilevanza”? La presenza marketing è una classificazione per importanza di mercato, non ordinata, specifica del retailer. Stessa cosa per la rilevanza.

Domande Progetto 2

Domande Progetto 3

dm/blog.progetti.2008.txt · Ultima modifica: 28/05/2008 alle 15:28 (16 anni fa) da Mirco Nanni