Sadržaj se učitava...
mdi-home Početna mdi-account-multiple Djelatnici mdi-script Studiji mdi-layers Katedre mdi-calendar-clock Raspored sati FOI Nastava search apps mdi-login
Multivarijatna i dubinska analiza podataka
Multivariate and in-depth data analysis
2023/2024
5 ECTSa
Baze podataka i baze znanja 1.4 (BPBZ)
Informacijsko i programsko inženjerstvo 1.4 (IPI)
Informatika u obrazovanju 1.4 (IUO)
Katedra za kvantitativne metode
TO
2. semestar
Osnovne informacijemdi-information-variant Izvođači nastavemdi-account-group Nastavni plan i programmdi-clipboard-text-outline Model praćenjamdi-human-male-board Ispitni rokovimdi-clipboard-check-outline Rasporedmdi-calendar-clock Konzultacijemdi-account-voice
Izvođenje kolegija
Cilj kolegija
Cilj kolegija Multivarijatna i dubiska analiza podataka je produbiti znanje osnovnih statističkih metoda stečeno u okviru predmeta Statistika i vjerojatnost, proširiti ga s metodama dubinske analize podatka i osposobiti studente za korištenje programske podrške za provođenje multivarijatne statističke i dubinske analize podataka. Početni dio programa daje čvrsti teorijsku bazu za analizu podataka korištenjem parametarskih i neparametarskih statističkih metoda. Drugi dio programa daje uvid u eksplorativne metode analize podataka i bazične metode dubinske analize podataka (snižavanje dimenzionalnosti podataka, klasteriranje podataka, multipla regresija, odabrane metode za klasifikaciju podataka). Za analizu podataka koristit će se programski jezik R te skupovi podataka dostupni na web-u.
Preduvjeti
Kolegij nema definirane preduvjete
Norma kolegija
Predavanja
15 sati
Vježbe u praktikumu
14 sati
Seminar
16 sati
Nastavnik Uloga na kolegiju Oblik nastave Tjedana Sati Grupa
Dobša Jasminka Nositelj Predavanja
Vježbe u praktikumu
15
7
2
2
1
1
Buhin Pandur Maja Suradnik Vježbe u praktikumu
Seminar
7
8
2
2
1
1
Sadržaj predavanja
  • Slučajne varijable i razdiobe vjerojatnosti
    Definicija slučajne varijable i funkcije distribucije za diskretnu slučajnu varijablu. Funkcija razdiobe slučajne varijable i neprekidna slučajna varijabla. Definicija očekivanja i varijance slučajne varijable i njihova svojstva. Normalna razdioba. Standardizirana slučajna varijabla. Svojstva normalne razdiobe. Studentova t-razdioba. Hi-kvadrat razdioba. F-razdioba. Poissonova razdioba. Binomna razdioba.
  • Diskretna statistika i vizualizacija podataka
    Sumarna statistika kvalitativnih i kvantitativnih statističkih varijabli. Grafički prikaz kvalitativnih statističkih varijabli korištenjem stupčastih dijagrama i mozaičnog dijagrama. Grafički priza kvantitiativnih statističkih varijabli: dijagram s pravokutnikom i histogrami.
  • Hi-kvadrat test
    Testiranje hipoteze da empirijska razdiba ima određeni oblik i da su dva obilježja elemenata nekog skupa međusobno nezavisna. Test Kolmogorov-Smirnova i Shapiro-Wilk test– usporedba empirijske distribucije s teorijskom distribucijom. Kontingencijska tablica.
  • Testiranje jednakosti aritmetičkih sredina i medijana za dvije nezavisne populacije
    Postavljanje hipoteza. Sampling distribucija aritmetičkih sredina. Pretpostavke za primjenu i provođenje t-testa za nezavisne uzorke. Neparametarski testovi za testiranje jednakosti medijana dviju nezavisnih populacija: test predznaka i MWW test.
  • Testiranje jednakosti aritmetičkih sredina i medijana za dvije zavisne populacije
    Pretpostavke za primjenu i provođenje t-testa za zavisne uzorke. Neparametarski Wilcoxonov test za testiranje jednakosti medijana dviju zavisnih populacija.
  • Analiza varijance (jednofaktorska analiza varijance) i Kruskal-Wallisov test
    Analiza varijance (ANOVA) za test hipoteze o jednakosti aritmetičkih sredina k populacija pomoću nezavisnih slučajnih uzoraka. Jednofaktorska analiza varijance. Testiranje utjecaja jednog faktora (nezavisne varijable) na odabrano svojstvo (zavisnu varijablu). F-test. Neparametarski test za usporedbu medijana k nezavisnih populacija (Kruskal-Wallisov test).
  • Analiza varijance (dvofaktorska analiza varijance) i Friedmanov test
    Dvofaktorska analiza varijance testiranje utjecaja dva faktora (nezavisnih varijabli) na odabrano svojstvo (zavisnu varijablu). F-test.Neparametarski test za usporedbu medijana k zavisnih populacija (Friedmanov test).
  • Uvod u dubinsku analizu podataka
    Problemi koji se rješavaju dubinskom analizom podataka. Nedostajuće vrijednosti. Odabir metode dubinske analize podataka za skup podataka. Ekstrakcija značajki, transformacija značajki, odabir značajki.
  • Model jednostavne linearne regresije
    Specifikacija modela. Metoda najmanjih kvadrata. Procjena parametara. Mjere reprezentativnosti: varijanca, standardna devijacija, koeficijent determinacije, korigirani koeficijent determinacije. Stršila.
  • Model višestruke regresije
    Procjena intervala parametara. Skupni test o signifikantnosti regresije. Pojedinačni testovi (dvostrani i jednostrani). Predviđanje regresijskim modelom. Računanje regresijskih vrijednosti i njihova interpretacija. Regresijski model s kvalitativnim varijablama (engl. dummy variajble).
  • Snižavanje dimenzionalnosti
    Linearni modeli snižavanja dimenzionalnosti. Analiza glavnih komponenti. Kriteriji za izbor broja komponenti. Analiza zajedničkih faktora.
  • Grupiranje podataka
    Mjere sličnosti i mjere udaljenosti. Hijerarhijske metode: aglomerativne i divizivne metode. Nehijererhijske metode grupiranja: metoda k-srednjih vrijednosti. Izbor broja grupa. Evaluacija grupiranja podataka.
  • Klasifikacija podataka – izabrane metode
    Stablo odlučivanja. Izbor značajke za grananje. Obrezivanje stabla. Pretreniranost. Metoda k najbližih susjeda (engl. k nearest neighbours).
  • Rezime i primjene dubinske analize podataka
    Nadgledano i nenadgledano učenje. Polu-nadgledano učenje. Inkorporacija znanja iz domene. Označavanje podatka. Obrada prirodnog jezika. Obrada slike.
Sadržaj seminara/vježbi
  • vježbe
    U okviru prvih pet nastavnih cjelina izvodit će se auditorne vježbe na kojima će se uvježbavati zadaci iz područja vjerojatnosti. U okviru sljedećih deset nastavnih cjelina izvodit će se auditorne i laboratorijske vježbe. Na auditornim vježbama uvježbavat će se provođenje gore spomenutih neparametarskih testova, analize varijance, modeliranje višestruke regresije te korištenje obrađenih metoda multivarijatne analize. Demonstrirat će se provođenje navedenih statističkih metoda korištenjem programske podrške. Na laboratorijskim vježbama studenti će imati priliku sami koristiti spomenutu programsku podršku za izradbu obaveznog seminarskog rada. U okviru seminarske nastave studenti će biti upoznati s konkretnim primjenama naučenih metoda
Ishodi učenja kolegija
  • Definirati funkciju razdiobe i funkciju gustoće slučajne varijable, prepoznati slučajeve za primjenu nekih važnijih distribucija vjerojatnosti (binomne, normalna, Poissonove).
  • Primijeniti odgovarajuću metodu za multivarijatnu analizu podataka u prikladnom računalnom statističkom okruženju (procjena parametara ili testiranje hipoteza za podatke iz multivarijatne normalne razdiobe, izvođenje odabranih neparametarskih testova, analiza glavnih komponenti, analiza zajedničkih faktora, multivarijatna linearna regresija).
  • Provjeriti preduvjete za primjenu metoda multivarijatne analize podataka (provjera prilagodbe empirijske distribucije teorijskoj razdiobi korištenjem Hi-kvadrat testa i Kolmogorov-Smirnovog testa, provjera testova jednakosti varijance korištenjem IT).
  • Kritički interpretirati rezultate multivarijatne analize podataka.
  • Analizirati različite tipove podataka koji se koriste u postupcima dubinske analize podataka i korake pripreme podataka (ekstrakcija podataka, transformacija podataka, odabir podataka).
  • Primijeniti odgovarajuću tehniku/metodu dubinske analize podataka za zadanu problemsku domenu.
  • Vrednovati rezultate dubinske analize podataka.
  • Provesti projekt multivarijatne i dubinske analize podataka u prikladnom računalnom statističkom okruženju (uključujući planiranje, provedbu i dokumentiranje procesa analize podataka, pisanje projektnog izvješća s opisom podataka i metoda te tabličnim i grafičkim prikazom i interpretacijom rezultata).
Ishodi učenja programa
Osnovna literatura
  • Kero, K.; Dobša, J.; Bojanić-Glavica, B. Statistika (deskriptivna i inferencijalna) i vjerojatnost u primjerima, Tiskara Varteks, Fakultet organizacije i informatike, Varaždin 2008
  • Šošić, I., Primjenjena statistika, 2. Izmjenjeno i dopunjeno izdanje, Školska knjiga, Zagreb, 2006
  • Witten, I. H., Frank, E., Hall, M.A., Data Mining: Practical Machine Learning Tools and Techniques, forth edition, Morgen Kaufmann, 2016
Dopunska literatura
  • Kero, K.; Bojanić-Glavica, B. Statistički modeli i metode (odabrana poglavlja). Fakultet organizacije i informatike, Varaždin, 2003.
  • Spiegel, M.R.; Schiller, J.; Srinivasan, R.A. Probability and Statistics, Schaum’s Outline |Series McGraw-Hill, 2000.
  • Johnson, R.A.; Wichern, D.W. Applied Multivariate Statistical Analysis, second edition, 1988.
  • Duda, R.O.; Hart, P.E.; Stork,D.G. Pattern Clasification, second edition, John Wiley & Sons, 2001.
Slični kolegiji
  • Probability and Statistics for Business, Carnegie Mellon University (School of Business) http://web.tepper.cmu.edu/default.aspx?id=141721
  • Applied Business and Economic Statistics II, California State University, Los Angeles (Computer Information Systems) http://catalog.calstatela.edu/cgibin/ om_isapi.dll?clientID=546327&hitsperheading=on&infobase=calstate_01- 03.nfo&jump=Bachelor%20of%20Science%20Degree %20in%20Computer%20Information%20Systems%20&softpage=Document42
  • Business Statistics II , University Illinois in Chicago (College of Business Administration, Department of Information and Decision Sciences) http://www.uic.edu/cba/cba-depts/ids/courseprofiles/IDS371.htm
  • Regression Analysis, University Illinois in Chicago (College of Business Administration, Department of Information and Decision Sciences) http://www.uic.edu/cba/cba-depts/ids/courseprofiles/IDS478.htm
Redoviti studenti Izvanredni studenti
izvanredni rok
Datum: 24.04.2026.
Vrijeme: 16:00
Opis: Na Fakultetu
U kalendaru ispod se nalaze konzultacije predmetnih nastavnika, no za detalje o konzultacijama možete provjeriti na profilu pojedinog predmetnog nastavnika.
2025 © Fakultet organizacije i informatike, Centar za razvoj programskih proizvoda