data-mining-seminar

Data Mining – rudarenje 21. stoljeća

Prošli tjedan se na Ekonomskom fakultetu u Splitu, u organizaciji Studentskog poduzetničkog inkubatora i udruge IMEF, održao Data Mining seminar kako bi se studenti što bolje upoznali s ovim perspektivnim područjem. Okupljeni su od stručnjaka (Živka Krstića, Tomislava Križana, dr.sc. Ive Ugrine i Maria Luetića) mogli doznati nešto više o njihovim iskustvima iz prakse, znanosti o podacima i alatima koji se koriste u rudarenju podataka.

data mining seminar

Data Science (podatkovna znanost) je interdisciplinarno područje čiji je glavni zadatak ekstrakcija informacija i znanja iz podataka bilo da oni dolaze u strukturiranom ili možda nestrukturiranom obliku. Radi se o području koje obuhvaća velike podatke, strojno učenje, vizualizaciju podataka te sve što je vezano uz izvlačenje znanja iz podataka (statistika, računalne znanosti…). Rudarenje podataka je centralni dio cijele te priče.

– Data Scienceom se ne može baviti samo 1 osoba nego cijeli tim ljudi u kojem svaki od njih ima specijalizaciju u točno određenom području i svi zajedno sa svojim vještinama čine jednu kompletnu cjelinu te su sposobni rješavati kompleksne probleme. – pojašnjava Živko Krstić.

Više o potrebnim vještinama za svakog pojedinačno u Data Science timu možete saznati na ovom linku: data-science-industry-infographic.

data-mining

Nadalje, rečeno je kako su najpopularniji alati koji se koriste za rudarenje podataka Python, R, Excel i SQL, a popularna je i Java iz razloga što je cijela big data tehnologija bazirana na njoj. Danas se sve više koriste open source platforme poput Hadoopa za obrađivanje velikih podataka. Python i R se uglavnom koriste za testiranja kako bi se došlo do nekih zaključaka. Spark je također moćan alat što se tiče real time dijela te klasičnih analiza, strojnog učenja, rudarenja podataka, vizualizacija… Iako kompleksan, vrlo je koristan. Što se tiče alata za vizualizaciju podataka, posebno se ističe Tableau kao lider u tom segmentu.
Mario Luetić

Excel je i dalje jedan od najvažnijih alata za analizu podataka. – Živko Krstić

Razvoj tehnologije, računala i interneta bitno doprinosi lakšem organiziranju podataka, no da bi oni postali korisni, potrebno je njihovo pretvaranje u informacije i znanje. S obzirom da se broj podataka na internetu udvostručava svake 2 godine, rudarenje podataka postaje sve važnije područje. Zato i ne iznenađuje velika potražnja u svijetu za stručnjacima u tom području.

– Stručnjaci za rudarenje podataka su vrlo traženi na tržištu rada te će tako biti i u budućnosti jer živimo u informacijskom svijetu, a upravo upravljanje tim informacijama postaje jedno od najvažnijih područja poslovanja. – smatra Mario Luetić, voditelj službe kartičnih zlouporaba i rizika u SG Splitskoj banci.

S njim se slaže i Tomislav Križan, Chief Product Officer u londonskoj tvrtki Crossing technologies:  – Danas je svaka industrija data-driven industrija. Sve se okreće prema tome što imate u podacima i kako izvući korist iz njih za svoje poslovanje. Ljudi koji znaju analizirati podatke i izvući zaključke iz njih će definitivno biti potrebni ubuduće sve više i više.

Ivo UgrinaU Hrvatskoj nedostaje ljudi koje zanima to područje i koji se stvarno žele baviti s time. Iako su najpogodniji za to, rudarenje podataka nije isključivo posao za studente tehničkih i matematičkih fakulteta. Naime, i studenti s ostalih fakulteta mogu raditi u tom području ako svladaju neke određene vještine.

– Studenti koji bi htjeli raditi u ovom području bi, za početak, trebali imati znanja iz statistike, matematike (linearna algebra, matrice, derivacije…) i jednostavnog programiranja. Svejedno je koji ćete programski jezik naučiti, samo morate imati algoritamski način razmišljanja. Nije važno s kojeg ste fakulteta, i ekonomisti mogu postati vrhunski data analitičari koji će se baviti ekonometrijskim stvarima. Sve što trebate je obratiti više pozornosti na kvantitativne metode tijekom studija.– kaže dr.sc. Ivo Ugrina, iskusni istraživač Sveučilišta u Zagrebu, predavač na King’s Collegeu London i Sveučilištu u Splitu te stručni suradnik tvrtke Genos.

Živko Krstić

– Po meni je najvažnije da vas stvarno zanima to područje. Ako to radite samo radi novca, brzo će vam dosaditi. Sve se da naučiti, trebate samo sjesti i probati. Ja sam npr. završio ekonomiju, a radim analizu teksta, big data sustave, programiranje, vizualizacije… Štoviše, moje znanje iz ekonomije ima ogroman utjecaj na moj posao jer ja u timu obično uvodim onu drugu perspektivu – kolika je isplativost svega? – ističe Živko Krstić, data scientist londonske tvrtke Crossing technologies.

Tomislav Križan

 

Nažalost, ono što učimo na fakultetu nije dovoljno. Kad gledamo RH, naša akademska zajednica je dobila nekoliko smjerova na raznim fakultetima koji pokušavaju dati znanja u ovom području, ali to je još sve u samom začetku i daleko od današnjih akademskih svjetskih trendova. Vrijeme kad ćemo doživjeti fakultet orijentiran samo na edukaciju osoba za data science ćemo još morati pričekati. Zato je potrebno educirati se i usavršavati izvan fakulteta.

– Studentima bih preporučio da se dodatno educiraju izvan fakulteta, primjerice na Courserai ili Udacityu, posebno za vizualnu interpretaciju podataka jer je vrlo važno kako prikazati podatke, tj. kako dati informaciju nekome od onoga što ste dobili. Danas je vrlo bitan storytelling, odnosno, kako nekome ispričati što vaša informacija znači. – naglašava Tomislav Križan.

 

 Za preuzimanje svih prezentacija s ovog događaja, kliknite ovdje.

 

data mining

Izvori:

You may also like

Leave a comment