Naslov Standardizacija i unifikacija upisivanja i upravljanja sadržajem u aplikacijama upravljanja znanjem
Naslov (engleski) Standardization and unification of content generation and management in knowledge base applications
Autor Ivana Barić
Mentor Sanda Martinčić-Ipšić (mentor)
Član povjerenstva Marina Ivašić-Kos (predsjednik povjerenstva)
Član povjerenstva Sanda Martinčić-Ipšić (član povjerenstva)
Član povjerenstva Ana Meštrović (član povjerenstva)
Ustanova koja je dodijelila akademski / stručni stupanj Sveučilište u Rijeci (Fakultet informatike i digitalnih tehnologija) Rijeka
Datum i država obrane 2019-07-12, Hrvatska
Znanstveno / umjetničko područje, polje i grana DRUŠTVENE ZNANOSTI Informacijske i komunikacijske znanosti
Sažetak U diplomskom radu opisan je postupak standardizacije i unifikacije upisivanja i upravljanja sadržajem u aplikacijama upravljanja znanjem. Tema obuhvaća postupke računalne analize prirodnog jezika koji korisniku pomažu prilikom upisa novog znanja zasnovanog na već postojećem znanju. Također su obrađeni postupci ujedinjavanja novog znanja kroz procese preobrazbe, mapiranja, dedupliciranja te izvoza radi jednostavnije pretrage i analize zapisanih znanja odnosno podataka. U uvodu se opisuje područje primjene računalne analize prirodnog jezika, strojnog učenja te različiti postupci i tehnike koji se upotrebljavaju. U opisu problema dan je kratak osvrt konkretnog problema koji će se rješavati koristeći navedene postupke i odgovarajuće programske alate. Opisani su postupci ekstrakcije informacija iz podataka uz pomoć odgovarajućih alata i metoda računalne analize prirodnog jezika poput Python-a kao i metoda koje se koriste u sustavu za podršku odlučivanju te strojnom učenju zajedno s upotrijebljenim alatima MicroStrategy, Gephi i Weka. Na osnovu dobivenih informacija, predstavljena su moguća rješenja za realizaciju problema kojim se bavi ovaj diplomski rad. Podaci koji su se koristili u ovom diplomskom radu preuzeti su iz baze znanja stvarne poslovne organizacije, te su zbog svoje povjerljivosti i činjenice da je njihov sadržaj poslovna tajna modificirani i na taj način zaštićeni. U prvoj fazi predstavljen je dio rješenja koji se bavi analizom i nadziranjem kvalitete podataka te klasifikacijom osnovnih elemenata u odgovarajuće klase, omogućavajući tako standardizaciju samog unosa podataka u bazu kao i osiguravanje njihove kvalitete. U drugoj fazi opisan je postupak postavljanja standarda za osiguravanje kvalitete podataka prilikom njihovog unosa putem aplikacije. U trećoj i posljednjoj fazi, korištenjem metoda za ekstrakciju ključnih riječi, vizualno su predstavljeni najčešće korišteni osnovni elementi u opisivanju određenog uređaja.
Sažetak (engleski) In this master thesis, the process of standardization and unification of content generation and management in knowledge base applications is described. The theme includes methods of computer language processing that helps the user to admit new knowledge that's based on already familiar knowledge. The processes of unification of new knowledge were also studied through transformation, mapping, deduplication and export for easier search and analysis of written knowledge or data. The introduction describes the domain in which the computer (natural) language processing, machine learning, various procedures, and techniques are used. In the description of the problem, there is a brief overview of the specific problem that will be solved using the mentioned procedures and the corresponding software tools. Procedures for extracting information from data are described with the help of the appropriate tools and methods of computer language processing such as Python as well as the methods used in the decision support systems and machine learning. Also, tools like MicroStrategy, Gephi and Weka that were used in visualizing the results are described. Based on the information obtained, possible solutions to the problem of this master thesis are presented. The data used in this master thesis is taken from the knowledge base of a real business organization, but because of their confidentiality and the fact that their content is a strict business secret, the data itself has been modified accordingly. In the first phase, a part of the solution that focuses on analysis and monitoring of data quality and the classification of the basic elements to their corresponding classes is presented. The second phase focuses on establishing data quality standards for entering data through the application. The third phase is the last part of the solution and it uses keyword extraction methods to visually present the most commonly used elements in describing a specific device.
Ključne riječi
standardizacija
unifikacija
upravljanje znanjem
baza znanja
ekstrakcija informacija
podaci
računalna analiza prirodnog jezika
ekstrakcija ključnih riječi
strojno učenje
Gephi
Weka
MicroStrategy
NetworkX
graf
stabla odlučivanja
slučajna šuma
Ključne riječi (engleski)
standardization
unification
knowledge management
knowledge base
the extraction of information
data
computer language processing
NLP
keyword extraction
machine learning
Gephi
Weka
MicroStrategy
NetworkX
graph
decision trees
random forest
Jezik hrvatski
URN:NBN urn:nbn:hr:195:231260
Studijski program Naziv: Informatika Vrsta studija: sveučilišni Stupanj studija: diplomski Akademski / stručni naziv: magistar/magistra informatike (mag. inf.)
Vrsta resursa Tekst
Način izrade datoteke Izvorno digitalna
Prava pristupa Pristup korisnicima matične ustanove
Uvjeti korištenja
Datum i vrijeme pohrane 2019-07-08 08:47:10