Tímový projekt

Inportér verejných datasetov

Náš tím


Bc. Gabriel Csollei

Total brutal ninja kóder,ktorý po nociach hľadá zalúbenie v tak strašných veciach ako je čisté C či assemblery. Ani najdlhšia cesta popolvára ho neodradila od tejto školy a ďalej zachraňuje svojich kamarátov od predĺženia štúdia.

Bc. Matúš Brandajský

Som Matúš Brandajský, rád programujem a robím veci okolo toho. Sem tam si zahrám na nejakom hudobnom nástroji a nerád robím veci, ktoré ma bezvýznamne vyčerpávajú.

Bc. Tomáš Božik

Na FIIT STU chodím už šiesty rok a ešte stále nie som ing. Verím v to, že cesta za ing na tejto škole bude mojich najkrajších 8 rokov života.

Bc. Lukáš Belaj

Som študentom FIITky takže nejaký čas trávim programovaním, ak však môžem rád si zašportujem a vyčistím hlavu pre nové výzvy.

Bc. Michal Hrutka

Študujem na inžinierskom stupni FIIT STU, odbor Inteligentne Softvérové Systémy, pracujem ako Back-End developer v slovenskej firme Slido, zaujímam sa primárne o strojové učenie a data science.

Bc. Tatiana Šlesariková

Je študentkou fiit uz stvrtym rokom a medzi jej zaluby patri jedlo, auta a steniatka. Ak niekto vyslovi v jej pritomnosti slovo najoptimalnejsi a kvoli tomuto cloveku zomrie maciatko, bude nahnevana. Je neoddelitelnou sucastou best of best timu. Nikto nerobi take dobre muffinky ako ona.

Bc. Janka Fabušová

Ďalší dôkaz, že dievčatá vedia kódiť a na FIITku jednoznačne patria. Jany bude riešiť frontend a UX na tomto projekte.

Vedúci tímu

Ing. Jakub Šimko, PhD.
Ing. Marek Šurek

Náš projekt


Problém, ktorý riešime

Je v záujme štátu, aby svoje dáta zverejňoval v čo najlepšie strojovo spracovateľnej podobe, a najmä jednotnej schéme, aby bolo možné jednotlivé datasety medzi sebou automatizovane prepájať. Centrálnym miestom zverejňovania týchto dát je portál data.gov.sk. Súčasne existuje aj jednotná schéma dát (Centrálny model údajov verejnej správy), ktorá popisuje sémantickými vzťahmi prepojenia. Problémom však zostáva, ako jednotlivé datasety do jednotnej podoby dostať. V súčasnosti existujú v rôznych formátoch, ale najmä s neznámou obsahovou štruktúrou (sémantikou), ktorá znemožňuje ich priamočiare prepájanie napr. atribút “firma” sa v inom datasete môže volať “spoločnosť”. Prípadne obsah tohoto atribútu je pre rôzne datasety inak vyjadrený, atď. Tieto problémy priespievajú k tomu, že obrovská časť peňazí a času je opakovane investovaná do dátovej integrácie. Správcovia týchto datasetov (spravidla úradníci) nemajú technické kapacity, aby súlad ich datasetu so centrálnou schémou zabezpečili, čím sú ich výstupné dáta ťažko prepoužiteľné a to či iným subjektom štátnej správy ale aj komerčným sektorom.

Náš cieľ

Vytvoriť webový nástroj, ktorý nie-technickému používateľovi (napr. úradníkovi) umožní jednoduchý import datasetu určeného na zverejnenie na data.gov.sk. Nástroj na vstupe dostane dataset vo formáte s neznámou sémantikou. Úlohou nástroja je dataset transformovať tak, aby zodpovedal centrálne platnej schéme, na základe ktorej sa potom jednotlivé zverejnené datasety môžu prepájať. Transformácia by mala byť čo najviac automatická, no predpokladá sa, že ju bude musieť usmerňovať aj používateľ a to v čo najprívetivejšom rozhraní.


Na projekte sa podieľajú
Fakulta informatiky a informačných technológií STU
xIT
Software company
Úrad podpredsedu vlády SR pre investície a informatizáciu

Progres

Sprint 1 - AUDI

inicializácia
Šprint č. 1 sme úspešne ukončili.
Vytvorenie repozitárov, zvolenie si technológií na FE a BE a ich rozbehanie, prvá verzia API medzi FE a BE, upload súboru, vnútorná reprezentácia dát, wireframe obrazoviek, práca so scrumdeskom.

Sprint 2 - BUGATTI

analýza a implementácia
Šprint č. 2 sme ukončili, ale nebol úspešný.
Špecifickejší upload, databáza na uchovávanie CM, about screen, chybové hlášky, lokalizačná knižnica, ukážkové datasety, preklopenie frontendu, dokumentácia API, prototyp používateľského rozhrania, porovnávanie dát 1 ku 1.

Sprint 3 - CHEVROLET

analýza a implementácia
Šprint č. 3 sme ukončili. Bol to zatiaľ najmenej úspešný šprint.
Preklopenie frontendu do bootstrapu, premyslenie chybových hlášok, dokumentácia, guidline pre dizajn, určovanie pravdepodobnosti, potvrdzovanie schémy, DB pre uchovávanie centrálneho modelu, vytváranie dát na porovnávanie.

Sprint 4 - DODGE

analýza a implementácia
Šprint č. 4 sme ukončili, ale nestihli sme jeden task dokončiť.
Wireframy pre vyhľadávanie, vytvorenie scenárov pre UX testovanie, stihanutie súboru úradníkom, remake textov, prezeranie dostupných datasetov, úprava frontendu, script na určenie úspešnosti.

Sprint 5 - EQUUS

analýza a implementácia
Šprint č. 5 sme ukončili.
Všetky implementačné tasky sme úspešne dokončili, ostali nám vysieť iba research tasky, v ktorých bolo za úlohu naštudovať potrebnú literatúru na riešenie nášho problému.

Sprint 6 - FERRARI

implementácia
Šprint č. 6 úspešne sme ukončili.
Všetky implementačné tasky sme úspešne dokončili, vytvorili sme Wireframe vyhľadávania atribútu, refaktoring BE, paletu elementov, skrolovanie pri tabuľke.

Sprint 7 - GMC

implementácia
Šprint č. 7 sme úspešne ukončili.
Všetky implementačné tasky sme dokončili, identifikácia a validácia job tokenov, celý content roztiahnuť na celú šírku, opis vyhľadaných výrazov.

Sprint 8 - HONDA

implementácia
Šprint č. 8 úspešne sme ukončili.
V tomto šprinte sme sa venovali prerábaniu dizajnu aplikácie, dopracovali sme vyhľadanie atribútu úradníkom, tooltipy a upravili sme alerty.

Sprint 9 - INFINITY

implementácia
Šprint č. 9 sme úspešne ukončili.
V tomto šprinte sme mali iba 3, avšak veľké stories. Zapracovali sme zavedenie nového atribútu úradnikom, autocomplete pre vyhľadávač a flagy pre atribúty, aby sme oddelili, ktoré boli zavedené a ktoré vyťahujeme z CM.

Sprint 10 - JEEP

implementácia
Šprint č. 10 práve prebieha.
O jeho výsledkoch vás budeme informovať po jeho skončení.

Kontakt


Vaša správa bola odoslaná.
Kde nás nájdete
Fakulta informatiky a informačných technológií
Ilkovičova 2
Karlova Ves, 841 04
Email
timovy-projekt-14@googlegroups.com
Bohužiaľ ešte nie sme na sociálnych sieťach :(