Vitajte!
Táto stránka je venovaná prezentácii nášho tímového projektu na tému Grafická podpora vyhľadávania znalostí v dokumentoch. Jedná sa o dvojsemestrálny projekt inžinierskeho štúdijného programu Softvérové inžinierstvo na Fakulte informatiky a informačných technológií Slovenskej technickej univerzity v Bratislave. Na tomto mieste nájdete nielen informácie o tomto projekte ale aj o našom tíme a aktualitách, ktoré sa týkajú tímového projektu.
Znenie zadania
Úlohou tímu bude vytvoriť grafický modul pre zobrazenie prepojenia dokumentov, ktorý by sa neskôr stal súčasťou produktu Gratex Knowledge Office a napomáhal tvorbe nových dokumentov (analytickej a technickej dokumentácie, manuálov, zdrojových kódov a pod.) pomocou získaných znalostí. Hrany medzi jednotlivými dokumentami budú mať rôzny vzor, farbu, hrúbku a podobne podľa množstva odkazov, spoločných kľúčových slov, autorov, čitateľov/používateľov, typov dokumentov a podobne. Jednotlivé algoritmy vyhľadávania a prepojení bude možné vypínať, ako aj vyberať v grafe vhodné dokumenty, vyraďovať nepotrebné cesty alebo vetvy. Na záver bude možné vybrať zaujímavé dokumenty, ktoré budú zdrojom pre tvorbu obsahu nového dokumentu.
Motivácia
S pribúdajúcim časom sa hromadí množstvo dokumentov, z ktorých môžeme čerpať dôležité informácie a preto je potrebné, aby sme sa zamerali na ich efektívne vyhľadávanie a spracovanie. Veľmi zaujímavým prístupom je práve vizualizácia výsledkov hľadania, ktorá prehľadne znázorňuje vzájomné prepojenia dokumentov. Práve tieto informácie totiž autori potrebujú a využívajú pri tvorbe nových dokumentov.
Po oboznámení sa s podobnými projektmi (napr. www.foaf.sk) nás táto téma natoľko zaujala, že by sme ju radili spracovali ako tímový projekt. Na základe vlastných skúseností pri vyhľadávaní dokumentov vieme aké ťažké je filtrovať získané výsledky. Veríme, že naše nápady a postrehy by mohli byť prínosom v spomínanej oblasti.
Všetci členovia nášho tímu majú niekoľkoročné skúsenosti s programovacím jazykom Java. Niektorí z nás v tomto jazyku úspešne vypracovali svoje bakalárske práce, čo nás istou mierou predurčuje k úspešnému zvládnutiu tohto zadania. Vypracovaním projektu by sme si s určitosťou prehĺbili a doplnili zručnosti z každej etapy tvorby softvérového produktu a oboznámili sa s novými technológiami. Zároveň máme množstvo nápadov a vízií ako efektívne, pútavo a organizovane prezentovať výsledky hľadania koncovým používateľom.
Väčšina z nás má zapísaný predmet Objektovo - orientovaná analýza a návrh softvéru. Práve poznatky ako vzory, refactoring alebo prefactoring by sme mohli zužitkovať priamo na tomto tímovom projekte, a tak by sme získali veľmi cenné praktické skúsenosti.
Vízia
V prostredí softvérovej firmy ale aj v iných znalostne orientovaných firmách dochádza k vzniku veľkého množstva znalostí a vedomostí. Aby ich bolo možné v efektívnej miere zdieľať, je nielen potrebné tieto znalosti zachytiť, zvečniť v elektronických dokumentoch, ale aj vedieť medzi týmito dokumentmi rýchlo vyhľadávať. Touto problémovou doménou sa zaoberajú systémy pre správu bázy znalostí (knowledgebase). Manuálne udržiavanie bázy znalostí je náročné a vo firme s veľa znalosťami by si vyžiadalo veľa vynaloženého úsilia, preto je výhodné hľadať spôsoby, ako bázu znalostí udržiavať čo možno najviac automaticky.
Už na prvý pohľad sa naskytá nápad použiť už existujúce zápisy znalostí (rôzne dokumenty, atď.) a tieto dokumenty tak poprepájať, a umožniť v nich tak vyhľadávať, aby sa používateľ čo najrýchlejšie dostal ku hľadaným vedomostiam a informáciám.
Cieľom projektu Grafická podpora vyhľadávania znalostí v dokumentoch je vytvorenie takéhoto systému pre údržbu bázy znalostí a hlavne pre vyhľadávanie v nej. Kľúčovou myšlienkou je hľadanie väzieb medzi dokumentmi vloženými do systému a zobrazenie týchto väzieb. Väzby medzi dokumentmi je možné tvoriť a udržiavať na základe:
- Autorov
- Referencií medzi dokumentmi (jeden odkazuje druhý)
- Kľúčových slov
- Označenia používateľom
Používateľ sa v grafe dokumentov bude pohybovať cez existujúce väzby medzi dokumentmi, pričom tieto väzby môže aktívne mazať a upravovať. Zobrazenie grafu dokumentov musí byť veľmi interaktívne a prehľadné a kvalita zobrazenia tvorí podstatnú časť prínosu projektu. Vyvinutý systém musí byť schopný samostatne vyhľadať väzby medzi dokumentmi, čo je podmienkou aby nemuselo byť na údržbu bázy znalostí vynaložené priveľké úsilie.
Našou víziou je počas tímového projektu I. a II. Minimálne vytvoriť systém, ktorý bude schopný na reálnej množine dokumentov vyhľadať väzby aspoň na základe kľúčových slov a tieto väzby zobraziť v interaktívnom grafe. Tento systém chceme vylepšiť do takej miery, ako nám to umožní náš čas a situácia na projekte.