TextTool

Prehľadávanie a vizualizácia textov

Plán projektu



Nakoľko sa zameriavame na prehľadávanie a vizualizáciu textu, našim cieľom je vytvoriť efektívne a jednoducho použiteľné nástroje na prácu s veľkým množstvom textu - Text Tools. Tieto nástroje budú vo finálne dostupné na webovej stránke, ktorá bude v rámci svojej funkcionality poskytovať rôzne formy vizualizácie zadaného textu a kategorizácie jednotlivých jeho slov, čo zjednoduší koncovému používateľovi prácu s poskytnutými textovými dokumentami.

O nás

Card image cap

Miroslav Blšťák

Card image cap

Patrik Racsko

Card image cap

Patrik Verseghy

Card image cap

Erik Maruškin

Card image cap

Katarína Jánošová

Card image cap

Damián Majerčák

Card image cap

Kryštof Kiss

Card image cap

Michaela Kolesíková

Priebeh projektu

Šprint 1
15 Okt

V rámci prvého šprintu sme preskúmali možnosti uchovania dát, kde sme porovnali technológie MongoDB a Elasticsearch. Napokon bola vybraná prvá možnosť a nasledoval import dostupných dát do databázy. Okrem toho sme sa tiež venovali vytvoreniu prvotného dizajnu pre web nášho nástroja Textool a doplnili sme informácie na web nášho tímu.

Šprint 2
29 Okt

Druhý šprint zahrňal vytvoreniu prototypu webu na základe vytvoreného dizajnu pre jednotlivé podstránky. Rovnako, ako na frontende, nás v tomto šprinte čakala aj práca na backende a prepojení týchto dvoch častí. Zamerali sme sa aj na rest štruktúru a jej služby a poslednou úlohou bolo vytvorenie skriptu pre indexovanie n-gramov v rámci našich článkov.

Šprint 3
12 Nov

Počas tretieho šprintu sme finalizovali dokumentáciu zameranú hlavne na metodiky v rámci jednotlivých oblastí manažmentu. Tiež sme sa zamerali na nedostatky produktu zahŕňajúce nedokonalosti na frontende aj backende, resp. v skriptoch, a opravili ich. Pracovali sme aj na spôsobe vizualizácie textu článkov pri ich zobrazení a pripravovali sme rozhranie, v ktorom môže zákazník spravovať vlastný korpus článkov.

Šprint 4
26 Nov

Počas štvrtého šprintu sme sa venovali dokončeniu modulu na webe produktu, ktorý dovolí používateľovi spravovať jeho vlastný korpus článkov. Táto UserStory bola rozpracovaná v prechádzajúcom šprinte. Taktiež bolo potrebné doplniť prelinkovanie v rámci jednotlivých rozhraní a doplniť funkcionalitu v rozhraní invertovaného indexu. Tiež sme upravili skripty, ktoré pracujú s databázou a formátom tokenov v nej, nakoľko sme potrebovali tento formát zjednotiť. V rozhraní detailu článku sme vizualizovali text článku na základe vypočítaného parametra tf-idf a hodnoty NER.

Koniec semestra
10 Dec

Pekné sviatky :)

Zápisnice

Reporty

Dokumentácia riadenia