TextTool

Prehľadávanie a vizualizácia textov

Plán projektu



Nakoľko sa zameriavame na prehľadávanie a vizualizáciu textu, našim cieľom je vytvoriť efektívne a jednoducho použiteľné nástroje na prácu s veľkým množstvom textu - Text Tools. Tieto nástroje budú vo finálne dostupné na webovej stránke, ktorá bude v rámci svojej funkcionality poskytovať rôzne formy vizualizácie zadaného textu a kategorizácie jednotlivých jeho slov, čo zjednoduší koncovému používateľovi prácu s poskytnutými textovými dokumentami.

O nás

Card image cap

Miroslav Blšťák

Card image cap

Patrik Racsko

Card image cap

Patrik Verseghy

Card image cap

Erik Maruškin

Card image cap

Katarína Jánošová

Card image cap

Damián Majerčák

Card image cap

Kryštof Kiss

Card image cap

Michaela Kolesíková

Priebeh projektu

Šprint 1
15 Okt

V rámci prvého šprintu sme preskúmali možnosti uchovania dát, kde sme porovnali technológie MongoDB a Elasticsearch. Napokon bola vybraná prvá možnosť a nasledoval import dostupných dát do databázy. Okrem toho sme sa tiež venovali vytvoreniu prvotného dizajnu pre web nášho nástroja Textool a doplnili sme informácie na web nášho tímu.

Šprint 2
29 Okt

Druhý šprint zahrňal vytvoreniu prototypu webu na základe vytvoreného dizajnu pre jednotlivé podstránky. Rovnako, ako na frontende, nás v tomto šprinte čakala aj práca na backende a prepojení týchto dvoch častí. Zamerali sme sa aj na rest štruktúru a jej služby a poslednou úlohou bolo vytvorenie skriptu pre indexovanie n-gramov v rámci našich článkov.

Šprint 3
12 Nov

Počas tretieho šprintu sme finalizovali dokumentáciu zameranú hlavne na metodiky v rámci jednotlivých oblastí manažmentu. Tiež sme sa zamerali na nedostatky produktu zahŕňajúce nedokonalosti na frontende aj backende, resp. v skriptoch, a opravili ich. Pracovali sme aj na spôsobe vizualizácie textu článkov pri ich zobrazení a pripravovali sme rozhranie, v ktorom môže zákazník spravovať vlastný korpus článkov.

Šprint 4
26 Nov

Počas štvrtého šprintu sme sa venovali dokončeniu modulu na webe produktu, ktorý dovolí používateľovi spravovať jeho vlastný korpus článkov. Táto UserStory bola rozpracovaná v prechádzajúcom šprinte. Taktiež bolo potrebné doplniť prelinkovanie v rámci jednotlivých rozhraní a doplniť funkcionalitu v rozhraní invertovaného indexu. Tiež sme upravili skripty, ktoré pracujú s databázou a formátom tokenov v nej, nakoľko sme potrebovali tento formát zjednotiť. V rozhraní detailu článku sme vizualizovali text článku na základe vypočítaného parametra tf-idf a hodnoty NER.

Koniec zimného semestra
10 Dec

Pekné sviatky :)

Začiatok letného semestra
17 Feb

Začiatok práce na projekte v letnom semestri.

Šprint 5
17 Feb

Počas prvého šprintu sme sa zamerali hlavne na veci, ktoré sme považovali za dôležité zlepšiť na základe retrospektívy po zimnom semestri. Opravili sme používateľskú a inštalačnú príručku a zrefaktorovali sme celý kód. Okrem toho sme pridali funkcionalitu editovania článkov.

Šprint 6
2 Mar

Počas tohto šprintu bolo potrebné dokončiť vytvorenie wiki pre endpointy REST API našej aplikácie, taktiež sme dokončili automatizáciu pri pridaní nového kódu pomocou pipelines. Rovnako sme aktualizovali inštalačnú a používateľskú príručku, ako aj postup pre spustenie aplikácie lokálne po stiahnutí súborov z Gitu. Tiež bola pridaná funkcionalita pre export článku alebo korpusu vo formátoch JSON a CONLL.

Šprint 7
16 Mar

V rámci 7. šprintu sme sa venovali aktualizácií domovskej stránky našej aplikácie, ktorá poskytuje štatistické informácie o korpuse a článkoch našej dátovej sady. Taktiež sme do filtra zoznamu článkov pridali možnosť pokročilého vyhľadávania na základe podobnosti medzi dopytom a dokumentom a v rámci detailu článku sme k funkcionalite pridali možnosť práce s HAL. Poslednou úlohou bola úprava používateľského rozhrania aplikácie.

Šprint 8
30 Mar

Šprint práve prebieha.

Zápisnice ZS

Reporty ZS

Dokumentácia riadenia