Ciele šprintu: - podrobná analýza jednotlivých častí zdrojových dokumentov - schopnosť rozpoznať nadpisy, články a ostatné časti - vytvorenie programu pre spracovávanie znakov do fulltextov v XML súbore - vytvorenie návrhu pre parsovanie dokumentov na jednotlivé články
Ciele šprintu: - vytvorenie nástroja pre parsovanie XML dokumentov - v rámci nástroja vytvárať prezentáciu vstupných zdrojov (štatistika, počet spracovaných zdrojov, chybovosť)