Štatistický preklad voľného textu
Google vytvoril úžasnú službu, ktorej úlohou je prekladať text. Plán je však taký, že už viac táto služba nebude dostupná nám ako programátorom, ktorí by sme ju radi využívali zadarmo. Oficiálna správa hovorí, že za dostupnosť API si budeme musieť platiť. Skúsme byť na našej pôde ešte úžasnejší ako Google a spravme si svoj vlastný prekladač. Trochu štatistiky, trochu výpočtovej sily a trochu lepší nápad a môžeme pomôcť nie len sebe, ale i všetkým, ktorých nové správy z dielne Google nepotešili.
Úlohou tímu je vytvoriť službu, ktorá bude využívať webové stránky a ľubovoľné texty na nich. Vytvoríme z nich štatistický model, ktorý bude využívať najpravdepodobnejšie postupnosti slov vo vetách, aby spolu s obyčajným slovníkom boli schopné prekladať ľubovoľné voľne písané texty medzi ľubovoľnými dvojicami jazykov. Tím sa stretne so zaujímavými technológiami a naučí sa s nimi pracovať. Jednou z nich pritom môže byť architektúra hadoop.