Семинар Друштва за језичке ресурсе и технологије, 24. новембар 2016.

Наредни састанак Семинара биће одржан у четвртак, 24. новембра 2016. у сали 718 Математичког факултета са почетком у 18 часова.

Предавач: Војкан Николић, Град Београд, Министарство унутрашњих послова Републике Србије

Наслов предавања: МОДЕЛОВАЊЕ И ПРЕТРАЖИВАЊЕ НАД НЕСТРУКТУИРАНИМ ПОДАЦИМА И ДОКУМЕНТИМА У Е-УПРАВИ РЕПУБЛИКЕ СРБИЈЕ

Апстракт: Данас, сервиси е-Управе у различитим областима користе question
answer системе концепта у покушају да се разуме текст и да помогну грађанима у добијању одговора на своје упите у било које време и веома брзо. Аутоматско мапирање релевантних докумената се истиче као важна апликација за аутоматску стратегију класификације: упит-документа. Ова докторска дисертација има за циљ допринос у идентификацији неструктуираних докумената и представља важан корак ка разјашњавању улоге експлицитних концепата у проналажењу података уопште. Најчешћа репрезентативна шема у текстуалној категоризацији је BOW приступ, када је у позадини велики скуп знања. Ова дисертација уводи нови приступ ка стварању концепта заснованог на текстуалној презантацији и примени категоризације текста, како би се створиле дефинисане класе у случају сажетих текстуалних докумената. Такође, овде је приказан алгоритам заснован на класификацији, моделован за упите који одговарају теми. Отежавајућа околност у случају овог концепта, који презентује термине са високом фреквенцијом појављивања у упитма, заснива се на сличностима у претходно дефинисаним класама докумената. Резултати експеримента из области Кривичног законика Републике Србије, у овом случају и студија, показују да презентација текста заснована на концепту има задовољавајуће резултате и у случају када не постоји речник за дату област.