Postupkom izdvajanja se dobijaju rečenice dokumenata i pamti se koliko svaka rečenica ima reči u sebi.
Vodi se evidencija o stop rečima(prilozi, predlozi, veznici...) gde svaka stop reč ima svoj id.
Algoritam koji iz dokumenta izbacuje stop reči pronalazi za odgovarajude ključne reči.
Pamti se ključne reči u odgovarajuče, dokumetu kao i broj njihovih pojavaljivanja u tom dokumentu.
Vodi se evidencija i koliko se kojih stop reci javlja u kojem dokumentu"
"Algoritam izbacuje stop reci i pronalazi odgovarajuce za kljucne"
taj deo mi je malo nejasan...
Pokusao sam da nacrtam EER model , posto mi postavka nije bas jasna ne verujem ni da mi je model dobar.

bilo kakva pomoc je dobrodosla,
hvala