Optikai karakterfelismerés neurális hálóval

Az utóbbi évek egyik meghatározó tudományága a mesterséges intelligencia, azon belül pedig a neurális hálókat használó mélytanulás, aminek segítségével egyre több területen vagyunk képesek korábban kézzel végzett feladatok megoldását automatizált, vagy részben automatizált megoldásokra cserélni. E terület egyik jelentős vívmánya az OCR (Optikai karakterfelismerés) technológia, amelynek segítségével karaktereket ismerhetünk fel képekről. Kutatásom során azt vizsgáltam, hogy hogyan lehet betűket, számokat tartalmazó képeken detektálni és kivágni a karaktereket, valamint az így kapott részeket egy neurális háló alapú osztályozóval osztályozni. Ehhez egy olyan algoritmus létrehozására volt szükség, amely képes a karaktereket befoglaló téglalapok automatikus detektálására is.

Szűcs Gábor

2021-09-01

Támogató: Ericsson