AI unsupervised ML kutats, fejleszts

A legltalnosabb rtelmben az optikai karakter-felismers minden lehetsges kp szvegnek kinyersre utal, legyen az egy szabvnyos nyomtatott oldal egy knyvbl vagy vletlenszer kp egy graffitirl. E kett kztt szmos egyb alkalmazs felsorolhat, pldul rendszmok elolvassa, robot nlkli captcha vagy utcatblk olvassa. Az optikai karakter-felismers egyik specifikus alkalmazsa a nyomtatott szveg olvassa. A dokumentumokban fellelhet szvegek s szvegszerkezetek automatikus felismersnek s rtelmezsnek ignye egyre magasabb, mivel egy ilyen megolds szmtalan elnnyel jr. Pldul egy alternatv megoldst nyjt a hagyomnyos keresmotorokhoz, amelyek jelenleg a keress sorn az olvas szmra relevns egy-egy dokumentumra mutatnak, mintsem egy bekezdsre vagy tnyleges rszre a forrsbl. A dokumentumkp-elemzs legjabb eredmnyeit elssorban a neurlis hlzatok alkalmazsa vezrli. Idelis esetben a kutatsi eredmnyek knnyen alkalmazhatk a termelsben, s kiterjeszthetk tovbbi vizsglatokra. Klnbz tnyezk azonban, mint pldul a lazn szervezett kdbzisok s a kifinomult modellkonfigurcik, megneheztik a fontos innovcik szles kznsg ltali knny jrafelhasznlst. Noha folyamatos erfesztsek trtntek az jrafelhasznlhatsg javtsra s a mly tanulsi (DL) modellfejleszts egyszerstsre olyan tudomnygakban, mint a termszetes nyelvi feldolgozs s a szmtgpes lts, egyiket sem optimalizltk a dokumentumkp-elemzs terletn jelentkez kihvsokra. Ez jelents hinyossgot jelent a meglv eszkztrban, mivel a dokumentumkp-elemzs kzponti szerepet jtszik a tudomnyos kutatsban s az ipari fejleszts szles skljn.

Simk Mt

2022-07-11

Tmogat: DXC Technology