AI unsupervised ML kutatás-fejlesztés

Célunk egy keretrendszer fejlesztése a dokumentum elrendezésének automatikus annotálására. A rendszer bemenetét PDF dokumentumok képezik. Kimenetként pedig egy felcímkézett PDF-et nyújt a rendszer, amely az irodalom elrendezése alapján megjelöli azon metaadatokat, amelyek a dokumentum egyes elemeit képzi, például szövegrészletek, címek, táblázatok, képek és ábrák, és egyéb elemek. A dokumentumokba zárt tudás kinyeréséhez először géppel olvasható formátumba konvertáljuk őket. Majd mély neurális hálózatok segítségével végezzük el a kinyerést. Maga atény, hogy a megoldás egy keretrendszer, biztosítja a funkcionalitás univerzalitását, platformfüggetlenségét, tetszőleges továbbfejleszthetőségét, kiegészíthetőségét, illetve testreszabhatóságát.

Pekár Adrián

2022-07-15

Támogató: DXC Technology