Adattó kialakítása, amely alkalmas mesterséges intelligencia alapú incidensek keresésére

A Témalaboratórium során írt dolgozatomban betekintést nyújtottam a mesterséges intelligenciától kezdve, az adatok előfeldolgozásán át egészen a problémánk gyökeréig, ami nem más, mint az anomália detektálás. Habár célunk, hogy a program végén egy olyan működő rendszert implementáljunk, mely hatékonyan megjósolja a lehetséges anomáliákat, a feladat nagy része mégsem a keresésről szól. Hiszen a hatékonyság nem csak attól függ, milyen gépi tanulásos módszereket használunk. A kulcs a nyers adatok előfeldolgozásában rejlik, vagyis a gép számára lefordítani értelmezhető formára, elemezni, zajoktól mentesíteni illetve aggregálni. Az eddigi szisztémát követve, az elméletben ismertetett eljárásmódot alkalmaztam a gyakorlatban. Ezen dokumentummal szeretném bemutatni, a véghezvitt feladatokat, eredményeimet, átfogó képet adva arról, hol tartunk most és milyen feladatok várnak még ránk a jövőben. Az Önálló laboratórium tárgy keretein belül feladatom, hogy az eddig szerzett ismereteim alapján hálózati forgalom elemzése során, próbáljam felfedezni a lehetséges anomáliákat. Betekintést nyújtok a netflow adatok felhasználásába, az adatszivárgások felderítésére, hálózatokon keresztül történő adatlopások kimutatására. Ennek érdekében egy klasszikus, felügyelet nélküli anomália-felismerési módszert alkalmaztam, amely a fontos jellemzők kinyerésével kezdődik, a jellemzők pedig az adott hoszt forgalmi tartalmára vonatkoznak. A jellemzők kiválasztása után egy klaszterező algoritmust alkalmazok a hálózati kapcsolatok csoportosítására a kiválasztott jellemzők alapján. Ezután sűrűségen alapuló megközelítést, hogy a kiugró értékeket megkapjam. Végül a veszélyesnek titulált kapcsolatokat pedig jelezzem.

Frecska Hajnalka

2022-05-23

Támogató: NISZ Nemzeti Infokommunikációs Szolgáltató Zrt.