Mestersges intelligencia tmadsa

Napjainkban egyre nagyobb szerepe van a mestersges intelligencinak az informatika terletn. A legtbb ember, annak ellenre, hogy nem tud rla, mgis rengeteg eszkzt hasznl, mely az MI n alapszik, elg csak az nvezet autkra gondolnunk pldaknt. Ezen rendszereknl ltfontossg a helyes s biztonsgos mkds, hiszen pldul az nvezet jrmvek esetn ember letek is foroghatnak kockn, a rendszer megfelel mkdsn. Ezen rendszerek azonban mgsem annyira biztonsgosak mint azt els ltsra gondolnnk. Emiatt fontos szmunkra, hogy megvdjk ezen rendszereket krtkony kls behatsoktl. Els lps annak rdekben, hogy megvdjk ezen rendszereket, a tmadsok megismerse. Rengeteg tmadst ismernk ilyen tren, ezekkrl lesz sz sszefoglal jelleggel, valamint ki lesz fejtve bvebben az Adversarial Attack, mely ebben a flvben a f cl volt. Sikerlt megvalstanom a modell extractiont, szimpln intuci alapjn. Belttam, hogy brmilyen plussz optimalizci nlkl, st akr confidence value k ismerete nlkl is teljes mrtkben repliklhat egy modell mkdse alapjn. Erre mindssze egy hasonl datasetre van szksgnk, mint amin az eredeti modellt betantottk, legyen az szimpln csak hasonl, vagy akr szintetikusan generlt. Talltam azonban egy mdszert, mely sokkal jobban nvelheti magnak a msolt modellnek a pontossgt. Ezen mdszer lnyegben a Knowledge Distillation -n alapszik. Maga a knowledge distillation gy mkdik, hogy van egy nagyobb teacher modellnk, melyre betantunk egy datasetet, melynek a tudst majd tszeretnnk vinni egy sokkal kissebb student modellre. Elkezdjk lnyegben betantani a teacher modellt, majd ha ez sikerlt, akkor az ott ltrejtt tudst szeretnnk tvinni a student modellre. Maga az adversarial attack br mkdtt elmleti skon s sikerlt is a gyakorlatban vghez vinni, szerintem mint tmads nem llja meg a helyt, mivel akrki aki rnz az eredeti, majd mdostott tmad bemenetre, szre tudja venni kztk a klnbsget, brminem nehzsg nlkl. Lnyegben a bemenetre a tmads esetn, egy teljesen msik bemenet jtt ltre, mely akr egy teljesen ms szemly is lehet.

Nagy Zoltn

2022-05-24

Tmogat: Quadron kibervdelmi kft