Mlytanuls alap ajnlati knyv modellezs

Az adatbzisok mretnek s a szmtsi kapacits folyamatos nvekedsvel, tovbb a gpi tanul algoritmusok s kapcsold technolgik fejldsvel mra az adatvezrelt statisztikai parametrikus rendszerek meghatrozv vltak. Ezen bell is az elmlt vekben a legnagyobb figyelmet taln a mlytanuls (deep learning) kapta. A limitras ajnlati knyv (Limit Order Book, LOB) adott tzsde pnzgyi eszkzeire (pl. rszvny, valuta, stb.) vonatkoz, adott rszinten s mennyisggel rgztett ajnlati s vteli megbzsokat tartalmazza. Ezek a megbzsok a szban forg pnzgyi eszkznek a meghatrozott, vagy annl kedvezbb ron trtn vtelre vagy eladsra vonatkozik, a megadott mennyisg erejig. A LOB bejegyzsek sokdimenzis idsoros adatokat formlnak, mennyisgk a vizsglt tzsde fggvnyben jellemzen igen nagy, ami indokoltt teszi mlytanul eljrsok ez irny alkalmazst. Ezek alapjn jelen kutats tmja mlytanuls alap ajnlati knyv modellezs lehetsgnek a vizsglata volt. A kapcsold szakmai cikkek megismerst kveten ksrleti adatbzist alaktottam ki. Ehhez publikus interfszen keresztl kriptovaluta tzsdkrl gyjtttem esemnyszint LOB adatokat. Az adatgyjtst az adatok elemzse, tiszttsa s elksztse kvette. Az adatelkszts sorn jra mintavteleztem az idsorokat klnbz felbontsokkal s stratgikkal, s a clvltoz rtkt hromsvos cmkzs segtsgvel hatroztam meg. Ezt kveten baseline s mlytanul modelleket dolgoztam ki s tantottam be. A baseline modellek clja referencia teljestmny meghatrozsa a mlytanul eljrsokhoz. A kutats sorn olyan mlytanul modelleket vizsgltam, mint pldul a Long Short-Term Memory (LSTM) hlzatok, vagy az egydimenzis konvolcis neurlis hlzatok. Az egyes modellek teljestmnyt tvesztsi mtrixok, ROC grbk s az ltalnos osztlyozsi metrikk (precision, recall, pontossg, F1) segtsgvel rtkeltem ki. A kapcsold vizsglatokba hrom MSc hallgatt vontam be.

Dr. Gyires-Tth Blint Pl

2021-06-30

Tmogat: Morgan Stanley