Egyváltozós idősorok előrejelzése Stream Processing rendszerekben

Manapság egyre nagyobb problémát jelentenek a nagyvárosokban és az autópályákon kialakult forgalmi dugók, amelyek komoly légszennyezést okoznak, valamint negatív gazda- sági következményeik is vannak. A forgalmi dugók száma és hatása jelentősen csökkenthető intelligens forgalomirányítási rendszerekkel, amennyiben ezek a rendszerek képesek meg- felelő időben és megfelelő módon beavatkozni a forgalom alakulásába. Az intelligens forgalomirányító rendszerek sarokköve a valós idejű forgalom előrejelzések készítése, melyekkel megbecsülhető a forgalom következő állapota, így ezek a rendszerek akár a dugó kialakulása előtt képesek beavatkozni a forgalom áramlásába. Technikai kihívást jelent azonban, hogy sok szenzor szükséges annak érdekében, hogy elegendő mennyiségű adattal rendelkezzünk ahhoz, hogy megfelelően pontos előrejelzést tudjunk végezni. Mivel a sok szenzorból valós időben nagy mennyiségű adat érkezik, olyan technológiai megoldást kell használni, amely képes hibatűrő és skálázható módon az adatok begyűjtésére és az előrejelzések végrehajtására. A kutatási téma célja egy olyan rendszer megalkotása, ami képes a valós időben beérkező nagy mennyiségű adaton, valós időben becslést végezni. Míg az előző félév során a célunk az volt, hogy létrehozzunk egy olyan Stream Processing alapokon nyugvó proof-of-concept rendszert, ami mesterséges intelligencia alapú predikciós modellek alkalmazásával képes forgalmi adatokat valós időben előrejelezni és ezzel támogatni az intelligens forgalomirányító rendszereket, addig ebben a félévben a munkánk fókuszában az állt, hogy minél pontosabb előrejelző modellt alkossunk meg. Ehhez először a forgalmi adatok felhasználásának módját és azok előfeldolgozásának lépéseit határoztuk meg, majd ezek után az időjárási adatok felhasználásának hatását vizsgáltuk az előrejelzés pontosságára. Az adathalmazok összeillesztése után megvizsgáltam, hogy milyen esetekben, mely -és mennyi időjárási adatot érdemes figyelembe venni. Munkánk végén különböző modelltípusok teljesítményét hasonlítottuk össze különböző metrikák szerint.

Nagy Attila Mátyás

2022-01-15

Támogató: Cloudera