Adatfeldolgozó akut dialízisgépekhez

A B. Braun Medical Kft.-nél töltött időszakom alatt a vállalatcsoport megismerése és a szakmai és élettani hátteret bemutató oktatások elvégzését követően az akut csapatnál kezdtem meg a kutatói munkámat, amely az akut dialízisgépekkel foglalkozik. A csapatnak szüksége volt egy olyan megoldásra, mely segítségével feltöltheti az akut dialízisgépek adatait egy felhő szolgáltatást biztosító platformra, hogy a gépek működtetése, tesztelése során keletkező adatokat a továbbiakban itt tárolhassák, illetve lekérdezéseket végezhessenek azokon, ezzel elősegítve a problémák felderítését, több esélyt adva a termék javítására. A kutatói munkám alkalmával ezen feladat kivitelezésre kaptam lehetőséget, amely során más csapattal is együtt dolgoztam. Elsőként megismertem az akut dialízisgéppel zajló kezelések során generálódó adatok struktúráját, az akut dialízisgépek szoftverét és szoftverkomponenseit. A jelenleg működő szoftver a dialízisgép használata során adatokat ment ki egy komplex struktúra szerint. Ezeket az adatokat olyan mappastruktúrába menti, amik tartalmazzák a metaadatokat, illetve a konkrét információtartalommal rendelkező adatokat is, amik kétfajta típusúak lehetnek: szövegfájl vagy bináris formátumúak. Ahhoz, hogy az akut dialízisgép adatait felhőalapú technológia segítségével tárolhassuk és kezelhessük, a cég által használt felhőalapú megoldással kompatibilis struktúrájúvá és formátumúvá kell azokat konvertálni. Több big data formátum is szóba jött, végül a parquet formátumot választottuk, mivel ez különösen helytakarékos a hatékony oszloponkénti tömörítés és a különböző adattípusokat tartalmazó oszlopok rugalmas kódolási sémáinak köszönhetően, továbbá megnövelt adatátviteli sebességet biztosít. A parquet formátum megfelelő használatához a pyspark csomagot és annak SQL eszköztárát használtam. Egy olyan egy python nyelven írt adatfeldolgozó scriptet implementáltam, amely paraméterként megkapja a feldolgozni kívánt akut dialízisgépes kezelések során generálódott adatokat tartalmazó mappa nevét, majd futása során kigenerálja az adatok megfelelő struktúrájú, parquet formátumú verzióját. Ezeket a file-okat a cég Azure Databricks segítségével tárolja. Ahhoz, hogy itt létrehozhassunk egy parquet formátumúvá konvertált akut dialízisgép adatainak tárolására alkalmas adatbázist, még adminisztratív teendőket kell elvégeznem. Kérvényben megadott információk alapján vetik vizsgálat alá, hogy az akut dialízisgép adatainak tárolása valóban kedvező és kivitelezhető-e a projekt számára. A korábban ismertetett fő projektemen kívül egyéb feladatokban is segédkeztem annak érdekében, hogy minél többet tanulhassak az itt szerzett tapasztalatokból. Az ösztöndíjas időszak során segítőkész kollégák tudására és társaságára támaszkodhattam. Örülök, hogy ilyen közegben dolgozhattam és ezúton is köszönöm a lehetőséget!

Pintér Petra

Támogató: B.Braun