Regisztráció Blogot indítok
Adatok
István NagyRácz

33 bejegyzést írt és 37 hozzászólása volt az általa látogatott blogokban.

Admin Szerkesztő Tag Vendég
Ha szeretnél olyan projekteken dolgozni, mint amikről a bejegyzéseinkben olvasol. Ha érdekel a data science vagy a data engineering világa. Ha olyan termékeket és szolgáltatásokat fejlesztenél, amelyekben adatelemzési megoldások dolgoznak.  Írj nekünk a job@dmlab.hu címre, keressünk egy közös…..
István NagyRácz 2018.12.06 16:15:56
@Tsz: Írj egy emailt és beszéljünk, mindig van hely egy új csapattagnak :)
nagy.istvan@dmlab.hu
István NagyRácz 2019.10.01 06:41:22
@jamacsiga: A fenti kommentben ott az emailcímem, írj bátran és megbeszéljük, van-e kapcsolódási pont.
  A CRISP-DM módszertan az egyik leggyakrabban használt módszertan, ami iránytűként szolgál abban, hogyan lehet egy üzletileg sikeres adatelemzési projektet véghezvinni. Ez a cikk a módszertan alapját mutatja be egy valós projekten keresztül.  ..
  Már hagyományosnak mondható módon idén is meghirdetjük a BME-s tárgyaink egy részét külsős hallgatók számára. Hiszünk benne, hogy sokaknak tud segíteni egy olyan program, amiben MSc informatikus hallgatókkal együtt kezdik el tanulni az adatelemzés alapjait. Az elmúlt években minden alkalommal…..
István NagyRácz 2019.02.01 16:20:37
@Le a spammerekkel: éppen emiatt nyitott a kurzus, hogy olyanok is be tudjanak csatlakozni, akik "kinőttek az egyetemista korból". Jelentkezz bátran, de minél előbb, ha érdekel, mert egyelőre a hallgatói létszám 28-on áll, míg a külsős jelentkezők száma napról napra nő :)
István NagyRácz 2019.02.01 20:09:11
@Kriszti1982: hetente két előadás van, mindkettőn külön anyagrészt veszünk, nem egymás alternatívái.
Ebben a bejegyzésben összegyűjtöttük a Budapestről elérhető data science és big data témájú képzéseket, és a velük kapcsolatos legfontosabb tudnivalókat. Ha adatokkal akarsz dolgozni, az első döntés amit meg kell hoznod, hogy technológiai oldalról érdekel a téma, vagy üzleti oldalról. Ha a…..
Egyre többször felvetődik az etikusság és a döntéshozatali felelősség kérdése ahogy közelítünk az általános mesterséges intelligenciához. Több cég algoritmusairól derült ki az utóbbi időben, hogy szexisták, vagy rasszisták.  Amíg a tanulóalgoritmus az ember által adott információk alapján fog…..
István NagyRácz 2018.11.17 07:37:48
@Apám neve után Sándor: Kedves Sándor, ez egyáltalán nem ilyen egyszerű.

Ha ezt a modellt egy olyan adathalmazon tanítottuk be, amelybe azért került több az egyik típusú emberből, mert a bírói, vagy igazságszolgáltatási rendszer alapból elfogult, akkor a modell is csupán erre az emberi gyarlóságra tanul rá.

Valamint ez a modell akkor tudna elfogultan dönteni, ha olyan adatokat kapna, ami a büntetés letöltése utáni integrációs folyamatról ad információkat, feltéve, hogy itt is mindenki hasonló lehetőségekhez jut, különben megint csupán a jelenlegi társadalmi rendszert képezzük le a modell által.
Immár negyedik alkalommal, idén is megrendezésre kerül a régió egyik legnagyobb data science és data engineering happeningje: a Crunch konferencia. A konferencia indulásakor azt írtuk, hogy Budapest ezzel a konferenciával vált nagykorúvá, hiszen egy olyan esemény kerül megrendezésre évről évre, ahol…..
Idén is meghirdetjük a BME-n tartott legfontosabb tárgyainkat külsősök számára is. Ez azt jelenti, hogy a műegyetemista hallgatókkal együtt szeptember elejétől 14 héten keresztül lehet a data science és a big data világába betekintést kapni. A kezdeményezés igen népszerű,…..
Idén is meghirdetjük a Műszaki Egyetemen tartott tárgyunk külsősök számára is. Ez azt jelenti, hogy az egyetemista hallgatókkal együtt február elejétől 14 héten keresztül lehet a data science és a big data világába betekintést kapni. A kezdeményezés igen népszerű, de a…..
Folytatva a hagyományokat: szeretnénk a figyelmetekbe ajánlani a tavaszi félévben futó data science kurzusunkat a Műegyetemen, amelyben az érdeklődők betekintést nyerhetnek az adatelemzés világába elméleti és gyakorlati órák keretében. A tárgy órái hetente keddenként 10:15-től és minden második…..
Még sokan a szabadságukat töltik, vagy élvezik a nyarat, de a csapatunk elkezdett dolgozni az öszi BME-s kurzusok aktualizálásán. Ennek már hagyományos része, hogy a külsős hallgatók között is megnyitjuk a kurzusainkat. Az előző félévek tapasztalatai alapján minden kurzus esetén legalább annyi…..
Tavaly arról írtunk, hogy hazánk big data szempontból is nagykorúvá vált azzal, hogy a Prezi, a UStream és a RapidMiner csapata Budapesten szervezett egy mind előadóiban, mind szervezésében világszínvonalú adatos konferenciát. Idén is megrendezésre kerül a Crunch konferencia. A workshopok…..
Adatbányászat Blog Versenyek kora 2016.01.28 09:18:36
Talán nem kell bemutatnuk a csapatot abból a szempontból, hogy mindig is elég sok időt szántunk arra, hogy a különböző adatbányászati versenyeken elinduljunk és azokon minél jobb helyezéseket érjünk el. Nagyon hasznosnak tartjuk ezeket a versenyeket és a csapatunkban is elég nagy motiváló erővel bír…..
A most szeptemberben a Műegyetemen oktatott tárgyainkat szeretnénk a figyelmetekbe ajánlani. Ebben a félévben két választható tárgyunk indul két kurrens témában. Az "Adatbányászati technológiák" című tárgyunk különlegessége, hogy műhelymunkával egybekötve tanítjuk meg…..
István NagyRácz 2014.09.10 13:15:29
@europass8: Mindkét tárgyunk első órája éppen most tart, de ettől függetlenül lehetséges, hogy a többi órára bejössz.
István NagyRácz 2014.09.15 12:55:40
@europass8: nem tudom, melyik tárgy érdekelne. Adatbányászati technológiákból két előadás is lement, ott már elméleti bevezetés van. A Big Data-s tárgyunkon egy előadáson vagyunk túl ott is lassan belecsapunk a dolgok közepébe :)

Külsős jegyzet hivatalosan nincs, hallgatók által készített jegyzetek félév közben megosztásra kerülnek majd.
István NagyRácz 2015.06.01 12:38:28
@Jabec: igen, a következő félévben az alábbi tárgyainkra lehet bejárni külsősként.
Alkalmazott adatelemzés, portal.vik.bme.hu/kepzes/targyak/VITMAV14/
'Big Data' elemzési eszközök nyílt forráskódú platformokon, portal.vik.bme.hu/kepzes/targyak/VITMAV15/

Érdemes egyeztetni az oktatókkal, ha valaki szeretne jönni. Amiatt, hogy olyan termeket tudjunk foglaltatni, ahol a külsősökkel együtt is elférünk. Az első tárgy kapcsán írjatok nekem, míg a második tárgy kapcsán Prekopcsák Zolinak.
Mihez kezdhet az ember, ha szeretne elhelyezkedni bármilyen adattal kapcsolatos területen? A külföldi álláskereső portálok csak úgy hemzsegnek az ilyen jellegű álláshirdetésektől. Csak, hogy egy példát említsünk: a monster.com álláshirdetéseket tartalmazó portálon a data…..
Alig telt el öt hónap azóta, hogy itt a blogon is bejelentettük, hogy az első olyan technológiai spin-offot, a Radoopot, amelyet a Dmlab inkubált, felvásárolta a RapidMiner, most egy újabb remek hírt szeretnénk veletek megosztani a csapatunkkal kapcsolatban. A Slush konferencián,…..
Erre a kérdésre kell majd válaszolnom hamarosan olyan hallgatóknak, akik az új Adat- és Médiainformatika mellékspecializációnk (más néven szakirányunk) után érdeklődnek. A jól összeállított tárgytematikán túl arról is beszélni szeretnék neki, hogy miért is érdemes ezt a…..
István NagyRácz 2014.11.10 08:15:17
@Tomi Mester: Köszi szépen a közreműködést. Az eredményeket mindenképpen megosztjuk valamilyen formában azokkal, akik kitöltik a kérdőívet.
A hazai blogszféra egyfajta lenyomata annak, hogy mennyi lelkes és szenvedélyes szakember van a magyar szakmai életben. Most egy új oldal indult R-projekt.hu néven, ami a Hírek fül alatt nemcsak blogtartalmat, hanem segédanyagokat, eseményeket szeretne aggregálni az adott témában. Az…..
István NagyRácz 2014.09.05 13:51:14
@europass8: amennyiben a tárgyunkra írtad a kommentet úgy sajnos nincsenek jó híreim: ebben a félévben nem indul mégsem ez a tárgy, mert nem érte el az előzetes kötelező létszámot a jelentkezett hallgatók száma
Az előző RapidMiner tippek blogbejegyzésre érkezett pozitív visszajelzéseknek megfelelően - melyeket ezúton is köszönünk - a mostani írás is a RapidMiner mélyebb ismertetéséről, egészen pontosan a Crawl Web operátor trükkös működéséről illetve használatáról szól. A…..
István NagyRácz 2014.07.25 09:21:37
@baalazs: ebben van is valami, ha tényleg csak erre akarod használni. Egy másik projektben egy webes hirdetőt minden hirdetését szedtük le ezzel a módszerrel. Itt ugye már parse-olni kellett elég sokat, amihez ez nagy segítség volt. Persze azóta erre is megjelentek a céleszközök például a Kimono (www.kimonolabs.com/) és az import.io (import.io/) személyében.
Időről időre felmerül az igény, hogy miért nem írunk több olyan bejegyzést, ahol egy adott eszközzel kapcsolatos gyakorlati tanácsokat írunk le, egy-egy érdekesebb probléma megoldásának menetét, vagy egy-egy, a szoftver logikai felépítéséből adódó buktatóra adott…..
A következő bejegyzés Ragány Csaba kollégánk írása, aki csapatunk egyik, ha nem a legtapasztaltabb RapidMiner felhasználója. Az elmúlt hetekben több fontos esemény is történt a RapidMiner háza táján, melyek közül az egyik - nem meglepő módon -, hogy a KDNuggets…..
István NagyRácz 2014.07.01 10:06:12
@teaház: Próbálunk rendszeresen írni ezentúl ilyen technológiaibb posztokat is. Hamarosan egy kérdőíven megkérdezzük, hogy mekkora igény van erre és egyéb technológiákra.
Folyamatosan keressük csapaton belül azokat a platformokat, ahol más adatelemzőkkel összefogva, vagy velük szemben mérhetjük meg analitikai kompetenciáinkat. Fontos ez nekünk, hiszen a napi rutin mellett, ezekben a versenyekből táplálkozunk, ezek mentén tudunk tovább és tovább…..
A felhasználók múltbéli böngészései és viselkedése alapján sok webes szereplő szeretné személyre szabottá tenni oldalát, hogy az ügyfelei minél inkább úgy érezzék, hogy a gondolataikat is ki tudja találni az adott rendszer. Az orosz keresőóriás, a Yandex is azon igyekszik,…..
Sokszor felmerül a kérdés, főleg az egyetemi hallgatóságban, hogy egy jó adatbányász mennyire rendelkezik az üzleti kontextustól független tudással, vagy a lényeg az adott felhasználási területre jellemző domainspecifikus tudásban rejlik. Egy adatbányász általában erre azt a…..
Csapatunkban nagy hagyománya van és mára támogatott dologgá vált, hogy tagjaink különböző adatbányászati versenyekben vesznek részt. A legjobb helyezésekről és az ezekhez kapcsolódó versenyekről a blogon is igyekeztünk beszámolni, a legfontosabb szakmai tapasztalatokat…..
István NagyRácz 2014.02.07 08:34:23
@Arató Bence: 3.5GB nyers adat beolvasása különböző eszközökben különböző memóriaterhelést jelent, nem ismerve az adatot ez mondjuk RapidMinerben 6GB környékén lesz, de még python pandasban is meg fogunk enni vele 4GB-t. Ha szeretnénk más folyamatoknak és a host oprendszernek is helyet hagyni, akkor már alsó hangon 6GB memória felett vagyunk, ami azért asztali gép környezetben legalábbis nem általános. És itt még csak a nyers adatról beszéltünk, nem volt szó arról, hogy új változókat hozunk létre, hogy két ilyen táblát összekapcsolunk stb.