Adatok
Kitti Balogh
20 bejegyzést írt és 1 hozzászólása volt az általa látogatott blogokban.
Visszatérő problémánk, hogy területi adatokat gyorsan, vizuálisan elfogadható módon és lehetőleg interaktívan ábrázoljunk. E célból próbáltuk ki a QGIS nevű open-source programot, amivel első találkozásunk egészen biztatóan sikerült.
A QGIS-t elsősorban szakik használják, valószínűleg ezért is…..
Ma az NLP meetupon adunk elő egy Járókelőnek végzett projektünkről. Beszámolunk rögös utunkról, hogy hogyan jutottunk el a nyers adatoktól az annotáláson keresztül egy osztályozó modell építéséig, miközben olyan nehéz döntéseket kellett meghoznunk, minthogy megválunk egy annotátorunk eredményeitől...
Kereső Világ: keresés, szövegbányászat, big data
De hol van Chewbacca? - Adatavizualizáció Meetup
2017.02.16 16:03:22
Ma az Adatvizualizáció Meetupon adunk elő adatvizualizációs projektjeinkről. Megtudhatjátok, hogy mi hogyan bányászunk a szövegekben, miért kértünk külső segítséget Szűcs Kriszta adatvizualizációs gurutól és hogy milyen krízist tud okozni az adatos csapatban, ha eltűnik Chewbacca. Alább találjátok…..
Ezen a hétvégén a Young Statistican Meeting-en adunk elő dashboardjainkról, topik modellekről és tartalomelemzésről. Alább megtalálható előadásunk absztrakja és a kapcsolódó diák.
Kitti Balogh: Unveiling latent topic structure in anti-Roma discourse using Latent Dirichlet Allocation
From the…..
Kereső Világ: keresés, szövegbányászat, big data
Dashboard romaellenes cikkek elemzéséhez
2016.09.14 10:17:07
Az idősoros dashboard egy régebben kezdődött projektünk zárásaként készült el. A projekt során a kurucinfo szélsőjobboldali hírportál romaellenes cikkeit gyűjtöttük össze 2006-tól 2015-ig, amiket aztán kulcsszavak és témák szerint elemeztük. Ezután egy interaktív adatvizualizáció is készült, aminek…..
Kereső Világ: keresés, szövegbányászat, big data
Tanártüntetések: Mi történt a Facebookon?
2016.08.03 14:44:08
A 2016 elején kezdődött megmozdulás során többezer tanár, diák és támogató vett részt a tüntetéseken, hogy kifejezzék a kormány oktatáspolitikájával szembeni nemtetszésüket. A Budapesten és más nagyobb városokban szervezett események közül a február 13-i és március 15-i tüntetések keltették a…..
Kereső Világ: keresés, szövegbányászat, big data
Facebook scraper - Hogyan szedjük le egy Facebook oldal adatait?
2016.07.27 13:26:07
Itt érhető el az a scraper, amit azzal a céllal készítettünk, hogy könnyedén le tudjuk szedni egy publikus Facebook oldal posztjait, kommentjeit, lájkjait, reakciót és az oldalon aktív felhasználókkal kapcsolatos adatokat.
A Pythonban íródott eszköz az adatokat egy SQLite adatbázisba tölti a…..
Kereső Világ: keresés, szövegbányászat, big data
Szentimentek, emóciók és témák elemzése interjúkban
2016.04.15 08:27:09
Április 15-én bemutatjuk legújabb fejlesztésünket a "Tedd meg az első lépést" zárórendezvényen.
Az esemény a Születésház Egyesület 2015. március 1. – 2016. április 30. között lezajlott projektjét zárja le. A projekt azt a célt szolgálta, hogy hozzájáruljanak a magyar szülészeti ellátórendszer…..
Kereső Világ: keresés, szövegbányászat, big data
Facebook projekt a kaposvári Hackathonon
2016.04.05 10:57:47
A márciusi céges Hackathon egyik projektjeként azt a célt tűztük ki, hogy feltárjuk, milyen elemzési lehetőségek rejlenek a nyilvános Facebook oldalak adataiban. Emellett az is célunk volt, hogy mindezt a D3 JavaScript könyvtár segítségével jelenítsük meg vizuálisan. A Hackathon végére elkészült…..
A Precognoxhoz keresünk adatelemző gyakornokot. Elsősorban olyan nappali tagozatos hallgatót keresünk, aki járatos a statisztikában, adatelemzésben, és az R és/vagy a Python sem idegen számára (pl. survey statisztika, alkalmazott matematika szakos), de a határterületek hallgatóit (kognitív…..
Kereső Világ: keresés, szövegbányászat, big data
Szövegbányászat, társadalomtudomány, R
2015.12.04 08:59:40
Ma az Eötvös Loránd Tudományegyetem Társadalomtudományi Karán adunk elő Survey statisztika mesterképzéses hallgatóknak Németh Renáta Adatelemzés c. kurzusán.
Az órán a szövegbányászat elméleti megismerése mellett két gyakorlati példára is sor kerül az általuk is tanult R…..
Kereső Világ: keresés, szövegbányászat, big data
Politika a sorok között - előadunk politikai témájú projektjeinkről
2015.11.16 10:29:12
Ma Dessewffy Tibor Politikai kommunikáció c. kurzusán adunk elő az ELTE Társadalomtudományi Karon.
A diákoknak bemutatjuk a szövegbányászat és a hagyományos szövegelemzés eltéréseit és ismertetjük pár politikai témájú projektünket:
a tavalyi főpolgármester-választáskor…..
Kereső Világ: keresés, szövegbányászat, big data
A mókuson innen, a mávkártyán túl - avagy miről beszélünk mi II.
2015.10.30 10:34:32
Múltkori posztunkban megmutattuk, hogy a munkahelyi Skype csetelésünkből készített szófelhők és szógráfok milyen hűen reprezentálják az online eszmecserénk szakmaiságát. Ezek után tovább mélyülünk a Skype-os társalgásunk elemzésében. Ezúttal azt tártuk fel, hogy milyen…..
Nemrég írtunk a SwiftKey Neural Alphájáról, ami neurális hálót alkalmaz a bepötyögni kívánt szó előrejelzésére. Most egy másik SwiftKey mobil appot teszteltünk, a Hexy Launchert.
Mi az a Hexy?
A Hexy egy Android launcher, ami az appjainkat hatszögű elemeken elrendezve…..
Kereső Világ: keresés, szövegbányászat, big data
Adatvizualizáció arról, hogy hogyan beszélnek a romákról a kuruc.info-n
2015.09.09 10:31:28
Habár az utóbbi időben más csoport ellen folyik csőstül a gyűlöletbeszéd, a romaellenesség állandónak számít a magyar közhangulatban. Egy korábbi kutatásunkban - melyhez a most elkészült adatvizualizációt szeretnénk bemutatni - ez utóbbi jelenséget vizsgáltuk a kuruc.info…..
Kitti Balogh
2015.09.09 13:50:42
@Dr. Jones: Nagyon szemfüles vagy! Ez úgy lehet, hogy a módszer minden cikkhez egy vagy több témát rendel hozzá automatikusan aszerint, hogy milyen szavakat tartalmaz. Ha a Cozma-gyilkosság előtt volt olyan cikk, ami olyan szavakat tartalmazott, amik erre a témára voltak jellemzőek (pl. veszprémi, sportoló, szórakozóhely), akkor előfordulhat, hogy a cikkhez ezt a témát is hozzárendelte valamilyen mértékben.
Kereső Világ: keresés, szövegbányászat, big data
Nyelvi fejlődés hálózati megközelítésben
2015.07.29 12:08:52
Két korábbi posztunkban (itt és itt) megnéztük, hogy a CHILDES adatbázis magyar nyelvű adatain hogyan változik a gyermekek összesített szótármérete és a lexikai elemek közötti kapcsolatok száma 17-36 hónapos korig. A mostani posztunkban ugyanezekkel az adatokkal dolgozunk, azonban…..
Kereső Világ: keresés, szövegbányászat, big data
Hogyan cenzúrázd az internetet?
2015.07.03 09:00:00
Miután felderítettük a politikai blogok hálózatát, elemezgettük és előadtunk róla, épp itt az ideje, hogy szétromboljuk, ahogyan egy rendes LEGO-építményt illik. Na de mennyire ellenálló az építményünk? Szétesik egy jól irányzott csapástól vagy fogainkat és körmeinket…..
Kereső Világ: keresés, szövegbányászat, big data
A „nemzet” és a „nép” szavak Orbán Viktor beszédeiben
2015.06.29 13:29:47
Noha mindenki tisztában van azzal, hogy a politikai kommunikáció tervezett és a politikusok tudatosan használnak bizonyos kifejezéseket, érveket beszédeikben, mégis megdöbbentő, mikor a kommunikáció mesterséges szabályozásának olyan kézzelfogható bizonyítékaival szembesülünk,…..
Kereső Világ: keresés, szövegbányászat, big data
Kísérlet egy magyar R-index létrehozására
2015.02.03 23:29:51
A Recession/R-indexet az 1990-es évek elején találták ki a The Economistnál azzal a céllal, hogy az USA gazdasági helyzetét, kiváltképp a válság időszakokat egy egyszerű mérőszámmal tudják előrejelezni. Ez az általuk kitalált index azt méri, hogy a „recession” - azaz…..
Kereső Világ: keresés, szövegbányászat, big data
Könyvajánló: The Language of Food
2014.09.30 18:27:41
Hogyan lehet megmondani csak az étlap alapján, hogy olcsón megússzuk az ebédünket vagy mélyen a zsebünkbe kell nyúlni? Hogyan befolyásolják a választásunkat a chipses zacskón található feliratok? Mi köze a szexnek a sushi tekercsekhez? Miként terjedt el az Óperzsa Birodalomban…..
Belépve többet láthatsz. Itt beléphetsz