Regisztráció Blogot indítok
Adatok
Zoltán Varjú

417 bejegyzést írt és 48 hozzászólása volt az általa látogatott blogokban.

Admin Szerkesztő Tag Vendég
A MIBE éves konferenciáján adunk elő a deep learningről, slidejaink alább:  ..
Hogyan hat a mesterséges intelligencia a gazdaságra, hogyan lehet beilleszteni egy cég mindennapi működésébe a gépi tanulás eredményeit, milyen hatással lesz ez a munkára? Agrawal, Gans és Goldfarb könyve ezeket a kérdéseket járja körül. A könyv alaptétele egyszerű, a predikció (a szerzők így…..
A POLTEXT-en és a CILC-en is bemutattuk The nation in American political discourse - An attempt to train an automatic metaphor identitifer című fantasztikus előadásunkat. Diák és egyebek alább.  Virág kolléga a POLTEXT-en éppen nagyon előad Orsi kolléga a CILC-en belekezd az…..
A múlt héten a POLTEXT konferencián mutattuk be egyik új projektünket. A diákat alább lehet nézegetni, a kapcsolódó vizut pedig itt. Gergő kolléga prezentál Az elmaradhatatlan Sozi-ban készült prezi   A csapat nagyobbik része   Itt lehet nézegetni a szóbeágyazásokat   A prezentáció pedig…..
Itt a tavasz, jönnek a rendezvények! Előadunk, szerveztünk egy beszélgetést az AI-ról és hackathon is lesz! Április 19-én a Startup Safary-n két rendezvényt is ajánlunk nektek: Emberközpontú gépi tanulás - 17 órától a LogMeIn-ben beszélünk a Precognoxnál folyó munkáról, aminek nagyon hangzatos…..
A Járókelőn a bejelentésekre adott válaszokat egy Megoldópontszám értékeli. Az értékelés mögött egy általunk fejlesztett klasszifikációs API rejlik, amit mi nagyon megszerettünk, mert a modellhez szükséges tanulóadatok annotálásától a végső webes szolgáltatás kialakításáig végigszöszmötölhettünk a…..
Ha csak egy könyvet olvasol el a mesterséges intelligencia történetéről és jövőjéről, ez legyen az - minden túlzás nélkül lehetne ez ennek a posztnak a klikkvadász címe. John Markoff nagyon alapos munkát végzett, amikor feltérképezte a mesterséges intelligencia történetét. Nem csak kutatók, de…..
A szolucionizmus híveinek kötelező olvasmány Cathy O'Neil, a mathbabe blog szerzőjének könyve! Egy hajdani quant (pénzügyi geek) matek PhD-val a zsebében fogta magát és utána járt, mit köszönhetünk a gépi tanulásnak - nem sok jót talált, de arról rendkívül olvasmányos módon számol be nekünk. A…..
Ma az Entrepreneur DNA konferencián adunk elő, kapcsolódó diáink alább. A gépi tanulás kapcsán termékeinkről fogunk beszélni, azaz a TAS, a Data Collector, a Classifier API és a Sales Lead Generator is bemutatásra kerül...
Hogyan lesz előítéletes az AI? Erre keressük a választ magyar alternatív zenekarok dalszövegeiből készített szóbeágyazási modellt hívva segítségül. A szóbeágyazási modellt ezen az interaktív vizualizáción keresztül lehet felfedezni, de lentebb azt is elmondjuk, hogy mely szavak jellemzőbbek inkább a…..
A hónap végén egy remek konferencia lesz Pécsett, amin kollégáinkkal is találkozhattok. A Precognox a szövegek érzelmi elemzéséről, lead generálásról és scrapingről fog beszélni. Részletes program elérhető itt.     ..
Ma a conTEXT-en adunk elő. Továbbra sem sikerült lejönnünk a topik modellezésről, de most nem a szokásos LDA lesz, hanem ATM (azaz Author-Topic Model).  A migrációs válság során megjelent hírekből készült korpuszunkkal kapcsolatban a leggyakoribb kérdés az volt, hogy az egyes topikok mely…..
Az 1956-os dartmouth-i konferencia óta várjuk a nagy áttörést a mesterséges intelligencia terén. Miután végig próbáltunk mindent, a logikától a bayesiánus megközelítésen át konnekcionizmus (fiatalabbaknak deep learning) megannyi újjászületésén át, továbbra is ott tartunk, hogy nehezen tudjuk igazán…..
A felületes szemlélődő számára úgy tűnhet, a deep learning csupán az internet nagy kérdéseire fókuszál; cuki cica van-e egy adott képen vagy nem, van Gogh stílusú profilképünk legyen vagy adott ember stílusában generáljunk szövegeket. Akadnak olyan mellékszálak, mint az önvezető autók, melyek azért…..
Régóta dolgozunk azon, hogy adatelemzési projektjeink végén ügyfeleink számára nem csak szakmailag pontos és használható, hanem vizuálisan is elfogadható riportokat tudjunk szállítani. Először az interaktív vizualizációkat használó riport formáját dolgoztuk ki, erre példa a Migráció arcai…..
A machine learning esetében hatványozottan igaz a garbage in, garbage out elve. Az iparban nagy erőforrásokat teszünk abba, hogy az adatokat legyűjtsük, transzformáljuk, kitisztítsuk, majd a legtutibbnak mondott algoritmusokba dobjuk, hogy végül bosszankodjunk mert "a 99%-os pontosság csak az…..
Ma a Budapest Science Meetupon találkozhattok velünk, ahol legújabb tartalomelemzési projektjeinkről fogunk beszélni. Kapcsolódó diánkat pedig itt találjátok:..
Tíz éve jelent meg az első poszt blogunkon. A kezdetek a keresőkről szóltak, azóta viszont kibővítettük témáinkat, megjelent a nyelvtechnológia, a mesterséges intelligencia és a gépi tanulás, meg minden más. Az alapító Jóföldi Endre mellett az évek során tizenketten csatlakoztak rövidebb vagy…..
A nyest.hu-n elérhető legújabb tartalomelemzésünk melyben a migrációs válság során a magyar nyelvű online médiában megjelent képeket vizsgáltuk. A projekt során korábban már elemeztük a szöveges tartalmakat és beszámoltunk a képekkel kapcsolatos vizsgálódásaink előzetes eredményeiről itt. ..
... azoknak, akik szeretnének a gépi tanulás és a mesterséges intelligencia alapjairól többet tudni. Morris Kline: Mathematics for the Nonmathematician Talán a legtöbbünknek az a baja az absztrakt matematikával, hogy nem tudjuk mire is találták ki. Kline könyve a matematika főbb területeit…..
Új szóval jöhetnek elő azok, akik szerint a big data annyira 2010, az AI meg 2016, hogy izé! Itt a post-analytics era, amiben a gépi intelligencia és az emberi találékonyság a lehetetlent is meg tudja valósítani a megfelelő keretek között. Ez a megfelelő keret nem más, legalábbis Sullivan és…..
Az opendata.hu-n elérhető Twitter Szentiment Korpuszunk. A korpuszt 2016 elején gyűjtöttük és most a közelgő szövegbányászat workshop kapcsán publikáljuk, hogy kutatási és hobbi céllal bárki szabadon használhassa...
Ingatlanhirdetéseket tartalmazó korpuszunkra ráeresztettük az LDA-t, ennek eredménye 30 topik lett. A topikok felfedezhetők a pyldavis által generált vizun itt. Megnéztük minden járásra és kerületre, melyik a legjellemzőbb három topik, ezt QGIS segítségével térképre is tettük és generáltunk egy…..
Az ingatlanhirdetések szövegei sokat elárulnak arról, hogyan látják környezetüket a hirdető tulajok. Korábban összegyűjtött közel 200.000 hirdetés szövegét elemeztük most, hogy lássuk, milyen területi különbségek jelennek meg az eladók szóhasználatában. A kapcsolódó vizualizáció itt érhető…..