Adatok
tihanyi
0 bejegyzést írt és 2 hozzászólása volt az általa látogatott blogokban.
Tegnap még csak azt tudtuk, hogy hamarosan jön, mára viszont a Google frissítette is fordítóprogramját. Úgyhogy mostantól lehet fordítani magyarra és magyarról a Translate-ben. Íme például a TechCrunch egyik postja magyarul: Ez pedig az Index nyitóoldala, angolul: Kicsivel…..
tihanyi
2009.02.02 09:41:08
Pairg felvetésére válaszolnék, a webforditas.hu projekt vezetője vagyok. Mindkét rendszernek, pontosabban működési elvnek, a nyelvtani szabályokon alapulónak és a statisztikainak is, vannak előnyei és hátrányai. A kettő együtt jobb eredményt adhat, ki tudják egészíteni egymást. A két rendszer fejlesztéséhez szükséges idő és szakértelem viszont nagyon eltérő. Az egyikhez egy nyelvészekből és lexikográfusokból is álló fejlesztőcsapat évtizedes munkája kellett, a másikhoz csak nyelvfüggetlen algoritmusok és némi adat. Ahogy azt Pairg is írta, a minőség csak a legegyszerűbb tesztmondatok esetén jobb a Google-nál, a szövegek viszont nem ilyenekből állnak, a webforditas.hu általában jobb minőséget ad. A Google által használt algoritmusok beépíthetők a mi programunkba is, de nyelvészeti tudás beépítésére a jelenlegi Google rendszer alkalmatlan, ilyennel adattal nem rendelkeznek és tudtunkkal nem is terveznek ilyet. Ezért a jó hírem az, hogy a webforditas.hu nemcsak jobb, de jobb is tud maradni.
Ha felmegyünk a Google Translate oldalára, azt láthatjuk, hogy a választható nyelvek között még nincs ott a magyar. Ugyanakkor ha a "detect language" funkciót használjuk, észrevehetjük, hogy a fordítógép ennek ellenére nagyon sok magyar szót felismer. Tegyünk egy…..
tihanyi
2008.11.20 08:17:07
A fordítóprogram fejlesztési projekt vezetője vagyok a MorphoLogicnál. Nagyon köszönjük az elismerő szavakat, de a kérdést is: miért nem akar együttműködni velünk a Google? Amit biztosan tudunk az az, hogy a Google a saját megoldásában hisz. Még nem állt elő a magyar fordítóval, ami mögött nyelvi nehézségek állhatnak. Ma két módszer versenyzik egymással a kevés munkával járó, gyors megoldást jelentő statisztikai (Google) és a sok munkát igénylő nyelvészeti alapú (MorphoLogic). A megoldás nyilvánvalóan a mindkettőt egyesítő hibrid megoldás lesz. A statisztikai módszert a nyelvészeti alapokon álló rendszerek gyorsan integrálhatják, de fordítva nem működik a dolog. Úgy gondoljuk, hogy a Google látva azt, hogy a gyors megoldással nem tudta megközelíteni a webforditas.hu minőségét, inkább nem állt elő a magyar fordítóval. Ugyanakkor nem hisszük, hogy a felhasználói visszajelzések segítségével fejlődő rendszer gyorsabban fejlődne mint a miénk. Ilyen nálunk is működik, illetve ha lenne érdemleges mennyiségű és minőségű visszajelzés, akkor komolyabb rendszert fejlesztettünk volna ezeknek az adatoknak a felhasználására. Mi felajánlottuk az együttműködésünket a Google-nek és a webforditas.hu oldalon barátságunk jeléül fixen megjelenítjük a Google hirdetési felületét. A Google vagy valamilyen új eddig ismeretlen fejlesztés bevetésére vár, vagy nem akar saját maga ellen dolgozni (a google.translate.com-on nincsenek hirdetések).
Néhány előző megjegyzést is kommentálnék:
DobayAdam: A gépi fordítást csak nagyon ritkán használják termékleírások fordításához, hiszen arra egyelőre alkalmatlan, a termékeket pedig el szeretnék adni. A gépi fordítás ma egyáltalán nem jelent veszélyt a fordítókra, sőt reméljük, hogy ha megfelelő minőséget ér el, akkor a fordító memóriába integrált fordítóprogram éppen az ő munkájukat fogja segíteni.
XYBeR: Ma az interneten egy adott nyelvről a legtöbb másikra a translate.google.com es a webforditas.hu oldalon lehet fordítani, ez 33 nyelvet jelent. (vigyázat felületesség félrevezető lehet pl. TranExp)
2. hely: www.lec.hu 21 nyelv. 3 hely: www.systransoft.com 13 nyelv . Fontos különbség, hogy mi csak magyar fordítást engedünk meg, náluk viszont éppen ilyen nincs.
dark future: A angol és német rokon germán nyelvek, könnyebb a feladat. Kevesebb munkával állítható elő egy adott minőség, vagy másképpen adott mennyiségű munkával jobb minőség állítható elő. Ha tovább dolgozunk, a mai jónak tartott német-angol minőség is messze meghaladható. A magyar nyelv nem logikátlanabb vagy bonyolultabb mint más nyelvek, csak nem az indoeurópai nyelvcsalád tagja ezért jobban eltér a többi európai nyelvtől.
amondó: Mások is gyakran esnek abba a hibába, hogy tévesen ítélik meg a magyar nyelv jelentőségét. A tíz milliónál magasabb népességünk és az internet használati mutatók alapján a gazdaságilag fontos nyelvek közé tartozunk. Konkrétan ebben az esetben erre jó bizonyíték, hogy a Google Translate 33 nyelvében már ezek a nálunk lélekszámban mindenképpen kisebb nyelvek is szerepelnek: lett, litván, szlovák, szerb, szlovén, stb.
Néhány előző megjegyzést is kommentálnék:
DobayAdam: A gépi fordítást csak nagyon ritkán használják termékleírások fordításához, hiszen arra egyelőre alkalmatlan, a termékeket pedig el szeretnék adni. A gépi fordítás ma egyáltalán nem jelent veszélyt a fordítókra, sőt reméljük, hogy ha megfelelő minőséget ér el, akkor a fordító memóriába integrált fordítóprogram éppen az ő munkájukat fogja segíteni.
XYBeR: Ma az interneten egy adott nyelvről a legtöbb másikra a translate.google.com es a webforditas.hu oldalon lehet fordítani, ez 33 nyelvet jelent. (vigyázat felületesség félrevezető lehet pl. TranExp)
2. hely: www.lec.hu 21 nyelv. 3 hely: www.systransoft.com 13 nyelv . Fontos különbség, hogy mi csak magyar fordítást engedünk meg, náluk viszont éppen ilyen nincs.
dark future: A angol és német rokon germán nyelvek, könnyebb a feladat. Kevesebb munkával állítható elő egy adott minőség, vagy másképpen adott mennyiségű munkával jobb minőség állítható elő. Ha tovább dolgozunk, a mai jónak tartott német-angol minőség is messze meghaladható. A magyar nyelv nem logikátlanabb vagy bonyolultabb mint más nyelvek, csak nem az indoeurópai nyelvcsalád tagja ezért jobban eltér a többi európai nyelvtől.
amondó: Mások is gyakran esnek abba a hibába, hogy tévesen ítélik meg a magyar nyelv jelentőségét. A tíz milliónál magasabb népességünk és az internet használati mutatók alapján a gazdaságilag fontos nyelvek közé tartozunk. Konkrétan ebben az esetben erre jó bizonyíték, hogy a Google Translate 33 nyelvében már ezek a nálunk lélekszámban mindenképpen kisebb nyelvek is szerepelnek: lett, litván, szlovák, szerb, szlovén, stb.
Belépve többet láthatsz. Itt beléphetsz