Adatok
gulyasmate
0 bejegyzést írt és 1 hozzászólása volt az általa látogatott blogokban.
Kereső Világ: keresés, szövegbányászat, big data
A karakterkĂłdolás problematikája és a Unicode
2014.05.21 08:00:00
Karakterkódolási rendszer egy olyan módszer az informatikában, amely a számok, betűk és más hasonló adatok megjelenítésével foglalkozik, aminek az alapja az, hogy minden karakterhez egy-egy egyedi szám van hozzárendelve. Hasonlóan a Morzekódhoz, ahol a távbillentyű hosszú vagy…..
Belépve többet láthatsz. Itt beléphetsz
Az Unicode nem karakterkódolás, hanem szabvány. Unicode rendszerben kódpontok vannak, amit többféle képpen kódolhatsz. Unicode kódolás az UTF-8, UTF-16, UCS-2, UCS-3, UTF-7, etc...
ASCII 7 bitnyi szimbólum volt definiálva, de 8 bites volt gyakorlatban, mert ekkora volt a legtöbb gépben akkoriban a szóhossz. 7 bitet használtak az angol ékezet nélküli karakterek, plusz a harminc valahány kontrol szimbólum, ezért maradt meg a 128 feletti rész. Ezt használták ki, ide kerültek a régió/ország specifikus karakterek. Ezek később szabványosítással tovább éltek.
Tökk jó cikk, gratulálok! :)