Betűszemét

Mojibake (文字化け, kiejtése /modʑibake/) a hibás, olvashatatlan karakterek elnevezése, amelyek akkor jelennek meg, amikor a számítógépes szoftver nem jeleníti meg helyesen a szöveget. A számítógépek használatakor a szöveget karakterkódolással kódolják. Az átvitel során minden egyes karaktert a kódolásban elfoglalt helyével (vagy számával) helyettesítenek. A karakter újbóli megjelenítéséhez a pozíciót ismét a karakterrel kell helyettesíteni. Ha az eredeti kódolás nincs megadva, akkor egy másik karaktert lehet használni, amikor a számot ismét a megjelenítendő karakterrel helyettesítjük. Az Unicode ennek a problémának a megoldására került bevezetésre: az UTF-8 képes a legtöbb gyakori karaktert 2 bájton belül kódolni.

A Unicode bevezetése előtt más karakterkódolásokat használtak. Az ISO-8859 például 15 különböző kódolást tartalmaz. Ezek megegyeznek az angol nyelvben általánosan használt karakterekkel. Több "speciális karakterblokk" is van, amelyeket minden egyes kódolásnál másképp iktatnak.



Így nézhet ki egy weboldal, ha rossz betűkódolást használnak.Zoom
Így nézhet ki egy weboldal, ha rossz betűkódolást használnak.

A japán Mojibake szócikk a japán Wikipédián UTF-8 kódolást használ. Ez a képernyőkép azt mutatja, hogyan néz ki, ha a Windows CP1252 szabványos kódolásával dekódoljuk.Zoom
A japán Mojibake szócikk a japán Wikipédián UTF-8 kódolást használ. Ez a képernyőkép azt mutatja, hogyan néz ki, ha a Windows CP1252 szabványos kódolásával dekódoljuk.

A szó eredete

A mojibake egy japán szó. A 文字化け ([moʥibake]) szó két részből áll. 文字 (moji) betűt, karaktert jelent. A 化け (bake) a 化ける (bakeru) igéből származik, jelentése: álruhában megjelenni, alakot ölteni, rosszabbra változni. Szó szerint azt jelenti, hogy "jellemmutáció".



Kérdések és válaszok

K: Mi az a "mojibake"?


V: A mojibake a hibás és olvashatatlan karakterek kifejezése, amelyek akkor jelennek meg, amikor a számítógépes szoftver nem jeleníti meg helyesen a szöveget.

K: Hogyan kódolják a szöveget a számítógépek használatakor?


V: A szöveg kódolása karakterkódolással történik, ahol minden egyes karaktert a kódolásban elfoglalt helyével vagy számával helyettesítenek.

K: Mi történik, ha a szöveg átvitelekor nem az eredeti kódolás van megadva?


V: Ha az eredeti kódolás nincs megadva, akkor a megjelenítésre szánt karakter helyett a számot egy másik karakterrel helyettesíthetjük.

K: Mi az az Unicode, és hogyan oldja meg ezt a problémát?


V: A Unicode egy olyan karakterkódolási szabvány, amely a legtöbb karaktert két bájton tudja ábrázolni. Megoldja a különböző karakterkódolások használatának problémáját, és biztosítja a karakterek helyes megjelenítését.

K: Milyen más karakterkódolásokat használtak az Unicode előtt?


V: Az ISO-8859 egy példa az Unicode előtt használt másik karakterkódolásra.

K: Hány különböző kódolást tartalmaz az ISO-8859?


V: Az ISO-8859 15 különböző kódolást tartalmaz.

K: Az ISO-8859 speciális karakterei az összes kódolásban azonosak?


V: Nem, az ISO-8859 speciális karakterei minden egyes kódolásnál másképp vannak iktatva.

AlegsaOnline.com - 2020 / 2023 - License CC3