Moĝibako

Signokaĉa dialogujo: surekranigo de ĉinlingva demando per CP1252 en Vindozo 3.1

Moĝibako (japane 文字化け, [moĝibake], de 文字 (もじ, moĝi) «litero» + 化け (ばけ, bake «ŝanĝa» aŭ «misforma»), komputilista ĵargonvorto por misprezentita teksto rezultanta el apliko de malkonvena malkodilo al teksto alimaniere kodita, tiel ke la teksto aspektas abrakadabre al la leganto. Pli esperantece (radikŝpare kaj memklarige) oni povas diri signokaĉo. En Rusujo oni nomas tion кракозя́бры (krakozjabri, abrakadabraj skribaĉoj, IPA: [krɐkɐˈzʲæbrɪ̈]), en germana ĝi estas Zeichensalat («signa salato») kaj en la ĉina lingvo ĝi estas 乱码 (luànmǎ, «amaso da kodo konfuza»).

La problemo precipe aktualis en la frua periodo de la Interreto, kiam oni prezentis diverslingvajn tekstojn per malsamaj signokodoj. La enkonduko de Unikodo provizas la solvon universalan, sed la problemo persistis ĉar multaj retpaĝoj ne uzas la kodoprezenton UTF-8 (aŭ la kodoprezenton UTF-16, kiu estas pli kompakta reprezentado por la paĝoj ĉinaj, japanoj kaj koreaj).

Oni povas foje fari tian tekston komprenebla malfermante ĝin en tekstredaktilo aŭ retumilo, kaj elektante alian signokodon. Tamen, tia rekodigo por revigligi la originalan tekston ne ĉiam eblas. Ekzemple, pli aĝaj, neĝuste agorditaj retpoŝtaj serviloj kiuj atendas ricevi nur sep-bitajn mesaĝojn, forĵetus la okan biton en la dissendado,[1] aŭ unuopa fremda signo anstataŭus tutan signokombinon, tiel malhelpante la aŭtomatan restarigon de la celata signo.

Antaŭ la ĝenerala ekuzo de Unikodo, oni ofte kodis Esperanton en Latino-3 (alinome «Sud-Eŭropa Latina Signokodo») por prezenti la ĉapelitajn literojn ĉ, ĝ, ĥ, ĵ, ŝ kaj ŭ. Iuj retumiloj neĝuste interpretis ĉi tiujn signojn laŭ Latino-1 per la signoj kun la sama signonumero:

Eĥoŝanĝo ĉiuĵaŭde
E¶oþanøo æiu¼aýde

Referencoj

  1. Michael Rollins, “Avoiding the mojibake bugaboo” ("Evitante la moĝibakan teruraĵon"), Japan Times, la 27-an de februaro 2003. Elŝutita la 11-an de septembro 2009.