V nekaterih namestitvah telnet privzeto ni nastavljen na 8-bitni prenos. Da bi lahko poslali znake iz nabora Unicode oddaljenemu računalniku, morate najprej nastaviti telnet na način "outbinary". Za to sta dve možnosti:
in$ telnet -L <host>
$ telnet telnet> set outbinary telnet> open <host>
Komunikacijski program C-Kermit ( http://www.columbia.edu/kermit/ckermit.html), (interaktivno orodje za nastavljanje povezave, telnet, prenos datotek, s podporo TCP/IP in zaporednim povezavam) v različici 7.0 ali novejši pozna kodiranji UTF-8 in UCS-2 za prenos podatkov, prav tako pozna tudi terminalsko kodiranje po UTF-8. Zna tudi pretvarjati v obe kodiranji in še v številna druga. Dokumentacijo za te značilnosti najdete na http://www.columbia.edu/kermit/ckermit2.html#x6.6.
Netscape 4.05 ali novejši lahko prikaže dokumente HTML, ki so kodirani po UTF-8. V dokumentu mora med oznakama <head> in </head> stati tudi:
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
Netscape 4.05 ali novejši lahko prikaže tudi dokumente in tekstovne datoteke, kodirane po UCS-2, z oznako o vrstnem redu zlogov.
Netscapova domača stran je: http://www.netscape.com/computing/download/.
V Mozilla milestone M16 je internacionalizacija rešena precej bolje kakor v Netscape 4. Prikaže lahko dokumente HTML, kodirane po UTF-8, s podporo več jezikom. Zato pa ima manjšo lepotno napako pri pisavah CJK. Nekateri simboli so lahko večji od višine vrstice, tako da prekrijejo prejšnjo ali naslednjo vrstico.
Mozillina domača stran je: http://www.mozilla.org/.
Lynx-2.8 ima zaslon z možnostmi (tipka 'O'), na katerem se lahko nastavi nabor znakov za prikaz. Ko poganjate Lynx v xtermu ali konzoli v načinu UTF-8, nastavite to na "UNICODE UTF-8". Da začne ta nastavitev delovati v trenutnem teku brskalnika, jo morate potrditi v polju "Accept Changes" (sprejmi spremembe), da bo delovala vedno, pa morate izbrati polje "Save options to disk" (shrani možnosti na disk) in to potrditi s poljem "Accept Changes".
Tudi tokrat mora v dokumentu med oznakama <head> and </head> stati:
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
Pri prikazovanju tekstovnih datotek, kodiranih po UTF-8, morate v ukazni vrstici podati možnost "-assume_local_charset=UTF-8" (deluje samo pri naslovih, ki se začnejo s 'file:/') ali "-assume_charset=UTF-8" (deluje pri vseh vrstah naslovov). V Lynxu 2.8.2 lahko tudi na zaslonu z možnostmi (tipka 'O') spremenite predpostavljeni nabor znakov v "utf-8".
Na zaslonu z možnostmi je tudi možnost, da nastavite svoj "naljubši nabor znakov v dokumentu" (angl. preferred document character set). Vendar to ne deluje, če se URL začne s 'file:/...' ali s 'http://...' in je na strežniški strani Apache 1.3.0.
Problem je tudi s presledki in prelomom vrstic. Oglejte si razdelek o ruščini v x-utf8.html ali v utf-8-demo.txt.
Če je Lynx 2.8.2 nastavljen z --enable-prettysrc, barvna shema ne deluje več pravilno, ko nabor znakov na zaslonu nastavite na "UNICODE UTF-8". To popravite s preprostim popravkom lynx282.diff.
Razvijalci Lynxa pravijo: "Za vsako resno uporabo z izhodom na zaslon po UTF-8 se še vedno priporoča prevajanje s knjižnico slang in -DSLANG_MBCS_HACK."
Zadnja stabilna različica: ftp://ftp.gnu.org/pub/gnu/lynx/lynx-2.8.2.tar.gz
Izvirno kodo Lynxa dobite na: http://lynx.isc.org/.
Splošna domača stran: http://lynx.browser.org/
Novejše različice, ki jih še razvijajo: http://lynx.isc.org/current/, ftp://lynx.isc.org/current/
W3m avtorja Akinorija Ita
( http://ei5nazha.yz.yamagata-u.ac.jp/~aito/w3m/eng/) je tekstovni brskalnik po straneh HTML. Njegov prikaz tabel, naštevanj ipd. v HTML je precej lepši kot v Lynxu. Uporaben je tudi kot zelo dober pretvornik iz HTML v besedilo.
W3m ima izbire iz ukazne vrstice za tri najpomembnejša japonska kodiranja, lahko pa ga uporabite tudi za datoteke, ki so kodirane po UTF-8. Če v ukazni vrstici ne vnesete nobene izbire, morate pogosto pritiskati Ctrl-L za osveževanje prikaza, prelom vrstic v odstavkih v cirilici in v CJK pa ni dober.
To odpravite s popravkom Hironorija Sakamota ( http://www2u.biglobe.ne.jp/~hsaka/w3m/), ki med kodiranja za prikaz doda UTF-8.
Nekaj strani za preizkus brskalnikov najdete na straneh Alana Wooda ( http://www.hclrss.demon.co.uk/unicode/#links) in Jamesa Kassa ( http://home.att.net/~jameskass/).
Yudit avtorja Gáspárja Sinaia ( http://czyborra.com/yudit/ in http://www.yudit.org) je prvovrsten urejevalnik besedil, kodiranih po Unicode, za sistem X Window. Podpira hkratno obdelavo pri več jezikih, načinih vnosa in pretvorbah za krajevne standarde znakov. Ima pripomočke za vnašanje besedila v vseh jezikih z angleško tipkovnico, pri čemer se uporabljajo nastavitve za razporeditve tipk.
Prevesti ga je mogoče v treh različicah: Xlib GUI, KDE GUI ali Motif GUI.
Prilagoditi si ga je zelo lahko. Ponavadi si najprej prilagodite pisavo tako, da z menuja pisave (angl. font) izberete "Unicode". Nato izberete pisavo velikosti 13 (pri ukazu "xlsfonts '*-*-iso10646-1'" tu in tam še vedno nastane zmešnjava), ki se ujema s 13-točkovno pisavo stalne širine Markusa Kuhna.
Zatem si prilagodite način vnosa. Najbolj značilni so "Straight", "Unicode" in "SGML". Podrobnosti o drugih vgrajenih načinih vnosa najdete v /usr/local/share/yudit/data/.
Da bi postala sprememba privzeta ob vseh nadaljnjih zagonih programa, vnesite želene spremembe v datoteko $HOME/.yuditrc.
Splošne zmožnosti urejevalnika so omejene na urejanje, 'rezanje & lepljenje' (angl. cut & paste) ter iskanje & nadomeščanje. Možnosti razveljavitve (angl. undo) ni.
Yudit lahko prikaže besedilo z uporabo pisave truetype, oglejte si razdelek
"Pisave truetype". Dobre rezultate da tudi pisava Bitstream Cyberbit. Da bi jo
Yudit lahko našel, naredite povezavo nanjo na
/usr/local/share/yudit/data/cyberbit.ttf
.
Vim (pri različici 6.0b) dobro podpira UTF-8: ko ga poženete v UTF-8 locale, privzame kodiranje UTF-8 za konzolo in za tekstovne datoteke, ki jih urejate. Podpira znake z dvojno širino (npr. CJK) pa tudi kombiniranje znakov in se zato odlično prilega v Xterm z omogočenim UTF-8.
Namestitev: z naslova
http://www.vim.org/
si naložite izvirno kodo. Ko odpakirate vse štiri dele, popravite datoteko
src/Makefile tako, da bo vključeno tudi stikalo --with-features=big
.
Tako boste vključili značilnosti FEAT_MBYTE, FEAT_RIGHTLEFT in FEAT_LANGMAP.
Zatem poženite "make" in "make install".
Najprej si preberite razdelek o podpori mednarodnim naborom znakov (angl. "International Character Set Support") v priročniku za Emacs. Še posebej upoštevajte, da morate pognati Emacs z ukazom
, da se bo uporabila pisava s precej mednarodnimi znaki.$ emacs -fn fontset-standard
Na kratko povedano, paketa za uporabo UTF-8 v Emacsu sta dva. Pri nobenem izmed njiju vam Emacsa ni treba še enkrat prevajati.
Uporabljate lahko kateregakoli izmed njiju, lahko tudi oba skupaj. Prednosti kodiranja po "unicode-utf8" (paket emacs-utf) sta, da se naloži hitreje in da se bolje obnese pri kombiniranju znakov (to je pomembno pri tajščini). Prednost kodiranja po "utf-8" (paket Mule-UCS/oc-unicode) pa je, da lahko tudi obdeluje medpomnilnik (kot npr. M-x shell) in ne samo nalaga in shranjuje datoteke. Prav tako bolje obravnava širino znakov (pomembno pri etiopščini). Zato pa je manj zanesljivo: po obsežnem urejanju datoteke se lahko zgodi, da se po shranjevanju datoteke nekateri znaki iz Unicode nadomestijo z U+FFFD.
Da bi namestili paket emacs-utf, najprej prevedite program "utf2mule" in ga namestite v enega izmed imenikov, ki so našteti v spremenljivki PATH. Nekam namestite tudi unicode.el, muleuni-1.el in unicode-char.el. Nato v datoteko $HOME/.emacs dodajte vrstice:
Katerikoli nabor pisav lahko sprožite prek menuja Mule - Set Font/Fontset ali s kombinacijo Shift - dol - miška - 1. Trenutno so v Unicode najbolje pokrite pisave z višino 15 in 13, predvsem po zaslugi pisav 9x15 in 6x13 Markusa Kuhna. Da bo nabor pisav postal začetni nabor pisav za prvo okno ob zagonu, odkomentirajte vrstico(setq load-path (cons "/home/user/somewhere/emacs" load-path)) (if (not (string-match "XEmacs" emacs-version)) (progn (require 'unicode) ;(setq unicode-data-path "..../UnicodeData-3.0.0.txt") (if (eq window-system 'x) (progn (setq fontset12 (create-fontset-from-fontset-spec "-misc-fixed-medium-r-normal-*-12-*-*-*-*-*-fontset-standard")) (setq fontset13 (create-fontset-from-fontset-spec "-misc-fixed-medium-r-normal-*-13-*-*-*-*-*-fontset-standard")) (setq fontset14 (create-fontset-from-fontset-spec "-misc-fixed-medium-r-normal-*-14-*-*-*-*-*-fontset-standard")) (setq fontset15 (create-fontset-from-fontset-spec "-misc-fixed-medium-r-normal-*-15-*-*-*-*-*-fontset-standard")) (setq fontset16 (create-fontset-from-fontset-spec "-misc-fixed-medium-r-normal-*-16-*-*-*-*-*-fontset-standard")) (setq fontset18 (create-fontset-from-fontset-spec "-misc-fixed-medium-r-normal-*-18-*-*-*-*-*-fontset-standard")) ; (set-default-font fontset15) ))))
set-default-font
v zgornjih nastavitvah
Emacsa.
Za namestitev paketa oc-unicode vnesite ukaz
in namestite nekam tako nastale datoteke$ emacs -batch -l oc-comp.el
un-define.elc
pa tudi
oc-unicode.el
, oc-charsets.el
in oc-tools.el
.
Nato v datoteko $HOME/.emacs dodajte vrstice:
Ustrezen nabor pisav si nastavite enako kot pri paketu emacs-utf.(setq load-path (cons "/home/user/somewhere/emacs" load-path)) (if (not (string-match "XEmacs" emacs-version)) (progn (require 'oc-unicode) ;(setq unicode-data-path "..../UnicodeData-3.0.0.txt") (if (eq window-system 'x) (progn (setq fontset12 (oc-create-fontset "-misc-fixed-medium-r-normal-*-12-*-*-*-*-*-fontset-standard" "-misc-fixed-medium-r-normal-ja-12-*-iso10646-*")) (setq fontset13 (oc-create-fontset "-misc-fixed-medium-r-normal-*-13-*-*-*-*-*-fontset-standard" "-misc-fixed-medium-r-normal-ja-13-*-iso10646-*")) (setq fontset14 (oc-create-fontset "-misc-fixed-medium-r-normal-*-14-*-*-*-*-*-fontset-standard" "-misc-fixed-medium-r-normal-ja-14-*-iso10646-*")) (setq fontset15 (oc-create-fontset "-misc-fixed-medium-r-normal-*-15-*-*-*-*-*-fontset-standard" "-misc-fixed-medium-r-normal-ja-15-*-iso10646-*")) (setq fontset16 (oc-create-fontset "-misc-fixed-medium-r-normal-*-16-*-*-*-*-*-fontset-standard" "-misc-fixed-medium-r-normal-ja-16-*-iso10646-*")) (setq fontset18 (oc-create-fontset "-misc-fixed-medium-r-normal-*-18-*-*-*-*-*-fontset-standard" "-misc-fixed-medium-r-normal-ja-18-*-iso10646-*")) ; (set-default-font fontset15) ))))
Da boste lahko naložili datoteko, kodirano v UTF-8, vtipkajte
aliM-x universal-coding-system-argument unicode-utf8 RET M-x find-file datoteka RET
(oz. utf-8 namesto unicode-utf8, če imate rajši oc-unicode/Mule-UCS).C-x RET c unicode-utf8 RET C-x C-f datoteka RET
Lupinsko okno z vhodom in izhodom v UTF-8 odprete, če vtipkate:
(To deluje samo z oc-unicode/Mule-UCS.)M-x universal-coding-system-argument utf-8 RET M-x shell RET
Upoštevajte, da vse to deluje samo z Emacsom v okenskem načinu, ne pa tudi v terminalskem.
Richard Stallman načrtuje, da bo dolgoročno dodal v Emacs integrirano podporo UTF-8. Podobno načrtuje tudi skupina razvijalcev XEmacsa.
(Ta razdelek je napisal Gilbert Baumann.)
XEmacs (različica 20.4 nastavljena z MULE) si lahko prilagodite na UTF-8 takole. Žal boste potrebovali izvirno kodo, da boste lahko vnesli popravke.
Najprej potrebujete naslednji datoteki, ki ju je prispeval Tomohiko Morioka:
http://turnbull.sk.tsukuba.ac.jp/Tools/XEmacs/xemacs-21.0-b55-emc-b55-ucs.diff in http://turnbull.sk.tsukuba.ac.jp/Tools/XEmacs/xemacs-ucs-conv-0.1.tar.gz.
Končnica .diff se nanaša na izvirnik v jeziku C. V paketih tar je koda v elispu, ki omogoča precej kodnih tabel za prenose v Unicode in iz njega. Kot je razvidno iz imena datoteke .diff, se nanaša na XEmacs-21. Treba je bilo nekaj 'popravkov'. Najopaznejša razlika v izvirniku za XEmacs 20.4 je, da se je file-coding.[ch] preimenoval v mule-coding.[ch].
Nekaj hitrih napotkov za vse, ki se podobno kakor avtor ne spoznajo preveč na XEmacs-MULE:
To, kar se imenuje kodiranje (angl. encoding), se v MULE imenuje 'coding-system'. Najpomembnejša ukaza sta:
M-x set-file-coding-system M-x set-buffer-process-coding-system [comint buffers]
in spremenljivka `file-coding-system-alist', ki ukazu `find-file' pomaga uganiti uporabljeni način kodiranja. Ko zadevo poženete, morate najprej storiti tole.
Ta koda preveri posebno vrstico z načinom, ki se začne z -*- nekje med prvimi 600 zlogi datoteke, ki jo nameravate odpreti. Če se tam prikaže polje "Encoding: xyz;" in kodiranje 'xyz' obstaja, ga izberite. Zdaj lahko npr. storite
;;; -*- Mode: Lisp; Syntax: Common-Lisp; Package: CLEX; Encoding: utf-8; -*-
in XEmacs se preklopi v način utf.
Ko ste vse pognali, lahko definirate \u03BB (grška lambda) kot makro:
(defmacro \u03BB (x) `(lambda .,x))
Če imate XFree86-4.0.1, lahko z Xeditom urejate datoteke, kodirane po UTF-8, če ste ustrezno nastavili locale (glejte zgoraj) in dodali vrstico "Xedit*international: true" v datoteko $HOME/.Xdefaults.
V različici 6.1.2 Axe podpira samo 8-bitne locale. Če v $HOME/.Xdefaults dodaste vrstico "Axe*international: true", se bo preprosto 'sesul'.
Mined98 ( http://www.inf.fu-berlin.de/~wolff/mined.html) je preprost urejevalnik avtorjev Michiela Huisjesa, Achima Müllerja in Thomasa Wolffa. V xtermu, ki podpira UTF-8 ali druga 8-bitna kodiranja, vam omogoča urejanje datotek, ki so kodirane po UTF-8 ali drugem 8-bitnem standardu. Zelo dobro tudi omogoča vnašanje znakov iz nabora Unicode.
Mined vam omogoča urejanje 8-bitno kodiranih in po UTF-8 kodiranih datotek.
Privzeto uporabi hevristično samozaznavo. Če se nočete zanašati na hevristiko,
v ukazni vrstici podajte stikalo -u
, kadar urejate datoteko po UTF-8,
ali +u
, kadar urejate 8-bitno kodirano datoteko. To lahko kadarkoli
spremenite znotraj urejevalnika. V vrstici z menujem se prikaže kodiranje z
"L:h" za 8-bitna kodiranja in "U:h" za UTF-8. Kliknite prvega izmed teh
znakov, če želite to spremeniti.
Mined pozna znake z dvojno širino ter kombinirane znake in jih tudi pravilno prikaže.
Ima tudi lepo organizirane padajoče menuje, zato pa tipke, kot so Home, End ali Delete, ne delujejo.
MIME: RFC 2279 definira UTF-8 kot nabor znakov MIME, ki se lahko prenaša pod 8-bitnimi kodiranji ter kodiranjema 'quoted-printable' in base64. Za starejši predlog MIME UTF-7 (RFC 2152) velja, da je v zatonu, zato naj se ga ne bi več uporabljalo.
Poštni odjemalci, ki so izšli po 1. januarju 1999, bi morali znati pošiljati in prikazovati po UTF-8 kodirana sporočila, sicer se upoštevajo kot neustrezni. Toda ta sporočila morajo nositi oznako MIME
Enostavno pošiljanje datoteke, kodirane po UTF-8, po cevi v "mail" brez popravka oznak MIME ne bo uspešno.Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit
Programerji odjemalcev za elektronsko pošto bi si morali ogledati strani http://www.imc.org/imc-intl/ in http://www.imc.org/mail-i18n.html.
Zdaj pa k posameznim poštnim odjemalcem (oz. "agentom za uporabo el. pošte"):
Stanje za nepopravljeni Pine različice 4.10 je naslednje.
Pine ne pretvarja naborov znakov. Omogoča pa vam, da si ogledate po UTF-8 kodirana sporočila v tekstovnem oknu, ki ima nastavljen UTF-8 (konzola za Linux ali xterm).
Ponavadi vas bo Pine opozoril na drug nabor znakov vsakič, ko gledate sporočilo, kodirano po UTF-8. Teh opozoril se znebite, če izberete S (setup), zatem C (config), nato pa "character-set" nastavite na UTF-8. Tako ne boste storili nič posebnega, le opozoril ne bo več, saj v Pine ni vgrajenega nobenega znanja o UTF-8.
Upoštevajte tudi, da je pri Pinu koncept znakov iz Unicode precej omejen. Prikazal bo znake v latinici in grške znake, preostalih znakov pa ne.
Popravek Roberta Bradyja (el. pošta: rwb197@ecs.soton.ac.uk, nahajališče popravka: http://www.ents.susu.soton.ac.uk/~robert/pine-utf8-0.1.diff) doda Pinu podporo UTF-8. S tem popravkom se zaglavja in telesa dekodirajo in prikažejo pravilno. Popravek je odvisen od knjižnice libunicode ( http://cvs.gnome.org/lxr/source/libunicode/) za GNOME.
Kljub vsemu poravnava ne deluje povsod pravilno, pri odgovarjanju se nabor znakov ne pretvori ustrezno, urejevalnik Pico pa sploh ne zna delati z večzložnimi znaki.
Kmail (različica, ki se distribuira s KDE 1.0) sploh ne podpira UTF-8.
Messenger (del Netscape Communicatorja) zna pošiljati in prikazati sporočila, ki so kodirana po UTF-8, vendar je treba tudi nekaj malega ročnega posredovanja.
Pošiljanje sporočil, kodiranih po UTF-8: ko odprete okno za sestavljanje sporočila (Compose), morate, še preden začnete pisati sporočilo, z menuja izbrati "View -> Character Set -> Unicode (UTF-8)". Potem lahko napišete sporočilo in ga odpošljete.
Ko prejmete tako kodirano sporočilo, ga Netscape žal ne bo takoj prikazal v pravem naboru znakov, niti vam ne bo tega vidno nakazal. Z menuja morate ročno izbrati "View -> Character Set -> Unicode (UTF-8)". Nato izberite kategorijo pisav Unicode.
Mutt-1.0, ki ga dobite na naslovu http://www.mutt.org/, ima zelo omejeno podporo UTF-8. Za polno podporo je Edmund Grimley Evans naredil popravke, ki jih dobite na naslovu http://www.rano.demon.co.uk/mutt.html.
Exmh 2.1.2 s Tk 8.4a1 prepozna in pravilno prikaže sporočila, kodirana
po UTF-8 (vendar brez znakov CJK), če v datoteko $HOME/.Xdefaults
dodaste naslednje vrstice:
! ! Exmh ! exmh.mimeUCharsets: utf-8 exmh.mime_utf-8_registry: iso10646 exmh.mime_utf-8_encoding: 1 exmh.mime_utf-8_plain_families: fixed exmh.mime_utf-8_fixed_families: fixed exmh.mime_utf-8_proportional_families: fixed exmh.mime_utf-8_title_families: fixed
Groff 1.16, izvedba GNU tradicionalnega sistema troff/nroff za obdelavo besedil
v Unixih, lahko na izhodu doda oblikovano besedilo z znaki po UTF-8. Namesto
'groff -Tlatin1
' ali 'groff -Tascii
' enostavno vtipkajte
'groff -Tutf8
'.
Distribucije TeTeX 0.9 in novejše imajo prilagoditev Texa za Unicode, ki se imenuje Omega ( http://www.gutenberg.eu.org/omega/, ftp://ftp.ens.fr/pub/tex/yannis/omega). Skupaj z datoteko unicode.tex, ki je v utf8-tex-0.1.tar.gz, vam omogoča, da kot vhod v TeX vnesete izvirnike, kodirane po UTF-8. Trenutno je podprtih na tisoče znakov iz Unicode.
Spremeni se le to, da poženete `omega' (namesto `tex') ali `lambda' (namesto `latex') in v glavo vašega izvirnika vrinete naslednje vrstice:
\ocp\TexUTF=inutf8 \InputTranslation currentfile \TexUTF
\input unicode
Verjetno sta tej tematiki posvečeni tudi naslednji povezavi: http://www.dante.de/projekte/nts/NTS-FAQ.html in ftp://ftp.dante.de/pub/tex/language/chinese/CJK/.
PostgreSQL 6.4 ali novejši zgradite z naslednjo možnostjo nastavitve:
--with-mb=UNICODE
.
S programom Less, ki se ga dobi na naslovu http://www.flash.net/~marknu/less/less-358.tar.gz, lahko brskate po tekstovnih datotekah, ki so kodirane po UTF-8, če konzola ali xterm podpirata tako kodiranje. Preverite, da spremenljivka okolja LESSCHARSET ni nastavljena (ali da je nastavljena na utf-8). Če je nastavljena tudi spremenljivka LESSKEY, preverite, ali datoteka, na katero kaže, ne definira spremenljivke LESSCHARSET. Če je treba, naredite to datoteko še enkrat z ukazom `lesskey' ali pa spremenljivko LESSKEY "prekličite".
Lv-4.21 ( http://www.mt.cs.keio.ac.jp/person/narita/lv/) avtorja Tomia Narite je pregledovalnik datotek z vgrajenim pretvornikom naborov znakov. Če želite v konzoli, podprti z UTF-8, pregledati datoteke, kodirane po UTF-8, vtipkajte "lv -Au8". Lahko pa ga uporabite tudi za pregledovanje po drugih kodiranjih CJK kodiranih datotek v konzoli s podporo UTF-8.
Program ima tudi drobno napakico: kazalec (kurzor) v xtermu izgine in se po koncu ne pokaže znova.
Priskrbite si GNU textutils-2.0 in uporabite popravek textutils-2.0.diff, nato si prilagodite nastavitve in v config.h dodajte vrstice "#define HAVE_MBRTOWC 1", "#define HAVE_FGETWC 1" in "#define HAVE_FPUTWC 1". V datoteki src/Makefile popravite CFLAGS in LDFLAGS tako, da zajemata tudi imenike, v katerih je nameščen libutf8. Zatem prevedite vse skupaj.
Priskrbite si paket util-linux-2.9y, ga nastavite in zatem v datoteki defines.h definirajte ENABLE_WIDECHAR. V datoteki lib/widechar.h "#if 0" popravite v "if 1". V datoteki text-utils/Makefile popravite CFLAGS in LDFLAGS tako, da zajemata imenike, v katerih je nameščen libutf8. Prevedite vse skupaj.
Figlet 2.2 ima stikalo za vnos po UTF-8: "figlet -C utf8"
Seznam ukazov in pripomočkov Li18nux, ki bi moral biti povezljiv z UTF-8, je še vedno nepopoln in potrebuje še precej koristnih informacij. Avtorju jih še ni uspelo zbrati :-).
Pri glibc-2.2 bodo delovali le regularni izrazi z 8-bitnimi znaki. Pri locale za UTF-8 regularni izrazi, ki obsegajo ne-ASCII znake ali v katerih naj bi primerjali posamezne večzložne znake s ".", ne bodo delovali. Posledice tega se bodo poznale v vseh ukazih in pripomočkih, ki so našteti spodaj.
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Pri at-3.1.8 sta dve uporabi isalnum v at.c neveljavni in ju je treba nadomestiti z uporabo quotearg.c ali s seznamom za izključevanje seznamov metaznakov iz lupine. Dve uporabi %8s v at.c in atd.c sta neveljavni in ju je treba popraviti na poljubno dolžino.
Kot pri sh-utils-2.0i: vse je v redu.
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Kot pri fileutils-4.0u: vse v redu
Kot pri fileutils-4.0u: vse v redu
Kot pri fileutils-4.0u: vse v redu
Kot pri sh-utils-2.0i: vse v redu
Kot pri textutils-2.0e: vse vredu
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Kot pri fileutils-4.0u: vse v redu
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Kot pri sh-utils-2.0i: vse v redu
Kot pri fileutils-4.0u: stikali conv=lcase in conv=ucase ne delujeta pravilno
Na voljo ni še nobenih informacij
Kot pri fileutils-4.0u: vse v redu
Kot pri diffutils-2.7 (1994): diff se ne zaveda nastavitev locale, način --side-by-side zato ne izračuna pravilno širine stolpca, to velja celo za locale, ki temeljijo na ISO-8859-1
Na voljo ni še nobenih informacij
Kot pri sh-utils-2.0i: vse v redu
Na voljo ni še nobenih informacij
Kot pri fileutils-4.0u: vse v redu
Kot pri sh-utils-2.0i: vse v redu
Kot pri sh-utils-2.0i: vse v redu
Na voljo ni še nobenih informacij
Kot pri sh-utils-2.0i: operatorji "match", "substr", "index" in "length" ne delujejo pravilno
Kot pri sh-utils-2.0i: vse v redu
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Kot pri findutils-4.1.5: stikalo "-ok" še ne pozna mednarodnih nastavitev, popravek je že bil posredovan vzdrževalcu. Stikalo "-iregex" ne deluje pravilno, potreben je popravek v funkciji find/parser.c:insert_regex
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Gzip je zmožen uporabljati UTF-8, vendar uporablja le angleška sporočila v naboru ASCII. Pri pravilni prilagoditvi bi bilo treba: uporabiti gettext, klicati setlocale. V funkciji check_ofname (datoteka gzip.c) namesto spraševanja vrste da/ne uporabite funkcijo rpmatch. Uporaba funkcije strlen v gzip.c:852 je napačna, treba je uporabiti funkcijo mbswidth.
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Kot pri sh-utils-2.0i: vse v redu
Kot pri sh-utils-2.0i: vse v redu
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo še ni popolnih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Kot pri fileutils-4.0u: vse v redu
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Kot pri sh-utils-2.0i: vse v redu
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Kot pri fileutils-4.oy: vse v redu
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Kot pri fileutils-4.0u: vse v redu
Kot pri fileutils-4.0u: vse v redu
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Kot pri fileutils-4.0u: vse v redu
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Kot pri sh-utils-2.0i: vse v redu
Na voljo ni še nobenih informacij
Kot pri sh-utils-2.0i: vse v redu
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Kot pri sh-utils-2.0i: vse v redu
Na voljo ni še nobenih informacij
Kot pri sh-utils-2.0i: vse v redu
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Kot pri sh-utils-2.0i: vse v redu
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Kot pri fileutils-4.0u: vse v redu
Kot pri fileutils-4.0u: vse v redu
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Kot pri sh-utils-2.0i: vse v redu
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Kot pri sh-utils-2.o1: niza "<undef>" se ne bi smelo prevajati, potreben je popravek v funkciji stty.c:visible.
Na voljo ni še nobenih informacij
Kot pri textutils-2.0e: vse v redu
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Kot pri tar-1.13.17: v redu, če sta imeni uporabnika in skupine vedno zapisani v ASCII
Na voljo ni še nobenih informacij
Kot pri Sh-utils-2.0i: vse v redu
Na voljo ni še nobenih informacij
Kot pri sh-utils-2.0i: vse v redu
Na voljo ni še nobenih informacij
Kot pri fileutils-4.0u: vse v redu
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Kot pri Sh-utils-2.0i: vse v redu
Na voljo ni še nobenih informacij
Kot pri sh-utils-2.0i: vse v redu
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Kot pri sh-utils-2.0i: vse v redu
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Kot pri textutils-2.oe: wc ne more prešteti znakov, popravek je že posredovan vzdrževalcu
Kot pri sh-utils-2.0i: vse v redu
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Kot pri findutils-4.1.5: program uporabi strstr, popravek je že posredovan vzdrževalcu
Na voljo ni še nobenih informacij
Na voljo ni še nobenih informacij
Owen Taylor trenutno razvija knjižnico pango za prikaz večjezičnih besedil. Več o tem na http://www.labs.redhat.com/~otaylor/pango/ in http://www.pango.org/.