|
|||||||||||||||||||||||||||
On Sat, Jul 02, 2005 at 06:15:58PM +0200, Ole Laursen wrote: > Keld Jørn Simonsen <sslug@sslug> writes: > > >> Alla nya språk av Wikipedia använder UTF-8 och de äldre håller på > >> att konverteras till UTF-8. Programspråket Java, som lanserades > >> 1995, har använt UTF-8 som default från starten. > > > > Nej, det er ikke rigtigt. Java anvender ucs2- en 16-bits størrelse for > > tegn. Jeg tror altså at det stadig er 16-bits. Andre nyere > > sprog bruger 32-bits char. Nogen bruger utf-16, som er en > > variabel-længde kodning i 16 bit (gys). > > Der er forskel på hvad Java-sproget stiller til rådighed og hvad den > virtuelle maskine benytter. Sproget benytter 16 bit-tegn, men den > virtuelle maskine gemmer strengkonstanter i UTF-8 så vidt jeg husker. > Se her under afsnit "5.4 String Resolution": > > http://www.cs.arizona.edu/~collberg/Research/Java-VMSpec/ConstantPool.doc.html Hmm, så vidt jeg kan se er det kun navnene på variablene som er i utf-8, og de kan jo vistnok være url-er, so det er meget praktisk. Det er ikke strengene selv, strenge der skal behandles, men variabelnavne (tror jeg nok). Hilsen keld
|
||||||||||||||
|
||||||||||||||