SkÃ¥ne Sjælland Linux User Group - http://www.sslug.dk Forside   Tilmelding   Postarkiv   Forum   Kalender   Søg
MhonArc Dato: [Date Prev] [Kronologisk oversigt] [Date Next]   TrÃ¥d: [Date Prev] [Oversigt trÃ¥de] [Date Next]   MhonArc
 

Re: [LOCALE] UTF-8 er noget værre slam



Keld Jørn Simonsen <sslug@sslug> writes:

>> Alla nya språk av Wikipedia använder UTF-8 och de äldre håller på 
>> att konverteras till UTF-8.  Programspråket Java, som lanserades 
>> 1995, har använt UTF-8 som default från starten.
>
> Nej, det er ikke rigtigt. Java anvender ucs2- en 16-bits størrelse for
> tegn. Jeg tror altså at det stadig er 16-bits. Andre nyere 
> sprog bruger 32-bits char. Nogen bruger utf-16, som er en
> variabel-længde kodning i 16 bit (gys).

Der er forskel på hvad Java-sproget stiller til rådighed og hvad den
virtuelle maskine benytter. Sproget benytter 16 bit-tegn, men den
virtuelle maskine gemmer strengkonstanter i UTF-8 så vidt jeg husker.
Se her under afsnit "5.4 String Resolution":

  http://www.cs.arizona.edu/~collberg/Research/Java-VMSpec/ConstantPool.doc.html

-- 
Ole Laursen
http://www.cs.aau.dk/~olau/


 
Forside   Tilmelding   Postarkiv   Oversigt   Kalender   Søg

 
 
Henvendelse vedrørende websiderne til <www_admin>. Senest ændret 2005-08-10, klokken 20:55
Denne side vedligeholdes af MHonArc .