SkÃ¥ne Sjælland Linux User Group - http://www.sslug.dk Forside   Tilmelding   Postarkiv   Forum   Kalender   Søg
MhonArc Dato: [Date Prev] [Kronologisk oversigt] [Date Next]   TrÃ¥d: [Date Prev] [Oversigt trÃ¥de] [Date Next]   MhonArc
 

Re: [LOCALE] UTF-8 er noget værre slam



On Sat, Jul 02, 2005 at 06:15:58PM +0200, Ole Laursen wrote:
> Keld Jørn Simonsen <sslug@sslug> writes:
> 
> >> Alla nya språk av Wikipedia använder UTF-8 och de äldre håller på 
> >> att konverteras till UTF-8.  Programspråket Java, som lanserades 
> >> 1995, har använt UTF-8 som default från starten.
> >
> > Nej, det er ikke rigtigt. Java anvender ucs2- en 16-bits størrelse for
> > tegn. Jeg tror altså at det stadig er 16-bits. Andre nyere 
> > sprog bruger 32-bits char. Nogen bruger utf-16, som er en
> > variabel-længde kodning i 16 bit (gys).
> 
> Der er forskel på hvad Java-sproget stiller til rådighed og hvad den
> virtuelle maskine benytter. Sproget benytter 16 bit-tegn, men den
> virtuelle maskine gemmer strengkonstanter i UTF-8 så vidt jeg husker.
> Se her under afsnit "5.4 String Resolution":
> 
>   http://www.cs.arizona.edu/~collberg/Research/Java-VMSpec/ConstantPool.doc.html

Hmm, så vidt jeg kan se er det kun navnene på variablene som er i utf-8,
og de kan jo vistnok være url-er, so det er meget praktisk. Det er ikke
strengene selv, strenge der skal behandles, men variabelnavne (tror jeg
nok).

Hilsen
keld


 
Forside   Tilmelding   Postarkiv   Oversigt   Kalender   Søg

 
 
Henvendelse vedrørende websiderne til <www_admin>. Senest ændret 2005-08-10, klokken 20:55
Denne side vedligeholdes af MHonArc .