SkÃ¥ne Sjælland Linux User Group - http://www.sslug.dk Forside   Tilmelding   Postarkiv   Forum   Kalender   Søg
MhonArc Dato: [Date Prev] [Kronologisk oversigt] [Date Next]   TrÃ¥d: [Date Prev] [Oversigt trÃ¥de] [Date Next]   MhonArc
 

Re: [LOCALE] UTF-8 er noget værreslam



Keld Jørn Simonsen wrote:
> Hvordan så med behandling af strenge, hvor der indgår strengkonstanter?
> fx noget ala strcmp(str,"rødgrød")

Funktionen strcmp() beror enligt POSIX av locale, d.v.s. att 
strcmp("ost", "öl") ger olika resultat enligt svensk och tysk 
kollationsordning.  Sedan beror resultatet av vilket charset din 
source code är skriven i och hur din kompilator hanterar detta och 
hur detta förhåller sig till vald locale.

Världen är idag mycket mer komplicerad än på 1970-talet när C och 
Unix skapades, och striden stod mellan ASCII och EBCDIC.  En 
förenkling, som bland annat Wikipedia tillämpar, är att överallt 
köra Unicode ("legacy free") och helt undvika blandningar med de 
historiska ASCII och ISO 8859.  Idag verkar det som om den 
vanligaste externa representationen av Unicode är UTF-8.


-- 
  Lars Aronsson (sslug@sslug)
  Aronsson Datateknik - http://aronsson.se


 
Forside   Tilmelding   Postarkiv   Oversigt   Kalender   Søg

 
 
Henvendelse vedrørende websiderne til <www_admin>. Senest ændret 2005-08-10, klokken 20:55
Denne side vedligeholdes af MHonArc .