SkÃ¥ne Sjælland Linux User Group - http://www.sslug.dk Forside   Tilmelding   Postarkiv   Forum   Kalender   Søg
MhonArc Dato: [Date Prev] [Kronologisk oversigt] [Date Next]   TrÃ¥d: [Date Prev] [Oversigt trÃ¥de] [Date Next]   MhonArc
 

En frustrerende opdatering



Dette er ikke en historie for hverken travle eller sarte sjæle, nu er du
advaret.

Det hele startede med, at jeg skulle vise en (admin-)bruger, hvordan man
kan skifte en brugers password. Det første forsøg med at skrive:
passwd navn
mislykkedes, det var for svært.
Så kom Yast2 på banen. Den giver jo en fin grafisk adgang til at løse
netop den opgave.

Nu er der bare det ved Yast2 fra Suse 8.2, at den kun gemmer de brugere,
der vises. Jeg havde sat den til kun at vise almindelige brugere, med
det resultat, at alle systembrugere - herunder root selv - forsvandt.
Uden en root bruger er man fortabt, så der skule bootes op med en repair
for at få en sikkerhedskopi af /etc/passwd ind.

Serveren har fået en disk ind (/dev/hdc), som forhindrer boot fra
CDRommen (/dev/hdd). Ud med disken, og omkonfigurering af CDROmmen, en
skruetrækker er da til at have med at gøre trods alt.

På det tidspunkt besluttede jeg, at det var på tide at få opgraderet til
en nyere udgave af SuSE. Risikoen for en gentagelse var ganske enkelt
for stor. Jeg har i nogen tid kørt 10.1 på min egen server og desktop,
og bortset fra, at Yast2 i den udgave er et fjols til at finde ud af
pakkerne, så kører den fint.

Efter (deres) fyraften startede jeg på projektet - indledte med at tage
en backup af det meste (det, der befandt sig på hda, hdc var ikke i fare
i denne forbindelse, da den var pillet ud).

Ind med opgraderingen, alt gik fint, bortset fra den detalje, at
maskinen ikke kunne boote efter endt opdatering.

Det viste sig, at det var fsck, der fik alt til at hænge, /etc/fstab
havde både swap og data på /dev/hdc, og den var jo lige midlertidigt
blevet til en CDRom, hvilket ikke afskrækkede fsck fra at kaste sig ud i
at kontrollere den.

En rescue-boot med rettelse af /etc/fstab løste problemet.

Efter en tilbagebygning, hvor den dumme disk kom på plads, blev der så
startet op. I store træk så alt fornuftigt ud, der var lidt forældet
snavs i /etc/smb.conf, postfix ville hverken sende eller hente post,
cyrus-imap ville jeg have udskiftet med dovecot (for at slippe for at
skulle administrere mail-brugere parallelt). Postfix havde jeg også haft
kvaler med herhjemme, så den blev skiftet ud med Exim, som alt andet
lige er en del lettere at konfigurere for mig, og som kører ud af boksen
- troede jeg da.

Exim kan godt håndtere pseudo-brugere fra /etc/aliases. Jeg har opbygget
et system, så mail til foreningen og bestyrelsen bliver omdirigeret til
en bestemt sekretær, alle brugere har en mailkonto på et alias, som også
får lagt en kopi til sekretæren, og en bruger.privat, som går uden om
samme. Problemet er bare, at jeg ikke sådan umiddelbart kunne få Exim
til at levere den mail. Først da jeg langt om længe fandt på at lægge
den fulde mail-adresse ind i /etc/aliases lykkedes det. Man kan sikkert
konfigurere Exim til automatisk at sætte domænenavnet på brugere uden et
sådant, men det faldt ikke lige i øjnene.

Da Exim nu var kommet på plads, kom turen til flytningen af den
eksisterende mail. Alle dir skulle kopieres, ejerskabet ændres til
dovecot, og så skuller der "." foran dir-navnene, for at de kunne
optræde korrekt. Til gengæld skulle så al mail også flyttes til et endnu
ikke eksisterende sub-dir, og i Squirrelmail, som jo også var blevet
opgraderet, skulle de forskellige mail-dir aktiveres. En script-ørn
kunne sikkert have lavet det på nogle få minutter, mig tog det en del
længere tid.

Det helt sjove problem opstod, da jeg skulle kontrollere, at samba kørte.
Det virkede fint, jeg rebootede serveren, og pludselig var der en
marsian bruger, der bankede på fra CA. Den slags burde firewallen have
stoppet længe inden den nåede ind, men det gjorde den ikke.
Problemet var, at opdateringen havde byttet rundt på netkortene, så det
der før var eth1 (ud mod verden) nu var blevet til eth0, mens det altså
stadig sad fast i væggen, og firewallen lukkede op for hvad som helst.

Serveren var sat op med tre netkort, eth0 til kontoret (192.168.0.1),
eth1 (offentligt IP) og det tredje til skolen (192.168.2.1). Formålet
med den opdeling er, at sikre kontoret mod kreative elever, og indtil nu
har det vist sig holdbart.

Efter en ny reboot var den gal igen. Nu var kontoret blevet til verden,
og verden til skolen. Der gik en del tid med at finde ud af, at SuSE
rafler om hvad netkortene skal hedde og lave efter en boot. Jeg fatter
ikke hvorfor man ikke som før kan kalde sine konfigurationer i
/etc/sysconfig/network for ifcfg-eth0, ifcfg-eth1 og ifcfg-eth2, og så
få dem sat i gang i den rækkefølge og med det samme kort, hvis
MAC-adresse står i konfigurationsfilen, men det kan man altså ikke -
eller mere korrekt, det kan man godt, men så opretter SuSE i tilfældig
orden tre nye konfigurationer, hvor MAC adressen er en del af filnavnet,
mens kortets synlige navn (eth0, eth1 og eth2) er skjult for alverden.
Resultatet er, at man har mindst seks kort kørende i tilfældig orden
efter hver boot.

Fejlen er opstået under opdateringen, hvor SuSE har forsøgt at omdanne
de eksisterende korts konfiguration til den nye navngivning. Det skriver
de højr og tydelige i en fil i /etc/sysconfig/hardware, et sted enhver
jo som det første opdager, at der står noget nyt i efter en opdatering.

Alle netkort blev slettet, og Yast fik lov til at forsøge sig igen. Nu
faldt der lidt ro over serveren - den rebootede indtil flere gange med
samme netkort på samme navn og IP-Nummer, men nu var fyraften forbi, og
I kan sikkert forestille jer, hvor effektivt man arbejder sådan en
morgen, hvor brugerne begynder at flokkes med problemer, man endnu ikke
har fået løst, og som alle har med stort set det samme at gøre. Faktisk
var det først henad kl. 10, at jeg fandt ud af at få styr på netkortene.

En anden ting, som SuSE i sin visdom har besluttet for mig, er, at den
velfungerende LPRNG skulle erstattes med CUPS, som jeg endnu aldrig har
fået til at køre på den server (den vil på min egen, men altså ikke
derinde, måske på grund af forvirrende mange netkort). Selv om LPRNG
stadig er med i distributionen, blev den ikke opgraderet, men erstattet
med noget hø, der ikke virker, og hvor jeg i bedste fald skulle til at
installere alle printere forfra. Jeg forsøgte, men endte med at finde
LPRNG frem igen, og få printerne til at køre. Det kostede jo så også en
tur rundt i /etc/smb.conf, så den igen kunne komme til at snakke med
LPRNG og ikke (som SuSE havde ændret det til) CUPS. Imens havde flere
brugere venligt fortalt mig, at deres printer ikke længere virkede.

Der er Win98 maskiner på nettet, og de har forskellige drev mappet op
mod serveren, afhængigt af hvem der bruger maskinen. Det er et meget
statisk miljø, og mapningen går helt tilbage til tiden med en Novell
3.10 server. Mapningen er altså lokal, og ikke styret på serveren, og
starter man Win98 mens der er problemer med Samba, kommer den op og
fortæller, at der ikke er adgang til det pågældende drev, samtidigt med
at der spørges om den skal forsøge igen ved næste boot. Tro mig, det er
ikke alle brugere, der svarer ja til det spørgsmål.

Jeg endte med at få det til at halte afsted, og tog hjem. En arbejdsdag
på 27 timer er grænsen for mig, herefter bliver det alligevel bare mere
kaos, og man kan altså ikke reparere på en server, mens der er brugere
omkring en.

Fredag tog jeg så derind igen (efter deres fyraften). Frisk i hovedet,
med styr på netkortene og en udskrift af en udemærket vejledning (fra et
link i Friheden), lykkedes det mig at få tingene til at fungere. Ikke
alene fungere, der er nu kommet domænelogin for nogle nye XP-maskiner,
jeg har styr på en individuel mapningen af drev via netlogon, printerne
skriver muntert ud, squirrelmail sender og modtager post, og alt vil
igen køre som hidtil (eller bedre) fra på mandag.

Jeg er godt klar over, at det er min fejl, at jeg ikke havde tre netkort
i min egen server. Havde jeg haft det, ville jeg sikkert have opdaget
SuSEs hang til at rafle om kortene under boot - men altså, nok er min
kone en vild kvinde, men ligefrem at sætte hende på sit eget lokalnet,
det er da at stramme den.

Jeg har også hele tiden vidst, at midt på ugen ikke er det ideelle
tidspunkt for en opgradering af en server, der er i brug. Havde Yast
ikke aflivet alle systembrugere, havde jeg (som planlagt) ventet til en
weekend i ferietiden.

Det jeg ikke helt kan blive enig med mig selv om er, om jeg skal være
sur på det fjols, som opfandt en ny navngivning af
konfigurationsfilerne, eller ham, der aldrig havde efterprøvet
opdateringen på en maskine med tre kort. For en sikkerheds skyld er jeg
sur på dem begge. Og mig selv? Næ, mig er jeg bare ret træt af lige nu.

En ting er dog helt sikker. Skal du nogen sinde opgradere en SuSE
server, så atart med at slette konfigurationsfilerne til netkortene, og
opret dem igen med Yast. Sørg også for at slette hvad der måtte stå i
/etc/sysconfig/hardware om netkort - det er alligevel formodentligt
noget sludder.

PS.
Hvis den lange historie har trættet dig, er det fordi du ikke holdt op
med at læse i tide. Har den ikke, kan du måske lære lidt af mine fejl,
så du let kan løse den slags problemer, hvis du møder dem.

PPS.
Får du lyst til at kommentere (ikke håne og sparke, jeg ligger allerede
ned), så husk at klippe i teksten.


 
Forside   Tilmelding   Postarkiv   Oversigt   Kalender   Søg

 
 
Henvendelse vedrørende websiderne til <www_admin>. Senest ændret 2006-07-01, klokken 02:03
Denne side vedligeholdes af MHonArc .