Ja, jeg sier faktisk endelig, fordi nå har jeg fått en smart feil på en av diskene. Ikke den mest hyggelige, det var en “Offline_Uncorrectable” sector feil, men likevel, nå har jeg endelig klart å finne ut hvorfor RAIDet henger seg hele tiden. Sånn er det med IDE disker, ikke til å stole på.
Når jeg endelig får migrert over på den nye serveren vil ikke dette være et problem da den har SCSI disker, men nå tror jeg i alle fall at ikke maskinen vil henge mer fordi når sectoren er merket død vil den ikke bli brukt mer. Skulle vi få flere sector feil på den disken så bytter vi den. Jeg tror i alle fall at problemet nå er løst! (krysse fingrene!)
Jeg oppgraderte kernelen i forbindelse med firewall skiftet og det virker som om det kanskje ble heng i natt pga. denne igjen, slik som sist. Kommer til å teste igjen i kveld for å se om det fungerer og om mulig å finne ut hva som er feilen. Det viste ingen kernel panic i dag så det var litt vanskelig å finne ut hva som var feil.
Uansett prøver jeg å kjøre denne kernelen en natt til så da er det vel overveiende fare for heng igjen i natt, så er dere advart!
Vi hadde litt nedetid i morges i forbindelse med utbytting av firewall. Nedetiden ble litt lenger en beregnet grunnet problemer med en router hos linjeleverandøren.
På grunn av en feil i Ejabberd 1.1.0 som gjorde an anonymous TLS alltid sto på selv om det ble slått av i config har vi oppgradert til Ejabberd 1.1.1. Denne feilen var ikke kjempe farlig men det er greit å komme over på den versjonen som fungerer som den skal.
Se mer informasjon her: ejabberd 1.1.1: bugfix release
Endelig gikk det som det skulle og vi fikk oppgradert. Takk til god hjelp fra Alexey Shchepin som klarte å tyde loggfilene, han er forøvrig også hovedutvikleren til Ejabberd.
Til informasjon var oppgraderingsproblemet vårt relatert til at vi har hatt et to node cluster hvor den ene noden har blitt tatt bort men ikke slettet i databasen. Det å fjerne en død node er ikke godt dokumentert så jeg bør kanskje skrive noen linjer og sende til ejabberd gutta så det blir lagt ut på ejabberd.jabber.ru.
Uansett er det bra at oppgraderingen gikk som den skulle!
Jeg skal ta en titt på serveren for å finne ut hva som foregår slik at vi får en slutt på heng og utilgjengelighet. De siste dagene har det vært helt håpløst og for meg har det vært vanskelig å gjøre noe fra mobilt smalbånd :/ Uansett så skal jeg ta tak i problemene de neste dagene og finne noen løsninger. Vurderer sterkt å migrere over på en annen server som er mer stabil men denne kjører windows om dagen så den må først reinstalleres. Tror vi må gjøre dette for å få det så stabilt som jeg ønsker. Uansett så er jeg i gang, og beklager denne ustabile påsken.
Desverre har vi hatt litt nedetid, og siden jeg er på påskeferie så har jeg litt vanskelig for å merke dette veldig fort. Nå har jeg gått gjennom logger og finner ikke noe galt. Siden jeg er på ferie har jeg ikke mulighet til å se mer på dette før jeg er hjemme igjen, så i mellomtiden hadde det vært flott om noen sendte meg en SMS på 932 42 123 derserom tjenesten går ned igjen så skal jeg dra den opp. Hjelper dere meg så skal jeg gjøre det jeg kan for oppetiden.
Beklager de problemer dette skaper!
Riktig god påske!
I går skiftet vi over til nye linjer og alt gikk mer eller mindre som planlagt, ca 15 minutter nedetid. Nå får vi se om de nye linjene er like stabile og bra som de gamle
Ejabberd stoppet opp i går uten noen meldinger i loggen og uten grunn etter det jeg vet. Startet den på nytt i dag og alt ser ut til å virke.
Har tittet igjennom loggene for å se om det finnes noen svar på hvorfor dette skjedde der, men det er ikke logget noe nyttig så jeg blir ikke klokere. Heldigvis ser at ut til å fungere nå.
Vi hadde litt nedetid igjen i natt på grunn av en litt dårlig kabel som mistet kontakten ved noe servicearbeid på serverrommet. Beklager dette.