Sidverktyg

Idag: Mappning och FTP-server

Just nu pågår som bekant migreringen från Book-IT till Koha. Vi håller på och reder ut skillnader i formaten mellan BTJMARC och MARC21. Visserligen skall vi så småningom ersätta de flesta posterna med Librisposter som kör MARC21 kodade i UTF-8 redan från början, men för att kunna jämföra de två systemen så behöver det se vettigt ut i Koha så att vi ser att rätt bok kopplas till rätt låntagare t.ex. Det kommer också troligen bli en mindre andel med lite mer lokalt material som vi behåller lokalt. När det här jobbet görs upptäcker man också att skillnader i hur de två systemen tänker spelar en del roll för posterna och hur olika fält används.

En annan fråga som jag jobbar med just nu är FTP-server. Vi vill ha en egen kopia på databasen t.ex. varje natt till en server som kommunen kontrollerar för att vara beredd på ett riktigt svettigt worst case scenario. Förvisso behövs den inte då vi har ett extensivt avtal på gång som reglerar tillgången till datan + att Libriotech har visat sig tänka mer på kundens bästa än vad vi själva gör ibland. Men händer oförutsett är det ändå bra att ha en aktuell backup skild från den som leverantören själv har för att säkerställa att den vanliga driften fungerar. Något man måste tänka på när man gör backuper är att inte spara personuppgifter (vilket databasen är full av) längre än vad som krävs. Jag har ställt en fråga till datainspektionen och fått följande svar:

Fråga: Jag undrar hur länge man kan spara backuper av den databas som är inanmätet av ett biblioteksdatasystem. Vi kommer naturligtvis att anonymisera lån vid återlämning, men det finns ju en viss teoretisk möjlighet att återställa en äldre kopia av databasen och se vem som haft en bok tidigare även om det endast är tillgängligt för IT-administratörer. Samtidigt måste vi ha backuper längre tillbaka i tiden ifall det visar sig att de täta backuperna från dagen är korrupta.
Vänliga hälsningar/Viktor Sarge

Svar: Enligt personuppgiftslagen gäller att personuppgifter inte får bevaras längre än vad som är nödvändigt med hänsyn till ändamålen med behandlingen (9 §). Detta innebär att personuppgifterna måste avidentifieras eller förstöras när uppgifterna inte längre behövs för ändamålet. Det är exempelvis inte förenligt med personuppgiftslagen att låta lagringskapaciteten bestämma hur länge personuppgifterna sparas.

Som synes måste man tänka på att kontinuerligt radera gamla kopior. Ett tag såg det ut som att kommunens IT-leverantör kunde sätta upp en FTP-server och skript som gallrade äldre backuper, men nu lutar det åt att vi får ha en extern server som vi själva tar hand om.

Sist men inte minst har jag börjat rota lite mer i Librisfrågorna om matching osv. Det ser inte ut att bli något problem, men det är ändå ganska mycket som skall både koordineras och göras. Det enda som bekymrar mig är om vi kan använda Pubsubhubbub redan från början för att snabbt synka poster från Libris. Tanken är ju att använda bokhandelsmodellen och en omedelbar synk av posterna så att Libris agerar nav. Det kan hända att vi får gå över på OAI-PMH som är mindre tekniskt elegant och polla Libris server kontinuerligt. Återkommer framöver vartefter det händer saker. Men flödet för inköp är helt sonika på tapeten just nu.