NULL Skriv ut sidan - Sökningsmetodik och -logik

Anbytarforum

Titel: Sökningsmetodik och -logik
Skrivet av: Anders Andersson skrivet 2003-12-13, 01:58
Ett problem som ofta irriterar mig vid sökning i databaser är följande:
 
Låt mig ta Sveriges dödbok 1950-1999 som exempel. Där finns många poster med data av varierande fullständighetsgrad. Exempelvis saknas namn på avlidna före 1968, och för avlidna på 1950-talet saknas ofta exakt dödsdatum.
 
Om jag anger ett exakt födelsedatum, men inte fyller i något annat fält, så redovisas alla personer i databasen som har just detta födelsedatum. Om jag dessutom anger ett dödsår, så begränsas resultatet till de personer som också avlidit någon gång under det året.
 
Antag att jag för en person vet exakt födelsedatum och dödsdatum, det senare på 1950-talet, och fyller i dessa. Resultatet blir ingen träff. Jag gör en ny sökning med dödsdatumet reducerat till årtalet, och då hittar jag den sökta personen i resultatlistan, med rätt månad men exakt datum för dödsfallet okänt.
 
Problemet är alltså att jag som ställer frågan har mer exakta uppgifter än som finns i databasen, och då erhåller jag inte den väntade träffen.
 
Om jag lämnar ett fält blankt, så tolkas det som vet inte och jag erhåller alla möjliga alternativ ur databasen att välja mellan. Om däremot ett fält i en post i databasen är tomt, så tolkas det som tom sträng och de enda sökningar som ger något resultat är de där motsvarande fält i sökformuläret också lämnas tomt.
 
Detta beteende tycks mig något ologiskt, även om man i och för sig kan argumentera för att tomma fält i sökformuläret och tomma fält i databasens poster inte skall tolkas likadant.
 
Som det är nu krävs det att jag som användare är väl insatt i vilka begränsningar som gäller för olika poster i databasen, såsom de jag nämnt ovan beträffande Sveriges dödbok. Ett förhållandevis enkelt exempel är att jag aldrig kan söka med både angivet namn och ett dödsår före 1968, då det inte finns några poster som matchar det. Jag kan lära mig detta årtal, men jag har faktiskt inte lärt mig från och med vilket år som döduppgifterna innehåller exakt datum. Det finns säkert ytterligare brister i källmaterialet som ger sig till känna på detta sätt.
 
Jag tycker det vore både naturligare och enklare för användaren om databasens tomma fält betraktades som jokrar som kan matcha vad som helst, i stället för som tomma strängar som bara kan matcha tomma sökfält. Då skulle jag vid en sökning med angivet namn och födelsedatum erhålla dels alla poster efter 1968 med rätt namn och födelsedatum, dels alla poster före 1968 med rätt födelsedatum, oavsett namn. Det är upp till mig som användare att sålla bort de träffar jag inte vill ha, inte databasen som skall undanhålla mig alla poster som i något avseende är mindre precisa än mina egna sökvillkor.
 
En annan databas som jag tycker lider svårt av precis samma problem är Ellis Island Records, där man aldrig kan veta hur noggranna uppgifter som finns på de inmatade passagerarlistorna. Vad hjälper det att jag vet precis hur gammal farmors bror var när han emigrerade, om den uppgiften skulle saknas i databasen? Jag kan förstås pröva att i tur och ordning utesluta vissa fält i sökningen, men då erhåller jag också alla poster där åldersuppgift finns och skiljer sig från vad jag redan vet.
 
Om man skall tillskriva databaser mänskliga egenskaper, så är det som om de nämnda databaserna anser sig vara mer kunniga än användarna: Det inte vi vet, det kan inte heller någon annan veta.
 
Jag har en känsla av detta beteende är det normala i olika databaser, medan den mer generösa matchningen av okända variabler hör till undantagen. Är det så?