Övrigt > Språkhistoria
Runskrift i dagbok från sent 1800-tal?
Anna-Carin:
Som Carl Thomas var inne på, så är det antagligen lättast att komma igång med knäckandet med hjälp av frekvensanalys.
Det finns tabeller över vilka bokstäver som är vanligast i texter på olika språk, men eftersom det rör sig om en äldre, handskriven, text föreslår jag att du skriver av några sidor (så att du har t.ex. 1000 bokstäver; hoppa över all kryptotext), sorterar dem och noterar hur många det finns av varje bokstav. I nusvenska är t.ex. a, e, n och r de vanligaste bokstäverna med 8-10 % vardera, tätt följda av s och t. I praktiken varierar det förstås lite från text till text; det viktiga är att identifiera den grupp bokstäver som är allra vanligast. I din text kanske det ser annorlunda ut, beroende på hur just din släkting stavade (t.ex. h och f var nog vanligare än de är nu). Gör motsvarande analys av kryptotexten (ta med så många textsnuttar som möjligt, så du får många tecken.)
När du sen vet vilka bokstäver som är vanligast i klartexten och i kryptotexten, kan du leta fram krypto-ord som innehåller flera av de vanligaste bokstäverna, gärna i följd efter varandra. Para ihop några av de vanligaste kryptotecknen med de vanligaste bokstäverna, fyll i dem i krypto-orden och se om det ger rimliga eller orimliga bokstavsföljder. Eftersom du jobbar med enbart de vanligaste tecknen till att börja med, är det inte så många olika kombinationer att prova. När några bokstäver faller på plats, fyll i dem överallt. Titta särskilt på de korta orden; har man löst 2 av 3 bokstäver i ordet går det ofta att lista ut vilken den tredje är. Och så vidare, tills hela kryptot är löst. Ibland visar det sig att man tänkt fel, och får backa, så det är bra att anteckna allteftersom så att man minns vilka antaganden man har gjort och i vilken ordning.
Man kan inte lita blint på bokstavsfrekvenserna (tänk om alla krypterade notiser handlar om att han gillar att spela xylofon?), men för vanliga substitutionschiffer (dvs varje tecken betyder alltid samma bokstav) så ger frekvensanalysen oftast mycket god ledning för att komma igång. På engelska kan frekvensanalyser ge mer entydigt resultat än på svenska, för där är e i särklass vanligast, med hela 12 % (nästa bokstav är a, med bara 8 %) - men ingen regel utan undantag; det finns faktiskt en hel roman som är skriven på engelska utan bokstaven e...
tvetberg:
Tack för alla förslag hittills! Jag tänkte oavsett texta av hela dagboken digitalt, det är väl runt 50 sidor i storleken som är bilden visar ovan. Jag kan ju använda det sedan till att göra frekvensanalysen.
Jag tänkte också på det att några av symbolerna han använder kommer i följd av bara två eller tre symboler. Det finns ju få ord i svenskan både då och nu som är två-tre bokstäver långt. Tex om symbolen är ABB så är ju sannolikheten ganska stor att det är tex "att". Då bör man ju hitta vilken symbol som tex bokstaven A representerar och sedan fylla i den på alla andra ställen man ser symbolen? Eller tänker jag helgalet?
Det är ganska lite kryptisk text. På 50 sidor är det endast de fyra styckena som jag la in bild på i första inlägget.
Anna-Carin:
Jo, du tänker rätt om att ABB skulle kunna betyda "att" (fast "ett" vore också ett tänkbart alternativ). Men tyvärr är det inte applicerbart eftersom alla trebokstaviga ord i dina kryptotexter är uppbyggda av tre olika bokstäver, och då finns det avsevärt fler möjliga kombinationer.
Jag tittade lite närmare på texterna och lade märke till några saker. För det första är det enbart den tredje texten som innehåller B-runan, men där förekommer den hela 6 gånger på 116 tecken. En såpass vanlig bokstav skulle man nog vänta sig att hitta i fler av texterna; åtminstone i den andra eller fjärde som är hyggligt långa. Därför vore det nog bäst att göra en tabell med en rad för varje tecken och en kolumn för varje text, för att se vilka tecken som förekommer i vilken text; alltså en frekvensanalys för varje text för sig (enkelt att summera sen om man vill). Det är mycket möjligt att B i tredje texten motsvaras av något annat tecken i de övriga. I så fall finns det något tecken som förekommer en del i de andra tre (typ det tionde vanligaste, om man ska tro frekvenstabellen), men som inte förekommer alls i tredje texten.
För det andra, så finns ett visst ord hela tre gånger i tredje texten och var sin gång i andra och fjärde (det ser ut som TfX ungefär). Det bekräftar trevligt nog två saker som vi har tagit för givet - dels att kryptot bevarar samma ordindelning som i klartexten, och dels att samma kryptering använts (i alla fall i minst tre av texterna). Wikipedias artikel om språkstatistik innehåller en lista över de 50 vanligaste orden i dagstidningssvenska. "Och", "att" och "det" är vanligast av de trebokstaviga och det finns många fler som skulle kunna vara möjliga, men "att" bortfaller förstås. (Det finns avancerade krypton där man flyttar mellanrummen och gör speciella abrovinker för att dölja dubbelteckningar, men det verkar det som väl är inte röra sig om här! Ett sådant krypto dechiffreras f.ö. i Dorothy Sayers "Drama kring ung dansör".) I text två verkar ordet stå först i kryptotexten; om meningen innan fortsätter in i kryptotexten kan du nog begränsa mängden möjliga ord avsevärt.
I tredje och fjärde texten finns även ett ord som ser ut ungefär som FRI, och på sista raden i tredje texten finns FRB. Det kan ju tåla att funderas på vilka trebokstaviga ord som har de två första bokstäverna gemensamma - "den/dem", "han/har", "med/men", osv.
Slutligen innehåller den andra texten ett tvåbokstavigt ord efter "troligen", som kanske går att gå vidare med. Ord som passar efter "troligen" skulle kunna vara t.ex. "på", "av", "en", eller kanske något mer, men det finns inte så många olika att välja på. I synnerhet som det består av de två första tecknen i TfX ovan, fast i omvänd ordning!
Om jag brukade slå vad, skulle jag sätta en slant på att det står "...troligen av...", för då skulle ordet som liknar TfX kunna betyda "var", och det är ett rimligt ord när man berättar om något som hänt. Men man får alltså sätta in sina gissade bokstäver överallt och se om det går att komma vidare någonstans.
Det är praktiskt att "skriva av" kryptotexterna med hjälp av vanliga tecken på datorn; du kan t.ex. använda versaler (eller både siffror och versaler) för kryptot, så kan du göra en case sensitive "sök & ersätt" för att testa olika tolkningar (med gemener för de gissade bokstäverna går det att skilja dem från kryptot).
tvetberg:
Tack Anna-Carin för din hjälp! Vi har nu skrivit av sju sidor till digitalt och fortsätter med arbete idag. Jag tror jag börjar förstå hur du menar och det låter ju strålande att du tror att det är samma krypto och att det är samma ordindelning. Det borde ju göra det lättare för oss att göra en översättning.
Hur kan en sådana tabell som du talar om se ut?
Det ska bli spännande att se vad han "döljer". Han var i USA under tiden detta skrevs och jobbade under tre olika tillfällen. Han är intressant för filmhistoriker då han var en av de första att ta hem rörligt bild till Sverige. Han ingår i min släktforskning och det är himla roligt att hans dagbok gått i arv men att det just är jag som får försöka mig på dessa krypton.
Adils:
Jag är övertygad om att den främsta förutsättningen för att förstå texten är att först lära sig så mycket som möjligt om den som skrev den....
Navigering
[0] Meddelandeindex
[#] Nästa sida
[*] Föregående sida
Gå till fullversion