Cæsarkode
Cæsarkoden, også kendt som Forskydekoden, er en af de simpleste og mest kendte krypteringsteknikker. Det er en form for substitutionskode, hvor hvert bogstav i "klarteksten" erstattes af et bogstav et fast antal positioner nede af alfabetet. Eksempelvis vil en forskydning på 3 betyde at A erstattes af D, B bliver E, og så videre. Metoden er opkaldt efter Julius Cæsar, som brugte den i sin private korrespondance.
Cæsarkoden er ofte den første krypteringsteknik spejdere lærer, gerne i form af A-K koden. Den kan senere generaliseres til en vilkårlig Cæsarkode. Denne artikel handler om at du senere kan bruge teknikken i Cæsarkoden som en del af Vigenèrekoden.
A-K kode
Til at kryptere og dekryptere Cærsarkoder kan man bruge en oversættelsestabel, hvor alfabetet står øverst og det forskudte alfabet står nedenunder. For en A-K kode ser tabellen således ud:
A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z | Æ | Ø | Å |
K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z | Æ | Ø | Å | A | B | C | D | E | F | G | H | I | J |
Når man skal kryptere sin besked finder man bogstavet i det øverste alfabet, og erstatter det med bogstavet nedenunder. Således bliver kan man f.eks. oversætte:
Klartekst: Vi kom, Vi så, Vi sejrede. Kode: Cs uyw, Cs åj, Cs åotøono.
Når man skal dekryptere den kodede besked bruges tabellen omvendt. Man finder altså hvert bogstav i den nederste tabel og erstatter det med bogstavet ovenover.
W problemet
Et problem man ofte møder, når man forsøger bryde en simpel Cæsar eller A-K kode er, at bestemme hvilket alfabet, der er brugt. Det kan synes mærkeligt, da vi jo har et fast defineret alfabet her i landet, men der er alligevel plads til visse misforståelser. F.eks. sker det ofte at man udelader "W" og "Q" fra alfabetet, da de sjældent bruges.
A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | X | Y | Z | Æ | Ø | Å |
K | L | M | N | O | P | Q | R | S | T | U | V | X | Y | Z | Æ | Ø | Å | A | B | C | D | E | F | G | H | I | J |
A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | R | S | T | U | V | X | Y | Z | Æ | Ø | Å |
K | L | M | N | O | P | R | S | T | U | V | X | Y | Z | Æ | Ø | Å | A | B | C | D | E | F | G | H | I | J |
At Bryde Cæsarkoden
Det svære er sådan set ikke at bryde Cæsarkoden, men at regne ud at der er brugt en Cæsarkode og ikke en Kodeordskode, en skjult morsekode eller lignende.
Hvis man er overbevist om at koden bruger en Cæsarkode, er det faktisk ret let at bryde den:
...med ren kraft
Cæsarkoden kan brydes med rå kraft. Alt du skal gøre er at afprøve alle 28 mulige forskydninger for hver af de to til tre forskellige alfabeter. Når teksten pludselig giver mening har du simpelthen løst koden.
Er man på løb, giver det ofte pote at prøve A-K og A-T koderne, fordi de bruges så ofte i spejdersammenhæng.
...med smarte gæt
Fordi en Cæsarkode kun forskyder alfabetet, er det nok at gætte et enkelt bogstav i koden, så falder resten helt naturligt på plads. Hvis koden har bevaret sine mellemrum, er det ekstra let at gætte. Tag for eksempel koden:
xiqvox vsqqoø s zyåaukååox.
Der findes ikke mange enstavelses-ord i det danske sprog, så s
må nødvendigvis svare til et i
. Tæller vi baglæns ser vi at a ligger 8 bogstaver før i. Går vi 8 bogstaver tilbage fra s finder vi et k. Det er altså ret sikkert, at der er tale om en A-K kode. Kan du regne ud, hvad den siger?
Tilsvarende starter mange to-stavelses-ord med et e. Tag for eksempel:
æleh xh drzbxd æxddx?
Her kunne vi gætte på at x
svarer til e
. Tæller vi baglæns finder vi ud af at der er tale om en A-T kode.
Hvis mellemrummene i beskeden er blevet fjernet, bliver det straks sværere at gætte løsningen. Man kan være heldig at gætte nogle bogstaver rigtigt. Især dobbeltbogstaver kan bruges til at gætte med. De mest brugte dobbeltbogstaver på dansk er bb, ff, gg, kk, ll, mm, nn, pp og tt. Det er selvfølgelig stadig en del muligheder at vælge imellem, men det er hurtigere end at bruge rå kraft.
Man kan i stedet forsøge at løse koden...
...med statistik
Bogstavet E er det mest brugte i det danske sprog. E udgør hele 16% af en genemsnitlig dansk teskt. Det svarer til at du skriver et e hver sjette gang du skriver et bogstav.
Tilsvarende er bogstaerne "D", "N" og "R" også ret brugte. De optræder rundt regnet halvt så ofte som E.
Forestil dig nu at vi har opsnappet denne hemmelige besked:
tæeqpbcmpqzxussqauzpquxmzpqc. pqræanqaqpqbusølwaus.pqaqa sæpccdbuzpqwausqaqyqpelnqz. teubeuymaotqaqatdacuscwmzeu æeqaadyøxqpqy.
Det ser jo fuldstændigt uoverskueligt ud. Men sætter vi os stille og roligt ned og tæller antallet af bogstaver, får vi, at der er
- 21 Q'er
- 15 A'er
- 11 af både P og U.
Vi vil altså gætte på at Q skal oversættes til et E. E ligger fire bogstaver efter A. Tæller vi fire tilbage fra Q finder vi M. Og vi vil altså gætte på, at der er tale om en A-M kode. Umiddelbart passer det godt til koden. I så fald bliver A til R, P til D og U til I. Det lyder ganske overbevisende.
Oversætter vi hele teksten med A-M finder vi ganske rigtigt at:
hovedstaden ligger inde i landet. de forbereder sig på krig. der er godt tusinde krigere med våben. hvis vi marcherer hurtigt kan vi overrumple dem.
Kilde
- Udgivet på Spjdrpedia.dk under CC BY-SA 3.0