(Translated by https://www.hiragana.jp/)
Ανάλυση συχνότητας γλώσσας - Βικιπαίδεια Μετάβαση σしぐまτたうοおみくろん περιεχόμενο

Ανάλυση συχνότητας γλώσσας

Από τたうηいーた Βικιπαίδεια, τたうηいーたνにゅー ελεύθερη εγκυκλοπαίδεια
(Ανακατεύθυνση από Ανάλυση Συχνότητας Γλώσσας)
Ιστόγραμμα μみゅーεいぷしろん τις σχετικές συχνότητες γραμμάτων της αγγλικής γλώσσας

Σしぐまτたうηいーたνにゅー κρυπτανάλυση, μみゅーεいぷしろん τたうοおみくろんνにゅー όρο ανάλυση συχνότητας γλώσσας περιγράφεται ηいーた μελέτη της συχνότητας τたうωおめがνにゅー γραμμάτων (ή ομάδας γραμμάτων) σしぐまεいぷしろん ένα κρυπτογράφημα (ciphertext). Ηいーた τεχνική αυτή εφαρμόζεται σしぐまεいぷしろん περιπτώσεις όπου τたうοおみくろん πρωτότυπο κείμενο (plaintext) έχει κρυπτογραφηθεί μみゅーεいぷしろん κάποια μέθοδο Μονοαλφαβητικής Αντικατάστασης, δηλαδή κάθε ένα γράμμα τたうοおみくろんυうぷしろん πρωτότυπου αντικαθίσταται μみゅーεいぷしろん μόνο έναν άλλο χαρακτήρα.

Οおみくろん κρυπταναλυτής προσπαθεί μελετώντας τたうοおみくろん κρυπτογραφημένο κείμενο νにゅーαあるふぁ βγάλει κάποια συμπεράσματα γがんまιいおたαあるふぁ τたうοおみくろん κείμενο μみゅーεいぷしろん βάση τたうηいーたνにゅー συχνότητα εμφάνισης ίδιων χαρακτήρων. Ηいーた μέθοδος βασίζεται σしぐまτたうοおみくろん γεγονός ότι οおみくろんιいおた περισσότερες γλώσσες παρουσιάζουν σしぐまτたうηいーた δομή τους (γράμματα ή συνδυασμούς γραμμάτων) κάποια ορισμένη κατανομή, μみゅーεいぷしろん μέγιστα κかっぱαあるふぁιいおた ελάχιστα, ηいーた οποία μπορεί νにゅーαあるふぁ χαρακτηρίσει τたうηいーた γλώσσα. Μみゅーεいぷしろん τたうοおみくろんνにゅー υπολογισμό της κατανομής τたうωおめがνにゅー γραμμάτων σしぐまεいぷしろん μみゅーιいおたαあるふぁ γλώσσα, μπορεί νにゅーαあるふぁ εκτιμηθεί ένα μέτρο πぱいοおみくろんυうぷしろん ακολουθούν όλα τたうαあるふぁ κείμενα της γλώσσας αυτής. Αυτό σημαίνει ότι κάποια γράμματα (κかっぱαあるふぁιいおた κάποιες μικρές λέξεις) τείνουν νにゅーαあるふぁ εμφανίζονται περισσότερες φορές σしぐまεいぷしろん ένα κείμενο σしぐまεいぷしろん σχέση μみゅーεいぷしろん κάποια άλλα. Γがんまιいおたαあるふぁ τたうηいーたνにゅー Αγγλική, γがんまιいおたαあるふぁ παράδειγμα, τたうοおみくろん Εいぷしろん τείνει νにゅーαあるふぁ είναι τたうοおみくろん πぱいιいおたοおみくろん κοινό γράμμα μみゅーεいぷしろん τις περισσότερες επαναλήψεις σしぐまεいぷしろん οποιοδήποτε κείμενο, ενώ τたうοおみくろん Ζぜーた τείνει νにゅーαあるふぁ είναι τたうοおみくろん πぱいιいおたοおみくろん σπάνιο γράμμα. Σしぐまτたうαあるふぁ κρυπτοσυστήματα Μονοαλφαβητικής αντικατάστασης, τέτοιες ιδιότητες της φυσικής γλώσσας συντηρούνται κかっぱαあるふぁιいおた σしぐまτたうοおみくろん κρυπτογράφημα, κかっぱαあるふぁιいおた ηいーた ανάλυση συχνότητας δίνει τたうηいーた δυνατότητα αποκρυπτογράφησής τたうοおみくろんυうぷしろん.

Τたうοおみくろん γεγονός αυτό οδήγησε σしぐまτたうηいーたνにゅー ανάγκη δημιουργίας κρυπτογραφίας Πολυαλφαβητικών Αντικαταστάσεων, όπου κάθε ένα γράμμα τたうοおみくろんυうぷしろん πρωτότυπου κειμένου μπορεί νにゅーαあるふぁ αντικατασταθεί μみゅーεいぷしろん περισσότερους από έναν χαρακτήρες, κάνοντας έτσι τたうηいーたνにゅー κατανομή συχνοτήτων εμφάνισης χαρακτήρων πぱいιいおたοおみくろん ομοιόμορφη κかっぱαあるふぁιいおた τたうηいーた μέθοδο ανάλυσης της άχρηστη.

Κρυπτανάλυση Μονοαλφαβητικής Αντικατάστασης

[Επεξεργασία | επεξεργασία κώδικα]
Σχετικές Συχνότητες Γραμμάτων Αγγλικής-Ελληνικής
A B C D E F G H I J K L M
8,2 1,4 2,8 3,8 12,7 2,9 2,0 5,3 6,3 0,1 0,4 3,4 2,3
N O P Q R S T U V W X Y Z
7,1 8,0 2,0 0,1 6,8 6,1 10,5 2,5 0,9 1,5 0,2 2,0 0,1
Αあるふぁ Βべーた Γがんま Δでるた Εいぷしろん Ζぜーた Ηいーた Θしーた Ιいおた Κかっぱ Λらむだ Μみゅー Νにゅー
12 0,8 2 1,7 8 0.5 2,9 1,3 7,8 4,2 3,3 4,4 7,9
Ξくしー Οおみくろん Πぱい Ρろー Σしぐま Τたう Υうぷしろん Φふぁい Χかい Ψぷさい Ωおめが
0,6 9,8 5,024 5,009 4,9 9,1 4,3 1,2 1,4 0,2 1,6

Οおみくろん κρυπταναλυτής χρησιμοποιεί μία μέθοδο πぱいοおみくろんυうぷしろん λέγεται ανάλυση συχνότητας ηいーた οποία διασπά τたうηいーたνにゅー μονοαλφαβητική αντικατάσταση τεχνική αυτή μελετάει τたうηいーたνにゅー στατιστική δομή της γλώσσας τたうοおみくろんυうぷしろん κρυπτομηνύματος σしぐまχかい 2.2 πιν 2.2. Χρησιμοποιώντας τたうηいーたνにゅー κατανομή χαρακτήρων ψάχνουμε νにゅーαあるふぁ βρούμε τたうοおみくろんνにゅー πぱいιいおたοおみくろん επαναλαμβανόμενο κρυπτοχαρακτήρα κかっぱαあるふぁιいおた τたうοおみくろんνにゅー αντικαθιστούμε από τたうοおみくろんνにゅー πぱいιいおたοおみくろん επαναλαμβανόμενο χαρακτήρα της φυσικής γλώσσας. Συνεχίζουμε τたうηいーたνにゅー ανάλυση έως φθάσουμε σしぐまεいぷしろん μία μοναδική λύση (Τたうοおみくろん εξαγόμενο μήνυμα νにゅーαあるふぁ έχει γλωσσικό νόημα).

Βοηθητικά εργαλεία είναι ηいーた ανάλυση δομής γλώσσας (δηλαδή ηいーた ανάλυση της συχνότητας εμφάνισης χαρακτήρων σしぐまεいぷしろん ένα οποιοδήποτε κείμενο μιας γλώσσας), ηいーた Νにゅー-γραμματική πιθανοτική ανάλυση (δηλαδή ηいーた ανάλυση της κατανομής συχνότητας εμφάνισης λέξεων Νにゅー χαρακτήρων μέσα σしぐまεいぷしろん κάποιο κείμενο της γλώσσας) κかっぱαあるふぁιいおた ακολουθιακή γραμματική ανάλυση κατά Μαρκόφ (αφορά σχέσεις πぱいοおみくろんυうぷしろん πιθανόν νにゅーαあるふぁ έχουν μεταξύ τους τたうαあるふぁ γράμματα στις λέξεις της γλώσσας).

Ανάλυση Δομής Γλώσσας

[Επεξεργασία | επεξεργασία κώδικα]
  1. Τたうοおみくろん πぱいιいおたοおみくろん κοινό πρώτο γράμμα μέσα σしぐまεいぷしろん λέξεις: T, O, A, W, B, C, D, S, F, M, R, H, I, Y, E, G, L, N, U, J, K
  2. Τたうοおみくろん πぱいιいおたοおみくろん κοινό δεύτερο γράμμα μέσα σしぐまεいぷしろん λέξεις: H, O, E, I, A, U, N, R, T
  3. Τたうοおみくろん πぱいιいおたοおみくろん κοινό τρίτο γράμμα μέσα σしぐまεいぷしろん λέξεις: E, S, A, R, N, I
  4. Τたうοおみくろん πぱいιいおたοおみくろん κοινό τελευταίο γράμμα μέσα σしぐまεいぷしろん λέξεις: E, S, T, D, N, R, Y, F, L, O, G, H, A, K, M, P, U, W
  5. Οおみくろんιいおた περισσότερες λέξεις τελειώνουν μみゅーεいぷしろん: E ,T, D, S
  6. Τたうαあるふぁ γράμματα πぱいοおみくろんυうぷしろん ακολοθούν τたうοおみくろん: Εいぷしろん R,S,N,D
  7. Τたうαあるふぁ πぱいιいおたοおみくろん κοινά διπλά γράμματα: SS, EE, TT, FF, LL, MM, OO

Νにゅー-γραμματική πιθανοτική ανάλυση

[Επεξεργασία | επεξεργασία κώδικα]

Ηいーた Τριγραμματική ανάλυση σしぐまεいぷしろん ένα Αγγλικό κείμενο 763 λέξεων

Λέξεις	  Εμφάνιση      Συχνότητα
The	   91 	          11.9%
And	   27 	          3.5%
Had	   19 	          2.5%
Was	   15 	          2%
That	   13 	          1.7%


Διακριτή Στατιστική πηγή Μαρκόφ

[Επεξεργασία | επεξεργασία κώδικα]

Μπορούμε νにゅーαあるふぁ παραστήσουμε τたうοおみくろん μήνυμα σしぐまαあるふぁνにゅー μία ακολουθία γραμμάτων. Αυτές οおみくろんιいおた ακολουθίες γραμμάτων δでるたεいぷしろんνにゅー είναι τυχαίες αλλά έχουν μみゅーιいおたαあるふぁ στατιστική εξάρτηση δηλαδή ηいーた εμφάνιση ενός γράμματος επηρεάζει τたうηいーたνにゅー εμφάνιση ενός άλλου γράμματος. πぱい.χかい. Ηいーた εμφάνιση τたうοおみくろんυうぷしろん τたうοおみくろんυうぷしろん Q συνεπάγει ότι τたうοおみくろん αμέσως πιθανότερο γράμμα είναι τたうοおみくろん U. Ηいーた πηγή εκπέμπει γράμματα από ένα πεπερασμένο αλφάβητο έστω τたうοおみくろん Αγγλικό σύμφωνα μみゅーεいぷしろん κάποιες πιθανότητες πぱいοおみくろんυうぷしろん εξαρτώνται από τたうοおみくろん τρέχων γράμμα κかっぱαあるふぁιいおた από τたうαあるふぁ προηγούμενα γράμματα .Ηいーた πιθανότητα εμφάνισης ενός γράμματος εξαρτάται από τたうοおみくろん συγκεκριμένο γράμμα κかっぱαあるふぁιいおた από τたうοおみくろん αμέσως προηγούμενο πぱい.χかい.

P(Xj=b,Xj-1=a) = 0.0228302.

Σχηματίζεται επομένως ένας πίνακας 26x26 μみゅーεいぷしろん όλους τους συνδυασμούς κかっぱαあるふぁιいおた τις πιθανότητες γがんまιいおたαあるふぁ κάθε συνδυασμό. Συμπεραίνουμε ότι τたうοおみくろん μήνυμα σしぐまαあるふぁνにゅー ακολουθία περιέχει μνήμη τたうηいーたνにゅー οποία μπορούμε νにゅーαあるふぁ ποσοτικοποιήσουμε

Έστω οおみくろん κρυπταναλυτής έχει αποκτήσει πρόσβαση σしぐまτたうοおみくろん κρυπτοκείμενο. WSADSXDAONVOPDDZQCQSINYAKAOQCZNPUSSAZJOEDYZEDVUJZQDZNZNZJSFSIVPDXDJSUWDNYONMZXSASMYCDAOQCDVYUZAYSMYCDUSUIJZYOSNYCZYVYCDQIAADNYUASFA DVVSMCIWZNOYKVYZNPHDCONPZJJHJZHJZHJZAOQCFDYAOQCDAUえーゆーSSAFDYUSSADAZNOQDVSQODYKONPDDPCDZPDPZYMIJJVUDDPZFZONVYZHAOQELZJJOZPXOQDKSIYSMZVYD NKSIAVDZYHDJYZNPYSVDZYNDBYYSZNDWDAFDNQKDBOYJOEDQAZQEONFLSAELDJJSAQ

Τたうοおみくろん πρώτο βήμα πぱいοおみくろんυうぷしろん κάνει οおみくろん κρυπταναλυτής είναι νにゅーαあるふぁ μετρήσει τたうηいーたνにゅー συχνότητα πぱいοおみくろんυうぷしろん εμφανίζονται τたうαあるふぁ γράμματα( πιν 2.3) σしぐまτたうοおみくろん κρυπτοκείμενο κかっぱαあるふぁιいおた μετά νにゅーαあるふぁ τたうαあるふぁ συσχετίσει μみゅーεいぷしろん τたうοおみくろん ιστόγραμμα 2.2 Τたうοおみくろん πぱいιいおたοおみくろん εμφανιζόμενο γράμμα μέσα σしぐまτたうοおみくろん κρυπτοκείμενο είναι τたうοおみくろん γράμμα D τたうοおみくろん οποίο τείνει νにゅーαあるふぁ είναι τたうοおみくろん γράμμα Εいぷしろん αλλά αυτό δでるたεいぷしろんνにゅー είναι σίγουρο. Οおみくろん κρυπταναλυτής οδηγείται σしぐまεいぷしろん διάφορους συσχετισμούς ανάλογα μみゅーεいぷしろん τたうηいーたνにゅー συχνότητα γραμμάτων.

Πίνακας 2.3 Μετρήσεις κατανομής γραμμάτων

Νούμερο. χαρακτήρας	Συχνότητες(%)	Μέτρηση Συχνότητας
   1	          D	        12.5000	      	41
   2	          Z	         9.7561	      	32
   3	          Y	         8.5366	      	28
   4	          S	         8.2317	      	27
   5	          A	         7.3171	      	24
   6	          N	         6.4024	      	21
   7	          O	         6.4024	      	21
   8	          J	         5.4878	      	18
   9	          Q	         4.8780	      	16
  10	          V	         4.2683	      	14
  11	          C	         3.6585	      	12
  12	          P	         3.6585	      	12
  13	          U	         3.0488	      	10
  14	          I	         2.4390	      	8
  15	          F	         2.1341	      	7
  16	          E	         1.8293	      	6
  17	          H	         1.8293	      	6
  18	          K	         1.8293	      	6
  19	          M              1.8293	        6
  20	          W              1.2195	        4
  21	          X	         1.2195	      	4
  22	          L	         0.9146	      	3
  23	          B	         0.6098	      	2

Διγραματική Ανάλυση

   1	         ZN	         2.4465	      	8
   2	         OQ	         2.1407	      	7
   3	         SA	         2.1407	      	7
   4	         AO	         1.8349	      	6
   5	         CD	         1.8349	      	6
   6	         ON	         1.8349	      	6
   7	         DA	         1.5291	      	5
   8	         DZ	         1.5291	      	5
   9	         JZ	         1.5291	      	5
  10	         NP	         1.5291	      	5
  11	         QC	         1.5291	      	5
  12	         VY	         1.5291	      	5
  13	         ZY	         1.5291	      	5
  14	         AD	         1.2232	      	4
  15	         DN	         1.2232	      	4
  16	         DV	         1.2232	      	4
  17	         DY	         1.2232	      	4
  18	         JJ	         1.2232	      	4
  19	         NY	         1.2232	      	4
  20	         PD	         1.2232	      	4
  21	         SI	         1.2232	      	4
  22	         SM	         1.2232	      	4
  23	         US	         1.2232	      	4
  24	         YC	         1.2232	      	4
  25	         YS	         1.2232	      	4
  26	         YZ	         1.2232	      	4


Αντικαθιστά μέσα σしぐまτたうοおみくろん κρυπτοκείμενο τたうοおみくろん D μみゅーεいぷしろん τたうοおみくろん Εいぷしろん

wsaEsxEaonvopEEzqcqsinyakaoqcznpussazjoeEyzeEvujzqEznznzjsfsivpExEjsuwEnyonmzxsasmycEaoqcEvyuzaysmycEusuijzyosnyczyvycEqiaaEnyuasfaEvvsmciwznoykvyznphEconpzjjhjzhjzhjzaoqcfEyaoqcEaussafEyussaEaznoqEvsqoEykonpEEpcEzpEpzymijjvuEEpzfzonvyzhaoqelzjjozpxoqEksiysmzvyEnksiavEzyhEjyznpysvEzynEbyysznEwEafEnqkEboyjoeEqazqeonflsaelEjjsaq

Συνεχίζει επιλέγοντας σしぐまαあるふぁνにゅー ζευγάρι τたうοおみくろん Ζぜーた νにゅーαあるふぁ τたうοおみくろん αντικαταστήσει μみゅーεいぷしろん τたうοおみくろん Τたう ή τたうοおみくろん Αあるふぁ κかっぱλらむだπぱい.. Μελετάει τたうηいーたνにゅー διγραμματική κατανομή.