(Translated by https://www.hiragana.jp/)
Δίλημμα του φυλακισμένου - Βικιπαίδεια Μετάβαση σしぐまτたうοおみくろん περιεχόμενο

Δίλημμα τたうοおみくろんυうぷしろん φυλακισμένου

Από τたうηいーた Βικιπαίδεια, τたうηいーたνにゅー ελεύθερη εγκυκλοπαίδεια

Τたうοおみくろん δίλημμα τたうοおみくろんυうぷしろん φυλακισμένου γνωστό παράδειγμα της θεωρίας τたうωおめがνにゅー παιγνίων. Μπορεί νにゅーαあるふぁ χρησιμοποιηθεί ως πρότυπο σしぐまεいぷしろん πολλές καταστάσεις τたうοおみくろんυうぷしろん πραγματικού κόσμου πぱいοおみくろんυうぷしろん αφορούν συμπεριφορές συνεργασίας. Μπορεί νにゅーαあるふぁ εφαρμοστεί σしぐまεいぷしろん καταστάσεις πぱいοおみくろんυうぷしろん δでるたεいぷしろんνにゅー ταιριάζουν απόλυτα τたうαあるふぁ κριτήρια τたうωおめがνにゅー κλασικών ή επαναληπτικών παιχνιδιών. Γがんまιいおたαあるふぁ παράδειγμα σしぐまεいぷしろん αυτά πぱいοおみくろんυうぷしろん θしーたαあるふぁ μπορούσαν κかっぱαあるふぁιいおた οおみくろんιいおた δύο οντότητες νにゅーαあるふぁ κερδίσουν σημαντικά οφέλη από τたうηいーた συνεργασία ή νにゅーαあるふぁ υποστούν τたうηいーたνにゅー αποτυχία αあるふぁνにゅー τたうοおみくろん πράξουν, αλλά θεωρούν αδύνατο ή δαπανηρό νにゅーαあるふぁ συντονίσουν τις δραστηριότητες τους γがんまιいおたαあるふぁ τたうηいーたνにゅー επίτευξη της συνεργασίας.

Τたうοおみくろん «δίλημμα τたうοおみくろんυうぷしろん φυλακισμένου» εξετάζει τις στρατηγικές επιλογές λογικά σκεπτόμενων παικτών πぱいοおみくろんυうぷしろん εμπλέκονται σしぐまεいぷしろん ανταγωνιστικές καταστάσεις.

Δύο άτομα συλλαμβάνονται από τたうηいーたνにゅー αστυνομία σしぐまαあるふぁνにゅー ύποπτοι διάπραξης κάποιων εγκλημάτων. Ηいーた αστυνομία δでるたεいぷしろんνにゅー έχει όλα τたうαあるふぁ απαιτούμενα στοιχεία γがんまιいおたαあるふぁ νにゅーαあるふぁ τους κατηγορήσει, οπότε τους βάζει σしぐまεいぷしろん χωριστά δωμάτια, εμποδίζοντάς τους νにゅーαあるふぁ έχουν οποιαδήποτε επικοινωνία. Οおみくろん εισαγγελέας επισκέπτεται κかっぱαあるふぁιいおた τους δύο, τたうοおみくろんνにゅー καθένα χωριστά, κかっぱαあるふぁιいおた κάνει σしぐまτたうοおみくろんνにゅー καθένα τたうηいーたνにゅー εξής πρόταση:

  • Αあるふぁνにゅー καταθέσει εναντίον τたうοおみくろんυうぷしろん άλλου (κかっぱαあるふぁιいおた οおみくろん άλλος δでるたεいぷしろんνにゅー μιλήσει) τότε ηいーた συνεργασία αμοίβεται μみゅーεいぷしろん άμεση απελευθέρωση, ενώ οおみくろん «άλλος» θしーたαあるふぁ τιμωρηθεί μみゅーεいぷしろん 12 χρόνια.
  • Αあるふぁνにゅー δでるたεいぷしろん μιλήσει ούτε αυτός ούτε οおみくろん άλλος θしーたαあるふぁ τιμωρηθούν κかっぱαあるふぁιいおた οおみくろんιいおた δύο μみゅーεいぷしろん 1 χρόνο φυλακή γがんまιいおたαあるふぁ ήσσονος σημασίας αδικήματα γがんまιいおたαあるふぁ τたうαあるふぁ οποία ηいーた αστυνομία έχει αποδείξεις.
  • Αあるふぁνにゅー καρφώσουν κかっぱαあるふぁιいおた οおみくろんιいおた δύο οおみくろん ένας τたうοおみくろんνにゅー άλλον τότε θしーたαあるふぁ τιμωρηθούν μみゅーεいぷしろん 4 χρόνια οおみくろん καθένας.
Πίνακας Φυλακισμένων
A / B Ομολογία Σιωπή
Ομολογία 4,4 0,12
Σιωπή 12,0 1,1

Πぱいοおみくろんιいおたαあるふぁ είναι ηいーた αναμενόμενη ορθολογικά «βέλτιστη» στάση τたうοおみくろんυうぷしろん καθενός αあるふぁπぱい’ τους κρατούμενους; ρωτάει ηいーた θεωρία παιγνίων.

Θυμίζουμε ότι «ορθολογισμός» γがんまιいおたαあるふぁ τους ειδικούς αυτού τたうοおみくろんυうぷしろん μοντέλου είναι νにゅーαあるふぁ κοιτάει οおみくろん καθένας τたうοおみくろん συμφέρον τたうοおみくろんυうぷしろん, δηλαδή είτε τたうοおみくろん μέγιστο όφελος είτε τたうηいーたνにゅー μικρότερη ζημιά τたうοおみくろんυうぷしろん, λαμβάνοντας υπόψη τたうοおみくろんυうぷしろん ότι κかっぱαあるふぁιいおた οおみくろん άλλος (οおみくろん «αντίπαλος»…) θしーたαあるふぁ κάνει τたうοおみくろん ίδιο. Πρόκειται γがんまιいおたαあるふぁ υπόθεση της ανάλυσης πぱいοおみくろんυうぷしろん αποδίδεται μみゅーεいぷしろん τたうοおみくろんνにゅー όρο "κοινή γνώση" (της ορθολογικότητας). Σύμφωνα λοιπόν μみゅーεいぷしろん τたうηいーたνにゅー θεωρία, οおみくろん κάθε κρατούμενους, ας πούμε οおみくろん Αあるふぁ κかっぱαあるふぁιいおた οおみくろん Βべーた, έχει τις πぱいιいおたοおみくろん κάτω επιλογές:

Μみゅーεいぷしろん δεδομένο ότι οおみくろんιいおた κανόνες είναι κοινοί κかっぱαあるふぁιいおた γがんまιいおたαあるふぁ τους δύο θεωρούμε ότι κかっぱαあるふぁιいおた οおみくろんιいおた δύο κάνουν τις ίδιες λογικές σκέψεις.

Σκέψη τたうοおみくろんυうぷしろん Αあるふぁ:

"Εάν οおみくろん Βべーた μみゅーεいぷしろん καταδώσει τότε τたうιいおた πρέπει νにゅーαあるふぁ κάνω; Στην περίπτωση πぱいοおみくろんυうぷしろん δでるたεいぷしろんνにゅー τたうοおみくろんνにゅー καταδώσω τότε εμπίπτω σしぐまτたうοおみくろんνにゅー 1οおみくろん κανόνα από αυτούς πぱいοおみくろんυうぷしろん μας έθεσαν, όντας οおみくろん ένοχος κかっぱαあるふぁιいおた θしーたαあるふぁ φυλακιστώ γがんまιいおたαあるふぁ 12 χρόνια, ενώ αあるふぁνにゅー τたうοおみくろんνにゅー καταδώσω εμπίπτουμε κかっぱαあるふぁιいおた οおみくろんιいおた δύο σしぐまτたうοおみくろんνにゅー 3οおみくろん κανόνα κかっぱαあるふぁιいおた θしーたαあるふぁ φυλακιστώ γがんまιいおたαあるふぁ 4. Μみゅーεいぷしろん συμφέρει λοιπόν νにゅーαあるふぁ τたうοおみくろんνにゅー καταδώσω."

...

" Εάν οおみくろん Βべーた δでるたεいぷしろんνにゅー μみゅーεいぷしろん καταδώσει τότε τたうιいおた πρέπει νにゅーαあるふぁ κάνω;Στην περίπτωση πぱいοおみくろんυうぷしろん τたうοおみくろんνにゅー καταδώσω τότε εμπίπτω σしぐまτたうοおみくろんνにゅー 1οおみくろん κανόνα κかっぱαあるふぁιいおた θしーたαあるふぁ απελευθερωθώ όντας οおみくろん αθώος πぱいοおみくろんυうぷしろん συνεργάστηκε, ενώ αあるふぁνにゅー δでるたεいぷしろんνにゅー τたうοおみくろんνにゅー καταδώσω εμπίπτουμε κかっぱαあるふぁιいおた οおみくろんιいおた δύο σしぐまτたうοおみくろんνにゅー δεύτερο κανόνα κかっぱαあるふぁιいおた θしーたαあるふぁ φυλακιστούμε κかっぱαあるふぁιいおた οおみくろんιいおた δでるたυうぷしろんοおみくろん 1 χρόνο. Πάλι μみゅーεいぷしろん συμφέρει νにゅーαあるふぁ τたうοおみくろんνにゅー καταδώσω."

Μみゅーεいぷしろん αυτές τたうιいおた λογικές σκέψεις τたうοおみくろんυうぷしろん οおみくろん Αあるふぁ ως homo economicus πぱいοおみくろんυうぷしろん ενδιαφέρεται πάντα γがんまιいおたαあるふぁ τたうοおみくろん μεγαλύτερο γがんまιいおたαあるふぁ αυτόν όφελος (σしぐまεいぷしろん αντίθεση μみゅーεいぷしろん τたうοおみくろんνにゅー homo reciprocans πぱいοおみくろんυうぷしろん κίνητρο τたうοおみくろんυうぷしろん αποτελεί τたうοおみくろん κοινό όφελος μみゅーεいぷしろん τたうοおみくろん περιβάλλον τたうοおみくろんυうぷしろん), αποφασίζει νにゅーαあるふぁ καταδώσει τたうοおみくろんνにゅー Βべーた διότι τたうοおみくろんνにゅー συμφέρει κかっぱαあるふぁιいおた στις δύο περιπτώσεις.

Ωστόσο κかっぱαあるふぁιいおた γがんまιいおたαあるふぁ τたうοおみくろんνにゅー Βべーた ισχύουν οおみくろんιいおた ίδιοι κανόνες μみゅーεいぷしろん συνέπεια νにゅーαあるふぁ καταδώσει κかっぱαあるふぁιいおた αυτός τたうοおみくろんνにゅー Αあるふぁ.

Προβλέπουμε λοιπόν ότι από αυτή τたうηいーた διαδικασία κかっぱαあるふぁιいおた οおみくろんιいおた δύο ορθολογικοί άνθρωποι πぱいοおみくろんυうぷしろん θέλουν τたうοおみくろん άμεσο ατομικό τους συμφέρον θしーたαあるふぁ τιμωρηθούν μみゅーεいぷしろん 4 χρόνια. Αあるふぁνにゅー συνυπολόγιζαν κかっぱαあるふぁιいおた τたうοおみくろん όφελος τたうοおみくろんυうぷしろん συγκατηγορούμενού τους ως δικό τους όφελος τότε θしーたαあるふぁ έβγαζαν τたうοおみくろん συμπέρασμα ότι τたうοおみくろん μεγαλύτερο όφελος πρέπει νにゅーαあるふぁ λογίζεται ώς συνολικό κかっぱαあるふぁιいおた είναι τたうαあるふぁ 2 χρόνια φυλάκισης (1 οおみくろん καθένας), σしぐまεいぷしろん σχέση μみゅーεいぷしろん τたうαあるふぁ 12 χρόνια (12 οおみくろん ένας κかっぱαあるふぁιいおた 0 οおみくろん άλλος) αλλά κかっぱαあるふぁιいおた τたうαあるふぁ 8 χρόνια (από 4 οおみくろん καθένας). Μみゅーεいぷしろん αυτό σしぐまτたうοおみくろん μυαλό, εάν κかっぱαあるふぁιいおた οおみくろんιいおた δύο ήταν homo reciprocans, τότε ηいーた στρατηγική συνεργασίας τους θしーたαあるふぁ ήταν νにゅーαあるふぁ μみゅーηいーたνにゅー καταδώσει οおみくろん ένας τたうοおみくろんνにゅー άλλο κかっぱαあるふぁιいおた νにゅーαあるふぁ λάβουν ποινή αあるふぁπぱいοおみくろん 1 χρόνο οおみくろん καθένας. Μέρος της ευθύνης της αστοχίας ορισμένων βραβευμένων κかっぱαあるふぁτたうαあるふぁ τたう' άλλα οικονομικών θεωριών, οφείλεται σしぐまτたうοおみくろん οおみくろんτたうιいおた οおみくろん άνθρωπος προσεγγίζεται ως έλλογο οおみくろんνにゅー (rational individual, ως homo economicus) κかっぱαあるふぁιいおた οおみくろんιいおた θεωρίες αυτές μόνο σしぐまεいぷしろん αυτή τたうηいーた βάση αναπτύσσονται. Από τたうηいーたνにゅー παραπάνω θεώρηση αποδεικνύεται οおみくろんτたうιいおた ηいーた συνεργασία μみゅーεいぷしろん τις αμοιβαία επωφελείς στρατηγικές είναι πολλές φορές πぱいιいおたοおみくろん δόκιμη από τたうηいーたνにゅー επιδίωξη γがんまιいおたαあるふぁ άμεσο ατομικό όφελος (1 χρόνος ποινή αντί 4 χρόνια).

Πρέπει νにゅーαあるふぁ πούμε ότι σしぐまεいぷしろん αυτό τたうοおみくろん παράδειγμα, όπως κかっぱαあるふぁιいおた σしぐまεいぷしろん κάθε κατάσταση (παίγνιο[1]) της θεωρίας παιγνίων (Game Theory), υποθέτουμε ότι οおみくろんιいおた εμπλεκόμενοι (οおみくろんιいおた παίκτες) είναι απόλυτα λογικοί κかっぱαあるふぁιいおた έχουν ως αποκλειστικό γνώμονα τたうηいーた μεγιστοποίηση τたうοおみくろんυうぷしろん κέρδους ή τたうηいーたνにゅー ελαχιστοποίηση τたうοおみくろんυうぷしろん κόστους (όπως σしぐまεいぷしろん αυτή τたうηいーたνにゅー περίπτωση). Θしーたαあるふぁ περίμενε ίσως κάποιος ότι δύο λογικοί άνθρωποι θしーたαあるふぁ επέλεγαν τたうοおみくろん βέλτιστο δυνατό αποτέλεσμα πぱいοおみくろんυうぷしろん θしーたαあるふぁ συνέφερε κかっぱαあるふぁιいおた τους δύο περισσότερο από αυτό πぱいοおみくろんυうぷしろん τελικά κατάφεραν, δηλαδή, νにゅーαあるふぁ κρατήσουν κかっぱαあるふぁιいおた οおみくろんιいおた δύο τたうηいーた σιωπή τους κかっぱαあるふぁιいおた νにゅーαあるふぁ πάνε σしぐまτたうηいーた φυλακή μみゅーεいぷしろん μみゅーιいおたαあるふぁ ποινή μόνο ενός έτους. Πώς κατέληξαν λοιπόν εδώ τたうαあるふぁ πράγματα; Ηいーた απάντηση βρίσκεται σしぐまτたうηいーたνにゅー εμπιστοσύνη πぱいοおみくろんυうぷしろん δείχνει οおみくろん ένας σしぐまτたうηいーたνにゅー απόφαση τたうοおみくろんυうぷしろん άλλου. Μみゅーεいぷしろん άλλα λόγια, μみゅーεいぷしろん δεδομένη κάθε επιλογή τたうοおみくろんυうぷしろん αντίπαλου παίκτη, τたうοおみくろん αποτέλεσμα τたうοおみくろんυうぷしろん ανταγωνισμού επικρατεί έναντι τたうοおみくろんυうぷしろん αποτελέσματος της συνεργασίας.

Τたうοおみくろん παραπάνω παράδειγμα καταδεικνύει ότι τたうοおみくろん «κοινό συμφέρον» δでるたεいぷしろんνにゅー είναι πάντα ηいーた επιλογή απόλυτα λογικά σκεπτόμενων ατόμων κかっぱαあるふぁιいおた πολλές φορές απόλυτα λογικά επιλογές μπορούν νにゅーαあるふぁ οδηγήσουν σしぐまεいぷしろん ζημία γがんまιいおたαあるふぁ όλους τους εμπλεκόμενους. Ηいーた κατάσταση αλλάζει αあるふぁνにゅー τたうοおみくろん παιχνίδι επαναλαμβάνεται, οπότε κάθε παίκτης έχει τたうηいーた δυνατότητα νにゅーαあるふぁ «τιμωρήσει» μέσω της επιλογής τたうοおみくろんυうぷしろん τたうοおみくろんνにゅー άλλο παίκτη γがんまιいおたαあるふぁ τたうηいーたνにゅー προηγούμενη παρασπονδία τたうοおみくろんυうぷしろん. Σしぐまεいぷしろん αυτή τたうηいーたνにゅー περίπτωση, όταν οおみくろんιいおた επαναλήψεις τたうοおみくろんυうぷしろん παιγνίου τείνουν σしぐまτたうοおみくろん άπειρο, ηいーた επιλογή της συνεργασίας (νにゅーαあるふぁ κρατήσουν κかっぱαあるふぁιいおた οおみくろんιいおた δύο τたうηいーた σιωπή τους) τείνει σしぐまτたうοおみくろん νにゅーαあるふぁ επικρατήσει.

Αあるふぁνにゅー όμως οおみくろんιいおた δύο ύποπτοι, μπορούσαν νにゅーαあるふぁ επικοινωνήσουν, θしーたαあるふぁ έβλεπαν ότι ηいーた καλύτερη λύση είναι ηいーた μみゅーηいーた ομολογία. Αλλά όπως αναφέρθηκε κかっぱαあるふぁιいおた πぱいιいおたοおみくろん πάνω δでるたεいぷしろんνにゅー αποκλείεται ηいーた πιθανότητα της προδοσίας. Όμως αあるふぁνにゅー οおみくろんιいおた δύο ύποπτοι έχουν ξαναέρθει αντιμέτωποι μみゅーεいぷしろん τたうοおみくろん συγκεκριμένο πρόβλημα , έχουν συνεννοηθεί κかっぱαあるふぁιいおた δでるたεいぷしろんνにゅー υπάρχει περίπτωση προδοσίας, τότε δでるたεいぷしろん θしーたαあるふぁ μιλήσουν. Αυτή ηいーた ισορροπία λέγεται “υπό-παιγνιακή τέλεια ισορροπία Νας”.

Ηいーた βέλτιστη στρατηγική γがんまιいおたαあるふぁ κάποιον παίχτη είναι νにゅーαあるふぁ κρατήσει τたうοおみくろん στόμα τたうοおみくろんυうぷしろん κλειστό σしぐまτたうοおみくろんνにゅー πρώτο γύρο κかっぱαあるふぁιいおた σしぐまτたうηいーたνにゅー συνέχεια νにゅーαあるふぁ επαναλαμβάνει αυτό πぱいοおみくろんυうぷしろん έκανε οおみくろん άλλος παίχτης σしぐまτたうοおみくろんνにゅー προηγούμενο γύρο. Ηいーた στρατηγική αυτή επικράτησε ώς καλύτερη, σしぐまεいぷしろん round-robin διαγωνισμό επινοήθηκε αあるふぁπぱいοおみくろん τたうοおみくろんνにゅー Ανατόλ Ράποπορτ, αποκαλείται "μία σしぐまοおみくろんυうぷしろん, μία μみゅーοおみくろんυうぷしろん" (TIT FOR TAT) κかっぱαあるふぁιいおた αποδεικνύεται μみゅーεいぷしろん γενετικούς αλγόριθμους.

Μεταφέροντας τたうοおみくろん παράδειγμα σしぐまτたうηいーたνにゅー καθημερινή ζωή μπορούμε νにゅーαあるふぁ βγάλουμε πολύ χρήσιμα συμπεράσματα γがんまιいおたαあるふぁ πράγματα πぱいοおみくろんυうぷしろん φαίνονται λογικό νにゅーαあるふぁ γίνουν αλλά τελικά επιλέγεται κάτι διαφορετικό πぱいοおみくろんυうぷしろん οδηγεί σしぐまεいぷしろん χειρότερα αποτελέσματα.

  1. «A Course in Game Theory». MIT Press. Ανακτήθηκε στις 4 Οκτωβρίου 2015.