Lý giải một nền tảng của Lý thuyết trò chơi: Cân bằng Nash
John F. Nash Jr. nổi tiếng vì những tiến bộ trong lý thuyết trò chơi, vốn chủ yếu là việc nghiên cứu cách thức xây dựng một chiến lược thắng lợi trong trò chơi của cuộc sống — đặc biệt khi không biết được những gì đối thủ mình đang làm và những lựa chọn thì không phải lúc nào cũng đầy hứa hẹn.
John F. Nash Jr. tại một buổi lễ vào tuần trước tại Oslo, Na Uy, nơi ông đã được trao giải thưởng Abel Prize. CreditBerit Roald/ NTB SCANPIX
Tiến sĩ Nash không phát minh ra lý thuyết trò chơi; nhà toán học John von Neumann là người tiên phong thiết lập lãnh vực này trong nửa đầu thế kỷ 20. Nhưng Tiến sĩ Nash đã mở rộng phân tích xa hơn, kiểu trò chơi tổng bằng không, “tôi thắng bạn thua” thành những tình huống phức tạp hơn, trong đó mọi người chơi đều có thể thắng, hoặc mọi người chơi đều có thể thua.
Khái niệm trung tâm là cân bằng Nash, được định nghĩa đại thể là một trạng thái ổn định, trong đó không có người chơi nào có thể đạt được lợi thế qua việc đơn phương thay đổi chiến lược, giả định rằng những người chơi khác không thay đổi những gì họ đang làm.
Bộ phim “A Beautiful Mind (Trí tuệ hoàn hảo)”, dựa trên cuộc đời của tiến sĩ Nash, nỗ lực giải thích lý thuyết trò chơi trong một màn mà Russell Crowe, đóng vai Tiến sĩ Nash, ở trong một quán bar với ba người bạn, và mọi người đều bị mê mẩn bởi một cô gái tóc vàng xinh đẹp, bước vào quán với bốn người bạn tóc nâu khác.
Trong khi bạn bè ông bông đùa về việc ai trong số họ sẽ tán tỉnh được cô gái tóc vàng, thì Tiến sĩ Nash lại kết luận rằng họ phải làm điều ngược lại: Hãy quên cô ta đi. “Nếu tất cả chúng ta đều quan tâm đến cô gái tóc vàng,” ông nói, “chúng ta sẽ cản trở lẫn nhau và không một ai trong chúng ta sẽ tán được cô ấy. Vì vậy, chúng ta sẽ chuyển qua tán tỉnh bạn bè của cô ấy, nhưng tất cả các cô ấy sẽ lạnh nhạt với chúng ta bởi vì không ai thích mình là sự lựa chọn thứ hai. Nhưng điều gì sẽ xảy ra nếu không ai quan tâm đến cô gái tóc vàng? Chúng ta không cản trở lẫn nhau và chúng ta cũng không xúc phạm các cô gái khác. Đó là cách duy nhất để giành chiến thắng”.
Trong khi một điều như trên không bao giờ xảy ra trong cuộc sống thực minh họa cho một số mưu đồ được các nhà lý thuyết trò chơi xem xét, thì trường hợp trên không phải là một ví dụ về cân bằng Nash.
Một ví dụ đơn giản hơn là cái được gọi là Thế lưỡng nan của tù nhân. Hai nghi phạm trong một vụ án phạm tội bị bắt giữ và được đề nghị một thỏa thuận: “Nếu bạn khai ra và làm chứng chống lại tòng phạm, thì chúng tôi sẽ thả bạn và quy tội cho bạn kia — 10 năm tù giam”.
Nếu cả hai đều giữ im lặng, thì các công tố viên không thể chứng minh được những cáo buộc nặng hơn và cả hai sẽ bị kết án một năm tù giam về một hành vi phạm tội không nghiêm trọng bằng. Nếu cả hai cùng khai, thì các công tố viên sẽ không cần đến bằng chứng của họ, và cả hai sẽ bị kết án tám năm tù giam.
Thoạt nhìn, giữ im lặng dường như là chiến lược tốt nhất. Nếu cả hai đều làm như vậy, thì cả hai sẽ có cơ hội được giảm tội khá nhẹ.
Nhưng tính toán của cân bằng Nash cho thấy cả hai có nhiều khả năng sẽ thú tội.
Kiểu vấn đề này được gọi là trò chơi bất hợp tác, có nghĩa là hai tù nhân không thể truyền đạt được ý định cho nhau. Khi không biết được những gì mà tù nhân khác làm, thì từng người phải đối mặt với lựa chọn sau: Nếu thú tội, thì có thể được tự do hoặc bị kết án tám năm tù giam. Nếu giữ im lặng, thì bị kết án một năm hoặc 10 năm tù giam.
Với suy nghĩ đó, thì thú tội là lựa chọn tốt hơn. Và nếu biết rằng tù nhân khác có cùng động lực để thú tội, thì lựa chọn giữ im lặng sẽ ít có khả năng xảy ra.
Ngoài ra, thay đổi chiến lược sang thành giữ im lặng sẽ là một một bước đi xấu — ở tù lâu hơn — trừ khi tù nhân khác bằng cách nào đó cũng làm điều tương tự. Nếu không truyền thông được với nhau, đó sẽ là một phỏng đoán mang tính rủi ro cao, và do đó, chiến lược này biểu trưng một cân bằng Nash.
Tuy nhiên, trường hợp ở quán bar thì không phải vậy. Với bốn người đàn ông theo đuổi bốn cô gái tóc nâu, thì thay vì làm vậy bất kì người đàn ông nào cũng có thể bị cám dỗ để theo đuổi cô gái tóc vàng, một kết quả đáng mong muốn hơn nếu bạn bè của người ấy cũng không thay đổi chiến lược.
…………………………
Theo KENNETH CHANG (Huỳnh Thiện Quốc Việt dịch)
Nguồn: phantichkinhte123.com, ngày 28/05/2015
Tham khảo thêm:
>>Cân bằng Nash