본문 바로가기
information arch.

게임 이론을 통해 본 게임 구조에 대한 이해

by 늙은소 2013. 9. 27.

+ 이 글은 2013년 5월 7일 작성되었습니다.
[더 지니어스]를 2회까지 본 상태에서 쓴 글이라 방송에 대해 잘못 판단한 부분이 있을 수 있습니다. 방송을 다 본 뒤 생각이 달라진 부분도 있습니다만, 이 글 나름의 이야기하고자 하는 바가 있어 글을 수정하지 않고 올립니다.

게임 이론을 통해 본 게임 구조에 대한 이해
(부제 : 더 지니어스 2회까지의 감상)




01.
전략적 결정에 대해 분석하는 것을 게임 이론이라 한다. 여기서 게임은 전략을 유발하게 하는 조건을 의미하며, 게임 참가자들은 주어진 조건과 참여자 사이의 상호작용을 고려해 전략을 수립하게 된다. ‘게임 이론을 이야기할 때 종종 이야기되는 몇 가지 사례들을 검토하다 보면 몇 가지 공통 사항을 발견할 수 있다. (1)게임은 제한된 공간과 시간 속에서 진행되며, (2)참가자들은 비슷한 수준의 판단력을 지니고 있고 (3)각자 자신에게 최대 이익이 되는 방향으로 결정을 내린다는 것이다.

그 때문에
게임 이론 안에서는 참가자의 개성이나 특징은 무시되며, 참가자는 주어진 조건이 동일할 때 같은 선택을 할 것으로 가정된다. 개인의 감정적 요소나, 판단 능력의 차이와 같은 변수가 끼어들 여지를 전제하지 않는다는 점으로 인해, 게임 이론에서의 예측은 실제와는 차이가 멀다 할 수 있다. (미워하는 참가자가 우승하는 것을 막기 위해 자신이 손해 보는 결정을 내린다거나, 이성에게 잘 보이기 위해 대신 져 주는 일 따위의 가정은 게임 이론에서 용납되지 않는다.)

 

02.

게임 이론으로 가장 유명한 사례로 [죄수의 딜레마]가 있다.



[그림 01]을 보자. 은행강도로 현장에서 잡혀 온 A B는 각자 격리되어 경찰에게 심문을 받는 중이다. 경찰은 이들이 은행 강도 사건의 공범이라는 증거를 가지고 있으나, 다른 범죄에 대해서는 심증만 있을 뿐 물증을 확보하지 못한 상태다. 이들이 끝까지 무죄를 주장할 경우 현재 증거가 확보된 범죄에 대해서만 형을 받으며, 두 사람 모두 3년 형을 살게 된다. 그러나 다른 범죄에 대한 범인이 이들임이 밝혀진다면 두 사람은 각각 10년 형을 살아야 한다. 경찰이 확보한 증거가 불충분하다는 것을 알고 있으므로 경찰이 밝히지 못한 죄를 이들이 나서서 자백할 까닭은 전혀 없다. 그런데 경찰 C’가 두 사람에게 각각 한 가지 제안을 한다면 어떨까? 당신이 다른 죄를 인정하고 공범이 누구인지 밝힌다면, 먼저 자백한 사람에 한해 감형을 해 주겠다고 설득하는 것이다. 뿐만 아니라 자백을 하지 않고 끝까지 버텼는데 다른 공범이 배신하여 자백한다면, 버틴 사람 혼자 25년 형을 받을 수 있다고 협박 한다면?

(동료를 팔아 넘긴 사람은 감형을 받을 수 있지만, 홀로 끝까지 버티는 사람은 중형을 받는 구조)

 

내가 A의 입장이라면 어떨까?
경우에 따라 나는 25년 형을 받거나 10년 형, 혹은 3년 형이나 1년 형을 받을 수도 있다.

[
죄수의 딜레마]에서 용의자 A가 받을 수 있는 처벌은 총 4가지이다. 그러나 A에게 이 네 가지를 선택할 권리는 없으며, A가 내린 결정의 결과는 B가 무엇을 선택했는가에 영향을 받아 달라지게 되어 있다. A 1년 형을 살고 싶다고 해서 1년 형을 받을 수 있는 건 아니며, 25년 형을 살고 싶다고 해서 25년 형을 살게 되는 것도 아니다. 결국 내가 결정할 수 있는 것은 두 가지뿐이다. 1년 형을 살 가능성에 도박을 거는 심정으로 자백을 하거나(1) / 상대인 B가 자신을 배신하지 않을 것으로 믿으며 자백을 하지 않고 무죄를 주장해 3년 형을 받기를 바라는 것(2). 하지만 (1-자백)을 선택했을 때의 결과 가능성이 1년 또는 10년 인 것에 반해, (2-무죄주장)의 결과는 3년 또는 25년 형이다. 가능성만 놓고 본다면 자백하는 것이 무죄를 주장하는 것 보다 안전하다는 생각을 하게 될 수밖에 없다. 결국 A는 스스로 자백을 하기로 결정한다. 마찬가지 논리로 B역시 자백을 한다.

 

A B의 복역 기간을 합산해 이 결정을 평가한다면 두 사람에게 가장 유리한 결과는 이들이 끝까지 무죄를 주장하는 것이다. (두 사람의 복역 기간 가능성을 합산하면 20년 / 26년 / 26년 / 6년이다.) 그러나 결정적으로 A B를 믿을 수 없기 때문에 자백을 하고, 마찬가지로 B 역시 A를 믿을 수 없기 때문에 자백하는 길을 택한다. 그 결과 두 사람에게는 각각 10년 형이 언도된다. 경찰이 지닌 증거로는 3년으로 충분했을 것이, 이들이 서로를 믿지 못하여 자백한 탓에 10년 형으로 늘어난 셈이다. [그림 02]

 

[죄수의 딜레마]에는 이런 특징이 있다. 게임 참가자들이 자신의 이익이 최대가 되도록 절대우위 전략을 취하면 취할수록, 그 결과는 오히려 손해를 보게 되는 것.

그렇다면 왜 이런 결과가 나오는 것일까?

 

03.

[죄수의 딜레마]에서 간과하기 쉬운 것은 게임 참여자가 과연 누구인가 라는 점이다. ‘용의자 A’는 경찰의 제안을 받고 고민에 빠졌을 것이다. 끝까지 무죄를 주장하는 것이 두 사람 모두에게 유리한 결정임을 알고 있지만, B가 자신을 배반한다면 혼자 25년 형을 받게 될 것이기 때문이다. A는 결정하기에 앞서 B가 어떤 결정을 내릴 것인지 추론해 본다. 그 결과 B가 자백할 가능성이 높다고 판단해 무죄를 주장하려던 자신의 입장을 철회한다.

이런 점 때문에 [죄수의 딜레마][그림 02]에서처럼 A B 사이의 두뇌싸움으로 이해되곤 한다. 그러나 사실 [죄수의 딜레마] 3자 구도로 이루어진 게임이다. 게임 참가자는 용의자인 A B, 그리고 이들에게 조건을 내민 경찰 C’이다. 경찰이 게임에 참여함으로써 A B는 경쟁 관계에 놓이게 되었고, 상대의 전략을 간파하기 위해 노력한 결과 오히려 자신에게 불리한 결정을 내리게 된 것이다. 이들이 서로를 믿지 못하게 만든 것은 경찰이 제시한 자백하면 감형을 해 준다는 조건이다. A B를 대립 관계로 만듦으로써 가장 큰 이익을 보는 것은 경찰이며, 이 게임의 승자 역시 경찰이라는 것이다. 그렇다면 경찰은 게임에서 어떻게 승리하게 된 것일까?

 



[
그림 03]을 보자.

경찰의 전략이 성공을 거둘 수 있었던 결정적 원인은 제안의 내용정보 통제에 있다. A B가 서로 만나 합의하지 못하도록 철저하게 이들을 격리시키는 것. 그리고 A B를 협력관계가 아닌 대립 관계로 만듦으로써 양측이 출혈 경쟁을 하도록 한 것이 경찰의 전략이었던 셈.

 

이와 비슷한 사례로 [카드 사모으기] 게임이 있다. [그림 04] 참고.


똑 같은 모양의 파란색 카드 50장을 50명의 사람에게 한 장씩 나누어 준 뒤 이들을 방안에 가두고, 녹색 카드 50장을 가지고 있는 한 사람(A)이 들어가, 카드를 사 모아 오는 게임이다. 카드를 사 모은 뒤 A는 방 밖으로 나올 수 있으며, 파란색과 녹색 카드 2장을 하나의 세트로 만들어, 1set 10만원을 받고 팔 수 있다. 만약 A 50명으로부터 카드 50장을 모두 사게 된다면 그는 총 50set( 100)의 카드를 확보하며, 이것을 C에게 500만원(50setx10만원)에 팔게 된다. 방 안의 50명이 이 사실을 알고 있다고 할 때 – 1set 10만원의 가치가 있음을 - 50명의 사람은 자신의 카드를 얼마에 팔게 될까?

 

A가 아니면 카드를 팔 곳이 없으므로 단 1원이라도 받고 팔아야 할까? 하지만 이것은 A도 마찬가지다. 사람들로부터 카드를 구입하지 못하면 A의 카드 역시 무용지물이 된다. 거래 실패 건당 10만원의 손해를 보게 되는 것. 50명의 사람들은 A에게 카드를 팔지 않을 경우 A역시 손해를 본다는 것을 알고 있기 때문에 1원보다는 높은 가격으로 카드를 팔려 들 것이다. 거래가 성사되지 않으면 양측 모두 손해를 보는 상황이라 카드 판매액은 10만원의 절반인 5만원으로 조정된다. , 파란색과 녹색 카드 모두 1장당 5만원의 가치로 평가되는 셈. 그에 따라 50명의 사람은 각각 5만원을 벌고, A 250만원을 지출해 카드 50장을 산 다음 100장의 카드를 500만원에 팔게 되어 250만원의 이득을 챙긴다. 50명의 사람과 A가 벌어들인 이득의 차이는 크지만, 애초에 가지고 있던 카드의 수가 다르고 카드 한 장의 가치는 5만원으로 양쪽이 모두 동일하기 때문에 이것은 공정한 거래다.

 

그런데 여기서 예상하지 못한 사건이 하나 벌어진다면 어떨까? A가 방 안에 들어와 50장의 카드 중 하나를 꺼내 사람들이 보는 앞에서 불에 태우는 것이다. 이제 A가 가진 카드는 49장이고, 그가 사야 할 카드 역시 49장이다. 50명의 사람 중 한 명은 A에게 카드를 팔지 못하는 상황이 된 것. A의 행위로 인해 게임은 바뀌었고, 50명의 사람들은 경쟁 관계에 놓인다. A에게 자신의 카드를 팔기 위해 50명의 사람들은 스스로 카드 값을 낮추게 될 것이며, 5만원이던 카드의 가격은 끝 없이 하락한다. (무한 경쟁이 펼쳐진다면 카드 판매액은 1원이 될 수도 있다) 1장의 카드를 불에 태움으로써 A 50set의 카드를 완성하지 못하게 되었으나 대신 49장의 카드를 이전보다 낮은 가격으로 구매하게 되어 지출이 줄어들었고, 결과적으로는 이전보다 높은 이익을 거두게 된다. A가 가진 카드와 50명이 가진 카드의 가치 균형이 깨지기 때문에 이것은 불공정한 거래라 할 수 있다.

 

대부분의 시장이 이런 시스템으로 이루어져 있다.

우리가 살고 있는 시장은. 자신의 카드를 팔기 위해 서로 경쟁하는 50명의 게임이 아니다. (죄수의 딜레마가 서로 눈치를 보는 A B만의 게임이 아닌 것처럼)

50명을 서로 경쟁하게 만든 숨겨진 존재 A에 의해 시장은 이끌려 간다.

 

전략적 사고에서 중요한 것은 내가 누구와 경쟁하고 있는가가 아니다. 게임에 참여(관여)하고 있는 전체 참가자가 누구이며, 경쟁 관계를 만들고 있는 사람과 그러한 관계를 통해 실질적인 이익을 얻는 사람은 누구인지 파악하는 능력을 키우는 것이 우선되어야 한다.

 

04.

그렇다면 죄수의 딜레마에서 A B가 경찰 C의 전략으로부터 벗어날 방법은 없을까?

이런 스토리를 상상해보자. 경찰 C가 사실은 연쇄 살인범이며 자신이 저지른 죄를 마침 잡혀 온 은행강도 A B에게 덮어씌우기 위해. 그들을 이간질 해 거짓 자백을 받아 내려는 계획이라면?

3년 형을 살아야 할 두 사람이, 1년 형을 살게 해 준다는 경찰 C의 꼬임에 넘어가 자신이 짓지도 않은 죄를 자백하게 할 가능성이 있지 않는가 말이다.

 

[죄수의 딜레마] [카드 사모으기]의 속성에는 이런 함정이 숨어 있다.
협력 관계에 있던 집단에 갈등을 조장해 그로부터 이익을 취하는 전략이라는 것.
그러므로 이런 전략에 대한 대안을 생각해 볼 필요가 있다.

 

첫 번째로 생각할 수 있는 대안은 협력 관계를 재구축하는 것이다. [그림 05]


격리 수용되어 있는 A B가 어떤 식으로든지 의사소통을 하여 계속 무죄를 주장할 것을 확인하는 과정을 거친다거나. 상대가 절대 배신할 수 없도록, 예를 들면 양측 모두 일종의 인질을 잡아 둔다거나.. 혹은 상대의 약점을 교환하는 형태로의 강제 연대를 구상할 수도 있다. (서로의 몸을 묶은 뒤 전쟁에 뛰어드는 격)

 

두 번째 방안으로 3자 대립 관계를 4자 대립으로 확장시키는 방법이 있다. [그림 06]


즉 경찰 C를 견제할 새로운 대상 D를 유입하는 것으로, ‘적의 적은 동지라는 개념을 여기서 생각할 수 있다.

그렇다면 D는 누구일까? 상황에 따라 D는 어느 누구도 될 수 있다. 경찰 C와 사이가 좋지 않은 다른 경찰이 될 수도 있으며, 경찰 C의 제안이 부당한 결과를 불러일으킬 수 있음을 퍼트려 줄 기자나 언론사가 될 수도 있다. 이렇게 될 경우, 경찰 C는 자신을 견제하는 D를 제거해 게임을 3자구도로 다시 환원시키거나, D를 견제할 또 다른 대상 E를 끌어들여 게임을 5자 구도로 바꾸는 방안을 강구할 수도 있다.

낯선 이야기 같은 경찰과 죄수 사이의 딜레마는, 때에 따라 회사와 노조의 관계가 될 수도 있으며 건설사와 철거 대상자 사이에서 벌어지는 이야기가 되기도 한다.

 

05.

용의자 AB가 경찰 C와의 전략 게임에서 이기기 위해 필요한 것이 연대를 재구축하는 일인 것처럼. 카드 판매 사례에서도 50명의 사람은 카드를 헐값에 넘기지 않는 방법을 찾아내는 게 가능하다.

 

첫 번째 방안은 50명의 사람 중 한 명의 협상 대표자를 선발해 그로 하여금 50장의 카드를 대신 팔게 하는 것이다. 이제 거래는 A대표자사이의 1 1 거래가 되고, 게임은 원점으로 돌아간다. ‘대표자에게서 49장의 카드를 사지 못한다면 A의 카드 49장 역시 휴지가 되므로 그는 이제 카드 가격을 깎을 수 없게 된다. 카드의 가격은 다시 5만원으로 올라가고, ‘대표자 A에게 49장의 카드를 245만원에 판 다음, 이것을 50명이 나눠갖는다. (각자에게 4 9천원이 돌아감)

 

두 번째 방안은 50명의 사람이 모여 한 명의 희생자를 결정하는 것이다. A가 불에 태운 한 장의 녹색 카드 때문에 50명이 가진 파란색 카드 가격이 하락하게 되었으니, 수요와 공급을 맞추기 위해 50명 역시 한 장의 카드를 제거하는 것. 이전까지는 거래를 하지 못하는 한 명을 결정하는 것이 A였으므로, 50명이 서로 경쟁을 하여 가격이 떨어질 수밖에 없었다. 그러나 그 결정을 A에게 넘기지 않고 50명이 스스로 결정한다면, 파란색 카드의 가격 유지가 가능해진다.

 

1번안과 2번안의 차이는 사실 그리 크지 않다. 50명 모두가 천원의 손해를 보며 4 9천원씩 나눠 가질 것이냐. 아니면 49명이 5만원을 버는 대신 한 명이 아무 것도 가지지 않느냐의 차이일 뿐이다.
(전체가 약간의 손해를 나눠 짊어질 것이냐, 한 명을 희생자로 만들 것이냐의 문제)

 

06.

tvN에서 방영된 프로그램 [더 지니어스]에서도 우리는 이런 구조를 읽을 수 있다.

13인의 출연자로 시작한 이 프로그램에는 13명의 참가자 외에도 게임 주최자인 제작진이 게임에 참여하고 있다. 협력 관계에 있던 A B를 대립 관계로 만들었던 경찰 C처럼. 이 프로그램에서 제작진은 13인이 서로 의심하고 경쟁하도록 만들 뿐 아니라, 게임의 룰을 결정하고 상금을 제시하는 역할을 하고 있다. 워낙 전지전능한 참가자라(게임의 룰을 정할 뿐 아니라 편집권 등 모든 권한을 지니고 있다는 점에서) 13인의 출연자가 제작진을 이기는 것은 요원해 보인다.

 

그러나 앞서 이야기한 사례에서처럼 13인이 협력 관계를 형성할 수 있다면 제작진을 이기고, 그들로부터 상금 액수를 높이도록 만드는 전략을 세우는 것도 가능하다. 특히 방송된 게임 중에는 룰에 허점이 있어 전원이 공동우승 하는 것도 가능한 케이스가 있어, 데스매치 진행이 불가능한 상황이 펼쳐질 수도 있었다그러나 이렇게 될 경우, 방송도 안 되거니와 프로그램 자체가 성립되지 않는다는 문제가 있다. (물론 이런 경우가 발생하면 제작진은 다른 게임을 제시하거나 새로운 룰을 주어 어떻게든 탈락자를 선정했을 것이며, 문제가 된 장면을 편집 해버리는 것도 가능하다)

 

여기서 중요한 것은 [더 지니어스] 출연자는 일반인이 아니며, 이들은 상금을 목표로 하지 않는다는 점이다. 정도의 차이는 있으나 이 방송의 출연자들은 모두 자신의 분야에서 어느 정도 성공을 거둔 사람들이며, 높은 출연료를 받는 방송인들이 상당수 포함되어 있다. 그 때문에 이들이 전략을 세울 때 우승을 최우선으로 고려하지 않을 가능성이 존재한다. 그 보다는 오히려 제작진과의 좋은 관계 유지가 목표가 되기 쉽다는 것. 뿐만 아니라 어떤 참가자들은 우승보다 프로그램의 성공을 통해 자신의 인지도를 높인다거나, 시청자들의 반응 같은 것을 더 신경 쓸 수도 있다. 물론 매회 탈락자를 선발하는 특성상 상당수의 출연자들은 탈락을 하지 않으면서도 연예인으로서의 이미지를 훼손시키지 않는 범위에서의 적절한 전략을 수행하기도 한다. [그림 07]

 

앞서 언급한 [죄수의 딜레마]에서 동일한 조건이 주어졌다 하더라도 대립 구도가 2강 체제인가 3자 구조인가에 따라 전혀 다른 결과가 나옴을 확인할 수 있었다. 2 4 구조일 때와 3 혹은 5 구도일 때, 게임의 진행은 반대 양상으로 펼쳐 진다. 그렇기 때문에 게임의 구조를 분석하고 평가함에 있어 전략뿐 아니라 게임의 결과에 영향을 끼치는 관여자 모두를 이해하는 것이 선행되어야 한다.

 

07.

[게임 이론]에서 게임의 결과에 결정적인 영향을 끼치는 또 하나의 요소로 정보 통제권이 있다.

A B가 동시에 가위바위보를 하면 A B가 무엇을 낼 지 모르는 상태에서 결정을 하게 된다. 하지만 B에게 가위바위보중 하나를 먼저 내게 한 뒤, A에게 그것을 알려 주고 가위바위보를 하게 한다면 어떻겠는가? 게임은 당연히 정보를 획득한 A의 승리로 돌아간다.

 

가위바위보처럼 상대에 대한 정보 없이 동시에 결정하는 게임을 [동시진행게임]이라 하며, 상대의 정보를 확인한 뒤 결정하는 게임을 [교차진행게임]이라 부른다. [교차진행게임]의 대표적인 예로 바둑이나 체스같은 경기를 떠올리면 이해가 쉽다. 상대의 패나 전략을 보고 나의 전략을 결정하는 형태의 게임이 바로 [교차진행게임]이다. 상당수의 게임은 [동시진행게임] [교차진행게임]이 혼재되어 있다. ‘스타크레프트와 같은 게임을 예로 들자면, 상대 진영이 몇 시 방향에 있는지 전혀 모르는 상태로 전략을 수립하기도 하지만, 탐색을 통해 상대 진영의 위치와 자원 개발 상태, 상대가 건설 중인 건물 등을 파악한 뒤 내 전략을 수정하기도 한다.

 

앞서 언급한 가위바위보와 반대의 경우를 상상해 보자. 교차 진행으로 해야만 하는 게임에서 룰은 그대로인데 진행만 동시진행으로 변경한다면 어떨까? 상대는 내가 둔 바둑알의 위치정보를 즉시 확인할 수 있으나, 나는 상대가 바둑알을 어디에 두었는지 바로 알지 못한다면 말이다. 정보가 어디서 어떻게 통제되는가에 따라 게임의 결과는 달라질 수밖에 없고. 정보통제권을 지닌 사람이 의도한 바에 따라 게임은 특정인에게 유리하게 작용하게 된다.

 

[더 지니어스]에서 제작진의 정보 통제권은 출연자 전원에게 동등하게 작용하지 않을 때가 많으며, 동시 진행 해야 할 게임을 교차 진행하는 등, 특정인에게 유리하게 작용하는 경우도 제법 발견할 수 있다. (대표적인 것이 가위바위보 연승게임이다) 특히 이 프로그램의 경우, 제작진이 제시하지 않은 정보를 알아서 찾아내거나, 딜러에게 문의하여 세부 정보를 얻는 사람이 유리하도록 게임을 구성함으로써, ‘정보를 획득하는 능력자체가 참가자의 경쟁력이 되는 구조가 되었고, 그것은 이 프로그램이 지닌 강점이자 약점이기도 하다.

 

이런 특성으로 인해 시청자의 역할은 게임의 진행을 관망하는 역으로 축소되었다. 제작진 측에서는 여러 경로를 통해 사전에 다음 회의 메인 매치 룰을 공개해 주는 형식으로 시청자의 관심을 끌어들이려 노력했으나, 시청자는 세부 룰을 알 수 없으며 딜러에게 찾아가 자세한 규칙을 확인하는 것 역시 불가능할 수밖에 없다. 정보 획득 능력에 있어서 시청자는 소외되어 있으며, 그러다 보니 숨겨진 룰을 찾아내 자신만의 전략을 세우는 것이 가능한 출연자의 능력에 감탄하는 것으로 시청자의 역할은 제한되었다. 이런 부분으로 인해 방송을 보며 가끔은 답답하다는 생각을 하게 되었던 것 같다. 뿐만 아니라 게임의 룰이 고정적이어야 그 룰의 허점을 파고드는 전략을 세울 수 있는데, 출연자들이 그런 전략을 세우지 못하도록 제작진이 언제든 게임 룰을 바꿀 수 있다는 전제가 깔려 있다 보니 아쉬움이 남는다.