게임이론이 TCR 설계에 어떤 도움을 줄 수 있을까요?

by | Jan 29, 2019

실제 암호경제학 설계에 게임 이론을 적용하는 법

Source: Unsplash.com

서론

블록체인은 단순히 뛰어난 아이디어나 구현만으로 이루어지는 것이 아닙니다. 블록체인 프로젝트가 성공적으로 돌아가기 위해서는 암호경제 모델 역시 신중히 설계해야 합니다. 왜냐하면 결국 블록체인은 참가자들에 의해 돌아가고, 참가자들은 바로 이 경제 모델에 따라 행동하기 때문입니다.

그런데 사실 경제 모델이 잘 설계 되었는지는 초기 단계에 판단하기 어렵습니다. 왜냐하면 경제 모델에 대한 평가는 실제 참가자들이 네트워크에 참여하여 이를 돌려봐야 알 수있는 결과론적인 것이기 때문입니다.

초기 단계에서, 암호경제 설계자들은 실제로 결과가 어떻게 될지는 모르지만 최대한 최선에 가까운 방안을 도출해야 합니다. 이 때 도움이 되는 것이 게임이론입니다. 게임이론은 합리적인 참여자들의 의사결정에 관한 학문으로, 네트워크의 참가자들이 어떻게 행동할지에 대해서 예측할 수 있는 힘을 제공합니다.

암호경제 설계자라면 게임 이론을 바탕으로 참가자들의 행동에 대해 반드시 이해해야 합니다. 이 글에서는 먼저 게임이론의 기초 개념을 살펴봅니다. 그리고 게임이론이 실제 암호경제학 설계에 어떻게 적용되는지 알아보고자 합니다. 특히 파라미터를 통해 경제 모델을 자유롭게 설계할 수 있는 TCR 메커니즘에 게임이론을 적용해보면서 게임이론이 암호경제학에 어떤 예측력을 제공하는지 살펴보겠습니다.


목차

1. 게임이론이란 무엇인가요?

2. Token Curated Registry 메커니즘

3. TCR 메커니즘의 게임이론적 설계

4. 맺으며

1. 게임이론이란 무엇인가요?

합리적인 주체들의 의사결정에 관한 학문, 게임이론

이 장에서는 그래서 게임이론이 뭔데? 라고 물으시는 분들을 위해서 간략하게 게임이론에 대해 설명해보겠습니다. 먼저, 게임이란 합리적인 주체들이 각자 최선의 효용을 얻기 위해 벌이는 행위를 말합니다. 그리고 게임이론은 각 주체들의 의사결정을 분석하여 게임의 결과를 예측하는 학문입니다.

게임을 구성하는 요소들: 경기자, 행동전략, 결과와 보수

게임을 구성하는 요소로는 경기자, 행동 전략, 보수가 있습니다. 간단한 게임을 예로 들어 게임이론의 구성요소를 설명해보겠습니다.

버튼게임

“ 버튼 게임의 주최자는 철수와 영희에게 각각 (R,L), (U,D)가 적힌 버튼들을 나누어 줍니다. 주최자가 지금! 이라고 말하는 순간, 철수와 영희는 동시에 두개의 버튼 중 하나를 눌러야 합니다. 누른 버튼의 결과에 따라 경기자들의 상금은 달라집니다. 예를 들어, 만약 철수가 R을 눌렀을 때 영희가 U를 누르면 두 경기자모두에게 2만원이 상금으로 돌아갑니다. ”

경기자

게임에 있어서 경기자란 의사결정의 주체를 말합니다. 게임이론에서는 모든 경기자들이 합리적인 주체라고 가정합니다. 합리적인 주체란 가능한 모든 상황과 전략을 고려하여 자신의 보수를 계산하고, 철저히 그 보수에 의해서만 의사결정을 내리는 주체를 말합니다. 위의 버튼 게임의 예에서 경기자는 철수와 영희 입니다.

행동 전략

경기자가 선택할 수 있는 대안들을 행동전략이라고 합니다. 위의 예에서, 철수의 행동전략은 R 버튼, 혹은 L 버튼을 누른다이고, 영희의 행동전략은 U 버튼, 혹은 D 버튼을 누른다입니다.

결과와 보수

게임의 결과란 모든 경기자들이 전략을 선택함으로써 실현되는 최종적인 상태를 뜻합니다. 보수란 게임의 결과에 따른 금액 혹은 효용입니다. 버튼게임의 결과에 따른 보수를 2 x 2 행렬로 나타내 보겠습니다.

특이한 점은, 경기자들은 자신의 선택 뿐 아니라 상대방의 선택에 따라서 자신의 보수가 바뀐다는 점 입니다. 예를 들어, 철수가 R을 누른다고 해서 매 번 2만원의 상금을 받는것이 아니라 영희가 U를 눌러주어야 2 만원의 효용을 받을 수 있습니다. 따라서 경기자들은 상대방의 행동 전략까지 모두 고려하여 자신의 이익이 최대화 되는 결정을 내려야 합니다.

합리적인 게임의 결과, 게임의 해

그렇다면 철수와 영희가 합리적인 경기자라면 결국 어떤 결과가 도출 될까요? 게임이론의 궁극적인 목표는 게임의 해(解, Solution)을 찾는 것입니다. 게임의 해란 합리적 경기자들이 주어진 게임을 경기한다고 할 때 어떠한 결과가 관찰될 것인가를 개념화한 것입니다. 게임의 해를 구하는 방법에는 여러가지가 있지만 이 글에서는 게임이론의 가장 대표적이고 강력한 해법인 내쉬 균형에 대해서만 알아보겠습니다.

게임이론의 대표적인 해, 내쉬균형

내쉬균형이란 ‘현재 상황에서 어떠한 경기자도 이탈할 유인이 없는 안정적 상태 혹은 행동전략조합’입니다. 개념으로는 이해가 어려우니 버튼게임에서의 내쉬균형을 찾아보면서 내쉬균형의 개념을 익혀보겠습니다.

경기자들이 (R,D)에 위치한 상황

  • 철수의 경우 현재 상황에서 이탈하여 (R 대신 L버튼을 누름) 1만원의 추가 이익을 얻을 수 있습니다.
  • 영희의 경우 현재 상황에서 이탈하여 (D 대신 U버튼을 누름) 1만원의 추가 이익을 얻을 수 있습니다.
  • 따라서, 철수와 영희는 현재 상황 (R,D)에서 모두 이탈하기 때문에, (R,D)는 내쉬균형이 되지 못합니다.

경기자들이 (R,U)에 위치한 상황

  • 철수가 현재 상황에서 행동을 바꾸면 (R 대신 L버튼을 누름) 1만원의 손해가 발생합니다. 따라서 철수는 현재 상황에서 이탈할 유인이 없습니다.
  • 영희가 현재 상황에서 행동을 바꾸면 (U 대신 D버튼을 누름) 1만원의 손해가 발생합니다. 따라서 영희는 역시 현재 상황에서 이탈할 유인이 없습니다.
  • 따라서, 철수와 영희는 현재 상황(R,U)에서 행동을 바꾸지 않으며, 정의에 따라 (R,U)는 이 게임의 내쉬균형입니다.

같은 논리로 남은 두 상황 (L,U), (L,D)의 내쉬균형 여부를 구해보면, 이 게임의 내쉬균형은 (R,U), (L,D) 총 두 개가 존재함을 알 수 있습니다. 따라서, 만약 철수와 영희가 합리적인 주체라면, (R,U) 혹은 (L,D) 중 하나의 균형을 선택할 것이라고 예측할 수 있습니다.

내쉬균형의 한계점, 다중균형

위의 버튼게임에서 내쉬균형은 우리에게 경기자들이 (R,U) 혹은 (L,D)중 하나를 선택할 것임을 알려주었습니다. 그러나 이 두 균형 중 최종 선택되는 단 하나의 결과가 무엇인지에 대한 답은 주지 못합니다. 이처럼, 내쉬균형은 두 개 이상의 균형이 발생할 경우 예측력이 떨어진다는 한계가 있습니다.

최선의 균형은 무엇일까, 보수우위 균형

보수우위 균형은 하사이니와 젤텐 (Selten and Harsanyi 1988)에 의해 개발된 개념으로 다중균형 상황에서 최종적으로 선택되는 균형이 무엇인지에 대한 답을 제공합니다. 보수우위 균형이란 여러 균형 중 경기자 모두에게 더 큰 보수를 주는 균형을 말합니다.

합리적인 경기자들은 다수의 균형이 발생한다면 보수우위를 가지는 균형을 최종적으로 선택합니다. 버튼게임의 예를 들어보겠습니다. (R,U) 균형은 두 참가자에게 각각 2의 보수를 제공합니다. 반면, (L,D)는 각각 1의 보수를 제공합니다. 따라서, (R,U)는 (L,D)에 비해 보수우위를 가지며 철수와 영희가 합리적인 경기자라면 (R,U) 균형을 최종적으로 선택할 것입니다.

중간 요약

  • 게임이론은 합리적인 경기자들의 행동 전략을 예측하는 학문임
  • 우리가 알고 싶은 것은 경기자들의 행동 결과, 즉 게임의 해(Solution)임
  • 대표적인 게임의 해로 내쉬균형이 있음.
  • 그러나, 내쉬균형은 다중 균형이 발생하면 예측력이 떨어지는 한계가 있음.
  • 보수우위균형은 이러한 내쉬균형의 한계를 보완하기 위해 등장함.

2. Token Curated Registry 메커니즘

TCR은 무엇인가요?

TCR은 간단히 말해 리스트를 큐레이션하는 토큰 모델입니다. 리스트란 쉽게 말해 정보를 선별한 목록을 제공하는 서비스 입니다. 강남구 맛집 리스트, 전국 대학교 순위 등이 모두 리스트의 예가 될 수 있습니다. 기존의 리스트들은 중앙화된 주체가 정보를 선별하여 리스트를 제공했다면, TCR은 토큰 인센티브를 통해 참가자들이 자발적으로 리스트를 큐레이션 하도록 합니다. 따라서, 토큰 설계자는 적절한 토큰 인센티브 설계를 통해 네트워크의 참가자들이 올바른 큐레이션을 제공하도록 유도해야 합니다.

이 장에서는 TCR의 버전 중 TCR 1.1을 예시로 사용하여, TCR 모델을 이루고 있는 요소인 참가자, 큐레이션 과정, TCR 파라미터를 설명하는 방식을 통해 TCR을 이해해 보겠습니다.

TCR 1.1의 참가자는 누구인가요?

TCR 1.1의 참가자의 종류는 세 가지로 나누어 볼 수 있습니다.

등록자(Candidate)

등록자는 리스트에 포함되고자 하는 참가자 입니다. 리스트가 ‘강남구 맛집 TOP 10’ 이라면, 등록자는 강남구에 있는 음식점들이 될 수 있겠네요.

검수자(Challenger)

검수자는 토큰을 보유한 누구나 될 수 있으며, 특정 등록자의 리스트 포함을 반대하는 참가자 입니다. 검수자들이 실행하는 챌린지(Challenge)는 리스트에 적합한 등록자들을 가려내는 방법으로서 리스트의 퀄리티에 직접적인 영향을 미칩니다.

투표자(Voter)

투표자는 토큰을 보유한 누구나 될 수 있으며, 네트워크 내에 챌린지가 발생할 경우 토큰을 예치하여 투표하는 참가자입니다.

큐레이션 과정은 어떻게 되나요?

큐레이션 과정을 단계별로 설명 해보겠습니다.

① 등록자는 Candidate Deposit을 예치하여 리스트 등록 신청을 합니다.

② 토큰 보유자들은 해당 등록자에 대한 챌린지를 신청할지 말지 결정합니다. 챌린지를 할 경우 검수자는 등록자가 예치한 토큰의 양과 같은 양의 토큰을 챌린지 Deposit으로 예치 해야 합니다.

③ 기간 내에 챌린지가 발생하지 않을 경우, 등록자는 리스트에 등록됩니다.

④ 챌린지가 발생하면 투표 단계로 넘어갑니다. Accept와 Reject 중 예치된 토큰이 많은 쪽이 최종 결과로 결정됩니다.

참가자들의 인센티브는 무엇인가요?

그렇다면 참가자들은 어떠한 유인이 있어서 열심히 챌린지를 발생시키고, 투표를 진행할까요? 참가자들의 입장에 서서 네트워크에 참여할 요인을 분석해보겠습니다.

등록자

등록자는 등록에 성공하면 검수자가 예치한 챌린지 deposit에서 일정 부분을 뺏어오게 됩니다.

검수자

검수자는 챌린지에 성공하면 등록자가 등록 당시 예치한 Deposit과 Accept에 투표한 참가자들이 예치한 토큰의 일정 부분을 뺏어오게 됩니다.

투표자

1. Accept 투표자

Accept에 투표하여 승리한 투표자들은 Reject에 예치된 토큰과 챌린지 Deposit의 일부를 뺏어오게 됩니다.

2. Reject 투표자

Reject에 투표하여 승리한 투표자들은 Accept에 예치된 토큰과 Candidate Deposit의 일부를 뺏어오게 됩니다. 이 모델에서는 검수자가 챌린지를 할 경우 검수자이면서, 동시에 Reject에 투표하는 투표자라고 가정하겠습니다.

TCR의 파라미터(Parameter)는 무엇인가요?

파라미터는 네트워크 내의 활동을 통해 이동하는 토큰들의 양과 비율을 결정하는 값입니다. 예를 들어 등록 예치금은 얼마나 될 것이며, 투표에서 이긴쪽이 진쪽으로 부터 얼마 만큼의 토큰을 뺏어올 것인지 등을 정하는 수치인 것이죠.

TCR의 파라미터는 다음과 같습니다.

  • Minimum Deposit (D): 등록자가 리스트 등록 신청을 할 시 예치 하는 최소 Deposit의 양을 결정하는 파라미터
  • Dispensation Percentage (d): 챌린지에서 승리한 쪽이(검수자/등록자) 상대방이 예치한 토큰을 뺏어오는 비율을 결정하는 파라미터
  • Vote Quorum (Q): Accept에 예치된 토큰의 Percentage가 몇 % 이상이면 Accept로 받아들여지는지 결정하는 파라미터. Q > 50 이면 과반수 투표방식 이라고 생각하면 됩니다
  • Minority Bloc Slash (s): 투표에서 승리한 쪽이 패배한 쪽 토큰으로부터 뺏어오는 비율을 결정하는 파라미터

요약

  • TCR은 리스트를 큐레이션하는 모델
  • 참가자들은 각기 다른 인센티브를 가지고 큐레이션에 참여
  • 토큰 설계자들은 파라미터 값을 조정함으로 인센티브 수준을 결정

3. TCR 메커니즘의 게임이론적 설계

앞서 게임이론과 TCR 메커니즘에 대해 간략하게 이해해보았습니다. 이 장에서는 한 TCR 네트워크의 예시를 통해 경제 모델 설계에 따라 참가자들이 어떻게 행동하는지 알아보겠습니다. 복잡한 수식이나 수학적인 개념들을 최대한 배제하기 위하여 실제 수치를 입력한 예시를 가지고 설명하도록 하겠습니다.

가정사항

논의를 진행하기에 앞서 가정사항들을 먼저 살펴보겠습니다.

1. 등록자는 경기자에서 제외

이 장에서는 등록자를 게임이론의 경기자 에서 제외했습니다. 등록자는 ‘등록 신청 혹은 등록 미신청’ 두 가지의 행동전략이 있지만, 이 장에서는 등록자가 등록 신청을 한 상황을 가정하여, 검수자와 투표자는 어떻게 행동하는지 분석해보겠습니다.

2. 등록자가 게임에 미치는 영향: c, V(0), V(c)

등록자가 경기자에서는 제외되지만, 등록자의 행동이 네트워크의 의사결정에 미치는 영향을 간과하면 안되기 때문에, 등록자에 의해 바뀔 수 있는 네트워크의 변수들을 가정하겠습니다.

  • c: c는 리스트에 대한 등록자의 적합도를 나타내는 변수입니다. 예를 들어 설명해보겠습니다. ‘강남구 맛집 리스트’에서 등록자들의 c는 음식의 맛, 서비스, 가격 등을 종합하여 산출됩니다.
  • V(0): V(0)는 현재 토큰의 가치를 나타냅니다.
  • V(c): V(c)는 c 적합도를 가진 등록자가 리스트에 포함되고 난 후 변화한 토큰 가치를 나타냅니다. 큐레이션을 통해 기준에 부합하는 등록자를 리스트에 포함시켰다면 V(c) > V(0)가 될 것이며, 자격 미만인 등록자를 리스트에 포함시켰다면 V(c) < V(0)가 될 것이라고 예상할 수 있습니다. 현실에서 V(c)는 결과값입니다. 즉, 등록자가 리스트에 포함된 후 토큰 가치의 변화를 산출해야만 구할 수 있는 값이죠. 그런데 진행하는 논의에서는 네트워크 참가자들을 합리적인 주체로 가정하므로, 모든 주체들이 등록자의 c 수준을 알고, 이에 따른 V(c)값을 구할 수 있다고 가정하겠습니다.
  • V(c)/V(0): V(c)와 V(0)의 상대적인 값은 등록자의 수준을 나타냅니다. 예를 들어 V(c)/V(0)가 1.1인 등록자 A와 V(c)/V(0)가 1.5인 등록자를 비교해봤을 때, B의 c가 A에 비해 리스트에 좀 더 적합한 참가자 라는 것을 알 수 있습니다.

3. 검수자는 위험선호자(Risk-taker)

검수자들을 위험 선호자로 가정하여, 챌린지가 성공했을 때의 보수가 챌린지를 하지 않았을 때의 보수보다 크다면, 챌린지를 하는 것으로 가정하겠습니다.

4. 모든 투표자들이 투표에 참여

TCR 1.1에서는 투표에 참여하지 않는 투표자의 토큰들을 패배한 쪽으로 간주하여 빼앗아가기 때문에, 이 모델에서는 모든 투표자들이 투표에 참여한다고 가정하겠습니다.

5. 잘못된 큐레이션의 기준

이 글에서 가정하는 잘못된 큐레이션의 기준은 다음과 같습니다.

1. 큐레이션 기준에 미만하는 참여자를 Accept한 경우

V(c)/V(0)가 기준 이하임에도 불구하고, 검수자들이 챌린지를 발생하지 않음으로서 얻을 수 있는 보수가 더 많다면 위와 같은 상황이 발생합니다.

2. 큐레이션 기준에 적합한 참여자를 Reject한 경우

V(c)/V(0)가 기준 이상임에도 불구하고, 투표자들이 Reject를 함으로서 얻을 수 있는 보수가 더 많다면 위와 같은 상황이 발생합니다.

TCR 메커니즘 설계자 A, B 그리고 C

이 장에서는 동일한 TCR 네트워크 환경에서 각자 다른 파라미터 설정을 가진 세 설계자의 예시를 들어 어떤 설계자의 TCR 메커니즘이 올바른 큐레이션을 제공하는지 살펴보겠습니다.

네트워크 상황가정

  • 현재 네트워크에는 세 명의 투표자(토큰 보유자)가 있으며, 각각 100 토큰을 동일하게 보유하고 있음.
  • 동일한 네트워크에 대해, 세 명의 토큰 설계자 A,B,C가 있으며 이들은 공통적으로 V(c)/V(0)가 1.1 이상인 등록자를 다음 Listee로서 포함시키기 원함.
  • A,B,C가 설계한 Parameter 설정은 다음과 같음.


이 모델 중 잘못된 큐레이션이 이루어지는 모델은 무엇일까요? 결과부터 말씀드리면 B와 C가 설정한 토큰 모델은 잘못된 큐레이션을 제공하는 모델입니다. 우선, B와 C 모델을 살펴보겠습니다.

설계자 B의 모델

결과적으로, B의 모델은 위에서 가정한 잘못된 큐레이션 기준 중 1번에 해당합니다. 이는, 설계자가 설정한 등록자의 기준인 V(c)/V(0) > 1.1을 충족하지 못하는 참가자들 또한 리스트에 등록되는 상황입니다. 여기서, V(c)/V(0)=1.09인 등록자가 등록을 한 상황을 가정하여, 실제로 이 참가자가 리스트에 등록되는지 살펴보겠습니다.

등록자가 리스트에 포함되는 경우는 두 가지입니다.

  • 챌린지가 발생하지 않음
  • 챌린지가 발생함, 투표 단계에서 투표자들이 Accept를 선택

이 두 경우 중 어떤 단계에서 큐레이션의 문제가 발생하는지 알아보겠습니다.

우선, 챌린지가 발생하는지 여부를 먼저 살펴보겠습니다. 챌린지는 검수자에 의해 이루어지기 때문에 검수자의 행동과, 보수를 통해 검수자의 Incentive를 알아보겠습니다.

검수자의 행동전략과 보수

검수자는 두 가지의 행동전략을 가지고 있습니다.

  • 챌린지
  • 챌린지 하지 않음.

게임의 결과에 따른 검수자의 보수는 다음과 같습니다.

  • 챌린지 성공

 챌린지에 성공하여 등록자가 포함되지 않으므로, 토큰 가치는 변화가 없습니다.

② 원래 보유하고 있던 토큰의 양 입니다.

③ 챌린지에 성공했으므로 등록자의 예치 토큰의 일정 부분 (30x20%)을 보상으로 받습니다.

  • 챌린지 실패

 챌린지에 실패했으므로 새로운 등록자가 등록되고 토큰의 가치가 변화됩니다.

② 챌린지에 실패했으므로 챌린지에 예치한 토큰(30)을 잃게됩니다.

③ Reject에 투표했으므로, 일정부분(70×10%)이 Accept에 투표한 투표자들에게 돌아갑니다.

  • 챌린지 하지 않음

 챌린지가 발생하지 않았으므로, 새로운 등록자가 등록되고 토큰의 가치가 변화됩니다.

 챌린지가 발생하지 않았으므로, 기존에 보유하고 있던 토큰에는 변동이 없습니다.

결론

B가 설계한 Parameter에 따라 도출한 검수자의 보수에 따르면, 검수자는 챌린지에 성공하던 안하던, 챌린지를 하지 않는 쪽이 보수가 (109 > 106 or 69) 더 높습니다. 따라서, 합리적인 검수자라면 챌린지를 하지 않게되고, 기준 미만인 등록자가 리스트에 포함되게 됩니다.

설계자 C의 토큰 모델


C의 모델은 위에서 설정한 잘못된 큐레이션 기준의 2번에 해당합니다. 모델 설계자가 설정한 등록자의 기준인 V(c)V(0) > 1.1을 충족하는 참가자들이 리스트에 등록되지 못하는 상황입니다. 이 상황이 발생한 조건은 다음과 같습니다.

  • 챌린지가 발생, 과반의 투표자들이 Reject에 투표

여기서, V(c)V(0)=1.11인 등록자가 등록을 신청했을 때 투표를 통해 이 등록자가 챌린지를 통해 최종적으로 Reject되는지 살펴보겠습니다.

검수자의 행동전략과 보수

게임의 결과에 따른 검수자의 보수는 다음과 같습니다.

  • 챌린지 성공

  • 챌린지 실패

  • 챌린지 하지 않음

검수자는 챌린지에 성공한다면 115의 보수를 얻을 수 있습니다. 이는 챌린지를 하지 않는 전략 보다 더 큰 보수를 가져다 줍니다(125 > 111). 따라서, C의 모델은 B의 모델과는 달리 챌린지가 일어납니다. 다음은 투표 단계에서 투표자들의 행동에 대한 보수를 살펴보겠습니다.

투표자의 행동전략과 보수

투표자는 두 가지 행동전략을 가지고 있습니다.

  • Accept에 투표
  • Reject에 투표

게임의 결과에 따른 각 투표자의 행동에 대한 보수는 다음과 같습니다.

(Accept, Accept)

 현재 Accept에 예치된 토큰이 총 200(100 + 100) 이므로, Accept에 투표한 개개인은 자신이 예치한 토큰에 비례하여 보상을 받게됩니다 (100/200)

② 챌린지 Deposit으로부터 뺏어오는 보상입니다. (30×50%)

③ Reject에 예치된 토큰을 뺏어오는 보상입니다. (70×20%)

(Accept, Reject)

Reject에 투표한 참가자

Reject에 예치된 토큰이 총 170(100+70)개이므로, 등록자는 Reject 됩니다.

 Reject에 투표한 투표자가 Candidate Deposit으로부터 뺏어오는 보상입니다. (30×50%)

② Reject에 예치된 토큰이 총 170개 이므로, 투표자는 예치한 토큰에 비례하여 보상을 나누어 갖습니다. (100 / 170)

③ Accept에 예치된 토큰을 뺏어오는 보상입니다.(100×20%)

Accept에 투표한 참가자

① 투표에서 졌으므로 Accept에 예치한 토큰을 빼앗깁니다. (100×20%)

(Reject, Reject)

① Accept에 예치된 토큰이 없으므로, Reject 투표자들은 Candidate deposit만 나누어 가집니다.

결론

C가 설계한 토큰 모델에 따라 투표자의 보수를 도출해보면, 투표자들은 상대방의 전략에 상관없이 무조건 Reject에 투표하는 것이 더 이득입니다. 따라서, 두 투표자들 모두 Reject에 투표하게 되고, 결과적으로 기준을 충족하는 등록자가 리스트에 포함되지 않게 됩니다.

설계자 A의 토큰 모델

그렇다면 A의 토큰 모델은 올바른 큐레이션을 진행하는지 살펴보겠습니다.

먼저 잘못된 큐레이션의 1번 기준에 따라 A의 모델이 기준 미만의 등록자를 Reject 할 수 있는지 알아보겠습니다. (등록자 V(c)/V(0)= 1.09)

검수자의 보수

  • 챌린지 성공

  • 챌린지 실패
  • 챌린지 하지 않음

검수자의 챌린지 성공 보수가 챌린지를 하지 않았을 때의 보수보다 높으므로, 챌린지가 발생합니다.

투표자의 보수

게임의 결과에 따른 투표자의 행동에 대한 보수는 다음과 같습니다.

투표자 A, B는 상대방의 행동 전략에 상관없이 무조건 Reject를 하는 쪽이 보수가 더 높습니다. 따라서, A와 B 모두 Reject에 투표하게 되고, 등록자는 Reject 됩니다. 따라서, A가 설계한 모델에서 기준 이하의 등록자는 리스트에 포함되지 않습니다.

그렇다면, 잘못된 큐레이션의 2번 기준에 따라 A의 모델이 기준 이상의 등록자를 Accept 할 수 있는지 알아보겠습니다. (등록자 V(c)/V(0)= 1.11)

검수자의 보수

  • 챌린지 성공
  • 챌린지 실패
  • 챌린지 하지 않음

여기서 특이한 점은 등록자의 수준이 기준 이상임에도 불구하고, 여전히 챌린지가 일어난다는 점입니다. 그러나 결론부터 말하면, 실제로 챌린지는 일어나지 않습니다. 왜 이런 결과가 나타나는지 살펴보겠습니다.

투표자의 보수

설계자 C의 모델과는 다르게 투표자들은 Accept와 Reject중 무조건 적인 우위를 가지는 전략(Dominant strategy)이 없습니다. 즉, 상대방의 투표 전략까지 모두 고려하여 자신의 행동 전략을 세워야합니다. 마치 1장에서 본 버튼 게임과 비슷한 상황이죠, 이 투표를 2인 투표자 게임으로 생각하고 게임이론적으로 어떤 결과가 도출될지 분석해 보겠습니다.

2인 투표자 게임

내쉬균형과 보수우위

위에서 배운 내쉬균형을 잊지 않으셨다면 이 게임에서 내쉬균형이 (Accept, Accept), (Reject, Reject)라는 것을 쉽게 구하실 수 있을 것입니다. 또한 (Accept, Accept) 균형이 (Reject, Reject) 균형에 비해 보수우위를 가진다는 것을 알 수 있습니다. 따라서 2인 투표자 게임에서 합리적인 투표자들은 (Accept, Accept) 균형에 도달할 것을 예상할 수 있습니다.

결론

챌린지가 발생해 투표 단계로 넘어가게되면 투표자들은 보수우위 균형인 (Accept, Accept)를 선택할 것이고, 검수자는 이 사실을 알고 있습니다. 즉, 자신이 챌린지를 할 경우 무조건 실패함을 알고 있습니다. 그런데 챌린지에 실패할 경우 보수는 70이며 챌린지를 하지 않을 경우 검수자는 111 보수를 얻을 수 있습니다. 따라서, 합리적인 검수자라면 챌린지를 하지 않을 것입니다.

게임이론에 입각한 Parameter 설정

위의 세 설계자의 예를 통해, 같은 조건임에도 Parameter 설정을 어떻게 하느냐에 따라 상반된 결과가 나타남을 보았습니다. 그렇다면 이 네트워크 조건에서 성공적인 큐레이션을 위해 어떻게 Parameter를 설계해야 하는지 살펴 보겠습니다.

기준 이하의 등록자가 챌린지 당하는 파라미터 설정

기준 이하의 등록자가 등록 신청을 할 경우 무조건 챌린지가 일어나야 합니다. 네트워크 모델에서 이 목적을 달성하기 위한 파라미터의 설정은 다음과 같아야 합니다.

100(-1)을 베타로 치환하면,

위의 예에서, 설계자 B의 모델은 (D x d)를 너무 낮게 설정하여, 검수자들이 챌린지를 할 Incentive를 충분히 제공하지 못하고 있습니다.

기준 이상의 등록자들이 Accept 되게하는 파라미터 설정

기준 이상의 등록자들은 무조건 리스트에 등록되어야 합니다. 네트워크 모델에서 이 목적을 달성하기 위한 파라미터 설정은 다음과 같습니다.

설계자 C는 s 값을 지나치게 높게 설정하여, 투표자들이 Accept에 투표할 충분한 Incentive를 제공하지 못하고 있습니다.

결론

가정한 네트워크에서 올바른 큐레이션이 이루어지려면, 위와 같은 조건을 만족시키도록 Parameter를 조절해야 합니다. 위에서 가정한 네트워크(세 명의 투표자가 모두 같은 토큰을 가지고 있는 네트워크) 모델은 단순히 편의를 위해서 가정한 것이며, 이 모델만이 게임이론적으로 해석할 수 있는 것은 아닙니다.

게임이론은 상황이 다른 네트워크 모델에서도 적용될 수 있으며, 네트워크 상황에 따라 토큰 설계자는 각기 다른 Parameter 설정을 통해 참가자들의 올바른 큐레이션을 유도해야 합니다.

4. 맺으며

게임이론이 만병통치약은 아닙니다

이 글을 통해서 게임이론을 통해 네트워크 참가자들의 행동을 예측해보았습니다. 또한, 예측한 결과를 바탕으로 네트워크가 바람직하게 돌아가려면 어떻게 경제적인 요소들을 설정해야 하는지 살펴보았습니다. 그러나, 게임이론이 완벽한 예측을 제공하지는 않습니다.

지나친 가정사항, 합리적인 경기자

게임이론의 가정사항들은 현실과는 잘 안 맞을 수 있습니다. 위의 모델에서 가정한 경기자들은 모두 합리적인 경기자, 즉 자신과 상대방의 행동 전략과, 보수 등을 모두 알고 있는 것으로 가정 했지만 실제 참가자들은 합리적인 경기자가 아닙니다.

예를 들어 현실에서 TCR의 참가자들은 등록자의 가치 (V(c))가 얼마나 될지, 파라미터만 보고 정확하게 자신과, 모든 경기자들의 보수가 어떻게 될지 정확하게 알 것이라고 얘기할 수는 없습니다. 따라서 모든 참가자들이 위의 시나리오 대로 행동하지는 않을 것입니다. 즉, 게임이론적으로 완벽한 모델을 설계했음에도 예상한 것과는 다른 결과가 나올 가능성도 충분히 존재합니다.

모델의 한계점: 경기자들의 비금전적인 보수를 제외함

이 모델은 네트워크 내의 활동으로 얻어지는 토큰의 보상만을 보수로 설정했습니다. 그러나 실제로 참가자들은 리스트를 통해 얻을 수 있는 부수적인 가치들이 있습니다. 중요한 것은 이러한 부수적인 가치가 네트워크 내의 토큰 보상보다 참가자들에게 더 큰 보수로 작용할 수 있다는 점입니다.

예를 들어 강남구 맛집 리스트에 포함된 등록자는 리스트를 보고 찾아오는 손님들이 늘어 매출 상승 등의 부수적인 가치를 누릴 수 있습니다. 사실 이 리스트에 등록하고자 하는 음식점들은 네트워크 내에서 검수자로 부터 뺏어오는 토큰 보상보다는 매출 상승 등의 부수적인 가치가 더 큰 보수일 것입니다. 그런데, 이 모델에서는 이를 제외함으로서 현실적인 예측력을 제공하지 못할 수도 있습니다.

그럼에도 게임이론을 알아야 하나요?

그렇다고 해서 게임이론이 현실과는 아예 동떨어진 학문이라고 할 수는 없습니다. 왜냐하면 경기자들은 완전히 합리적이지는 않지만 또 완전 비합리적이지도 않기 때문입니다.

즉, 게임이론을 통해 우리는 현실에서 경기자들의 행동을 완벽하게 예측할 수는 없지만, 어느 정도의 예측력을 가질수 있습니다. 암호경제 모델 설계 측면에서, 어떠한 이론적 토대도 없이 경제 모델을 설계하는 설계자보다, 게임이론을 기준으로 경제 모델을 설계하는 설계자가 참가자들의 행동 대한 더 나은 예측력을 가지고 경제 모델을 설계할 수 있다는 것입니다 .

게임 이론과 TCR에 대해 더 알고싶다면

서적

  • John C Harsanyi and Reinhard Selten. 『A general theory of equilibrium selection in games』. MIT Press Books, 1, 1988
  • 김영세. 『게임이론, 전략과 정보의 경제학』. 박영사, 2018

링크