반대하지 않는 이익을 가진 게임. 내쉬 균형

  • 13.10.2019

2015년 2월 10일

100달러를 빨리 나누자. 당신과 나는 우리가 요구하는 100개 중 몇 개를 결정하고 동시에 금액을 발표합니다. 총액이 100 미만이면 모두가 원하는 것을 얻습니다. 총액이 100개 이상이면 가장 적은 금액을 요구한 사람이 원하는 금액을 얻고 욕심이 많은 사람이 남은 금액을 얻습니다. 같은 금액을 요구하면 각각 $50씩 받습니다. 얼마를 물을 것인가? 돈을 어떻게 나눌 것인가?

이기는 동작은 단 하나입니다.

과학적으로 시작하려면:

내쉬 균형(영어) 우리의 균형) John Forbes Nash의 이름을 따서 명명되었습니다. 이것은 두 명 이상의 플레이어가 참여하는 게임의 결정 유형에 대한 게임 이론의 이름으로, 다른 참가자가 자신의 결정을 변경하지 않을 때 일방적으로 자신의 결정을 변경하여 보상을 증가시킬 수 없습니다. 결정. 참가자들이 선택한 이러한 일련의 전략과 결과를 내쉬 균형이라고 합니다.

내쉬 평형(NE)의 개념은 내쉬가 처음 사용하지 않았습니다. Antoine Auguste Cournot은 Cournot 게임에서 우리가 Nash 균형이라고 부르는 것을 찾는 방법을 보여주었습니다. 따라서 일부 저자는 그것을 내쉬-쿠르노 균형. 그러나 Nash는 1950년 비협조적 게임에 대한 그의 논문에서 플레이어 수에 관계없이 모든 유한 게임에 대해 그러한 균형이 반드시 존재해야 함을 처음으로 보여주었습니다. Nash 이전에는 John von Neumann과 Oskar Morgenstern(1947)이 2인용 제로섬 게임에서만 이를 증명했습니다.

이제 게시물 시작 부분에 제시된 문제에 대한 해결책:

$51 요구 사항은 상대방이 무엇을 선택하든 최대 금액을 제공합니다. 그가 더 달라고 하면 $51를 받게 됩니다. 그가 $50 또는 $51를 요구하면 $50를 받게 됩니다. 그리고 그가 $50 미만을 요구하면 $51를 받게 됩니다. 어쨌든, 당신을 가져올 다른 옵션은 없습니다 더 많은 돈이것보다. 내쉬 균형은 우리 모두가 51달러를 선택하는 상황입니다.

그리고 이제 이 남자에 대해 조금:

존 내쉬는 1928년 6월 13일 버지니아 주 블루필드에서 엄격한 개신교 가정에서 태어났습니다. 아버지는 Appalachian Electric Power에서 엔지니어로 일했고 어머니는 결혼 전에 학교 교사로 10년 동안 일했습니다. 나는 학교에서 평균을 공부했지만 수학을 전혀 좋아하지 않았습니다. 학교에서는 지루하게 가르쳤습니다. 내쉬가 14세였을 때, 에릭 T. 벨의 위대한 수학자들은 그의 손에 넘어갔습니다. "이 책을 읽고 난 후, 나는 아무 것도 없이 나 자신을 관리했다. 외부 도움, 페르마의 작은 정리를 증명하기 위해”라고 내쉬는 자서전에서 씁니다. 그래서 그의 수학적 천재성은 스스로를 선언했습니다.

연구

그 뒤를 이어 Carnegie Polytechnic Institute(현 카네기 멜론 사립 대학)에서 공부를 하고 내쉬가 화학을 공부하려고 시도하고 국제 경제학 과정을 수강한 다음 마침내 수학을 선택하기로 결정했습니다. 1948년, 그는 학사와 석사의 두 가지 학위로 연구소를 졸업한 후 프린스턴 대학교에 입학했습니다. Nash Institute의 Richard Duffin 교수는 그에게 가장 간결한 추천서 중 하나를 제공했습니다. "이 사람은 천재다!"

공장

Princeton에서 John Nash는 게임 이론에 대해 들었고 John von Neumann과 Oscar Morgenstein에 의해서만 소개되었습니다. 게임 이론이 그의 상상을 뛰어넘어 20세의 나이에 John Nash가 기초를 만들 수 있었습니다. 과학적인 방법세계경제의 발전에 큰 역할을 하였다. 1949년, 21세의 과학자는 게임 이론에 관한 그의 논문을 썼습니다. 45년 후, 그는 이 공로로 노벨 경제학상을 받았습니다. Nash의 공헌은 비협조 게임 이론에서 균형에 대한 근본적인 분석으로 설명되었습니다.

노이만과 모르겐슈타인은 한쪽의 승리는 필연적으로 다른 쪽의 패배를 의미하는 이른바 제로섬 게임에 참여했습니다. 1950년 - 1953년 Nash는 모든 참가자가 이기거나 지는 특별한 종류의 게임인 "논제로섬 게임"에 대한 심층 분석을 제공한 4개의 혁명적 논문을 과장 없이 발표했습니다. 그러한 게임의 예로는 노조와 회사 경영진 간의 임금 인상 협상이 있습니다. 이 상황은 양측이 고통받는 장기 파업으로 끝날 수도 있고, 상호 이익이 되는 합의에 도달할 수도 있습니다. 내쉬는 양측이 사용하는 "내쉬 균형" 또는 "비협조적 균형"으로 알려지게 된 것을 시뮬레이션함으로써 경쟁의 새로운 면을 볼 수 있었습니다. 이상적인 전략, 이는 안정적인 균형의 생성으로 이어집니다. 변경 사항은 상황을 악화시킬 뿐이므로 플레이어가 이 균형을 유지하는 것이 좋습니다.

1951년 존 내쉬는 케임브리지에 있는 매사추세츠 공과대학(MIT)에 합류했습니다. 동료들은 그가 매우 이기적이어서 그를 특별히 좋아하지 않았지만 그의 수학적 능력이 탁월했기 때문에 그를 참을성 있게 대했습니다. 그곳에서 John은 곧 아이를 갖게 될 Eleanor Stier와 친밀한 관계를 발전시켰습니다. 그래서 내쉬는 아버지가 되었지만 출생 증명서에 기록할 아이의 이름을 알려주기를 거부했으며 재정 지원도 거부했습니다. 1950년대 내쉬는 유명했다. 그는 미국 최고의 과학자들을 고용한 분석 및 전략 연구 회사인 RAND Corporation과 협력했습니다. 그곳에서 다시 게임 이론 연구를 통해 Nash는 게임 분야의 최고 전문가 중 한 명이 되었습니다. 냉전". 또한 MIT에서 근무하는 동안 Nash는 실제 대수 기하학과 리만 다양체 이론에 대한 여러 논문을 썼으며 동시대 사람들에게 높이 평가되었습니다.

질병

곧 John Nash는 Alicia Lard를 만났고 1957년에 결혼했습니다. 1958년 7월 Fortune 잡지는 Nash America의 떠오르는 별을 "새로운 수학"으로 선정했습니다. 곧 내쉬의 아내는 임신했지만 내쉬의 병과 일치했습니다. 그는 정신 분열증에 걸렸습니다. 이때 John은 30세, Alicia는 26세에 불과했습니다. 처음에 Alicia는 Nash의 경력을 구하기 위해 친구와 동료에게 일어나는 모든 일을 숨기려 했습니다. 그러나 몇 달 간의 미친 행동 끝에 Alicia는 남편을 보스턴 교외의 McLean Hospital에 있는 개인 정신과 진료소에 강제로 입원시켰고, 그곳에서 남편은 편집증적 정신분열증 진단을 받았습니다. 제대 후 그는 갑자기 유럽으로 떠나기로 결정했습니다. Alicia는 어머니의 갓 태어난 아들을 버리고 남편을 따랐습니다. 그녀는 남편을 미국으로 데려왔습니다. 돌아온 후 그들은 Alicia가 일자리를 찾은 프린스턴에 정착했습니다. 그러나 Nash의 병은 계속 진행되었습니다. 그는 끊임없이 무언가를 두려워하고, 3 인칭으로 자신에 대해 말하고, 전 동료라고 불리는 의미없는 엽서를 썼습니다. 그들은 수비학과 세계의 정치 상황에 대한 그의 끝없는 토론을 참을성있게 들었습니다.

남편의 악화된 상태는 알리시아를 더욱 우울하게 만들었다. 1959년 그는 직장을 잃었다. 1961년 1월 완전히 우울증에 걸린 존의 어머니 알리시아와 그의 여동생 마사가 어려운 결정: John이 한 달 반 동안 일주일에 5일 ​​동안 인슐린 요법 - 가혹하고 위험한 치료를 받은 뉴저지의 Trenton 주립 병원에 John을 가두기 위해. 석방된 후 프린스턴에서 온 내쉬의 동료들은 그에게 연구원으로 일자리를 제공하여 그를 돕기로 결정했지만 존은 다시 유럽으로 갔지만 이번에는 혼자였습니다. 그는 비밀스러운 편지만을 집으로 보냈습니다. 1962년, 3년의 혼란 끝에 Alicia는 John과 이혼했습니다. 어머니의 도움으로 그녀는 혼자서 아들을 키웠습니다. 나중에 그에게도 정신분열증이 있다는 것이 밝혀졌습니다.

Alicia와의 이혼에도 불구하고 동료 수학자들은 Nash를 계속 도왔습니다. 그들은 대학에서 그에게 일자리를 제공하고 항 정신병 약을 처방 한 정신과 의사와 회의를 주선했습니다. 내쉬의 상태는 호전되었고 그는 Eleanor와 그의 첫째 아들인 John David와 시간을 보내기 시작했습니다. John의 자매인 Martha는 이렇게 회상합니다. “매우 고무적인 시간이었습니다. - 꽤 긴 기간이었다. 하지만 모든 것이 바뀌기 시작했습니다.” John은 약물이 정신 활동에 우울한 영향을 미칠까 두려워 복용을 중단했고 정신 분열증의 증상이 다시 나타났습니다.

1970년 Alicia Nash는 남편을 배신한 것이 실수였다고 확신하고 남편을 다시 받아 들였습니다. 이제 하숙인으로서 이것이 그를 노숙자 상태에서 구할 수 있었을 것입니다. 나중에 Nash는 계속해서 Princeton에 가서 칠판에 이상한 공식을 썼습니다. 프린스턴 학생들은 그를 "팬텀"이라고 불렀습니다. 그러다 1980년. Nash는 눈에 띄게 좋아졌습니다. 증상이 사라지고 주변 생활에 더 많이 관여하게 되었습니다. 의사들은 놀랍게도 질병이 물러나기 시작했습니다. 더 정확하게는 내쉬는 그녀를 무시하는 법을 배우기 시작했고 다시 수학을 시작했습니다. 내쉬는 자서전에서 "이제 나는 다른 과학자들처럼 아주 건전하게 생각합니다."라고 썼습니다. “육체적 질병에서 회복된 사람이 경험하는 기쁨을 나에게 준다는 말은 하지 않겠습니다. 건전한 사고는 우주와의 관계에 대한 인간의 생각을 제한합니다.

고백

1994년 66세의 나이로 게임 이론에 대한 연구로 노벨상을 수상한 존 내쉬. 그러나 주최측이 그의 상태를 우려해 스톡홀름 대학에서 전통적인 노벨 강연을 할 기회를 박탈당했다. 대신 게임 이론에 대한 그의 공헌에 대해 논의하기 위해 세미나가 (그의 참여로) 조직되었습니다. 그 후, 내쉬는 스톡홀름에서 그런 기회가 없었기 때문에 웁살라 대학에서 강연을 하도록 초청받았다. 그를 초청한 웁살라 대학교 수학 연구소의 크리스터 키젤만 교수에 따르면 강의는 우주론에 대한 것이었다.

이혼 후 38년이 지난 2001년, 존과 알리시아는 재혼했습니다. Nash는 Princeton의 사무실로 돌아와 계속해서 수학을 탐구하고 이 세계를 탐험하고 있습니다. 그를 매우 어려운 질병을 겪도록 강요한 세계; 그러나 이 세상은 그를 다시 받아들였다.

"심리 게임"

1998년 미국 언론인(콜럼비아 대학교 경제학 교수인 실비아 나자르)은 내쉬의 전기를 "뷰티풀 마인드: 수학 천재의 삶"과 노벨상 수상자인 존 내쉬(John Nash)라는 전기를 썼습니다. 이 책은 순식간에 베스트셀러가 되었습니다.

2001 년 Ron Howard의 감독하에 책을 기반으로 한 영화 "뷰티풀 마인드"는 러시아 박스 오피스 "뷰티풀 마인드"에서 촬영되었습니다. 이 영화는 4개의 오스카상(각본상, 감독상, 여우조연상, 최종적으로 최우수 작품상)과 골든 글로브상을 수상했으며 여러 바프타 상(영국 영화 공로상)을 수상했습니다.

보시다시피 영화는 거의 사실입니다. 물론, 약간의 "문학적인" 왜곡이 있습니다.

  • 로버트 레드포드는 영화의 감독 역할을 제안받았지만 촬영 일정에 만족하지 못했다.
  • Tom Cruise는 Alicia의 역할을 위해 John Nash와 Salma Hayek의 역할을 위해 오디션을 봤습니다. 그녀가 실패한 여주인공과 같은 마을 엘살바도르에서 태어났는지 궁금하다.
  • Nash는 Parker를 처음 봤을 때 그를 "큰 형"(Orwell의 1984년에 대한 암시)이라고 불렀습니다. Orwell에 대한 또 다른 언급은 나중에 Nash의 사무실 문에 있는 번호인 101을 볼 때 나옵니다.
  • 젊은 존 내쉬가 큐레이터인 헬링거 교수에게 보여준 원고는 "The Dealing Problem"이라는 제목으로 Econometrica 저널에 실린 기사의 진본입니다.
  • 영화의 각본가인 Akiva Goldsman은 정신 질환자를 다루는 데 상당한 경험이 있었습니다. 의사였을 때 그는 개인적으로 어린이와 성인의 정신 건강을 회복시키는 방법을 개발했습니다.
  • 수학적 부분에 대한 영화의 큐레이터는 Barnard College의 교수인 Dave Byer였습니다. Russell Crowe가 칠판에 까다로운 공식을 "표시"한 것은 그의 손이었습니다.
  • 자세히 살펴보면 "현명한 공식"은 그리스 문자, 화살표 및 수학 기호의 무의미한 집합에 불과합니다.
  • 그의 "반쪽"에 대한 드문 헌신으로 구별되는 화면상의 상대와 달리 실제 John Nash는 평생 여러 번 결혼했으며 20 세에 사생아를 입양했습니다.
  • 영화의 1994년 노벨상 부분에서 내쉬는 새로운 종류의 항정신병약 복용에 대해 이야기하지만, 실제로 존 내쉬는 1970년에 다시 복용을 중단했고 그의 사면은 항정신병약 복용과 관련이 없었습니다.

오늘날 내쉬의 발견은 어디에 적용됩니까?


70년대와 80년대에 붐을 경험한 게임 이론은 사회 지식의 일부 분야에서 강력한 위치를 차지했습니다. 한때 내쉬팀이 50년대 초반 선수들의 행동을 기록했던 실험은 실패한 것으로 여겨졌다. 오늘날 그들은 "실험 경제학"의 기초를 형성했습니다. "내쉬 균형"은 과점 분석에 적극적으로 사용됩니다. 특정 시장 부문에서 소수의 경쟁자의 행동입니다.

또한 서구에서는 방송 또는 통신용 라이선스를 발급할 때 게임 이론이 활발히 사용됩니다. 발급 기관은 가장 최적의 주파수 분포 변형을 수학적으로 계산합니다.

마찬가지로 경매 성공자는 최적의 수입을 얻기 위해 특정 구매자에게 제공할 로트에 대한 정보를 결정합니다. 게임 이론으로 법학, 사회 심리학, 스포츠 및 정치에서 성공적으로 작동합니다. 후자의 경우 "내쉬 균형"의 존재의 특징적인 예는 "반대" 개념의 제도화입니다.

그러나 게임 이론은 사회 과학에만 적용되는 것이 아닙니다. 현대의 진화론늑대가 모든 토끼를 먹지 않는 이유(그렇지 않으면 한 세대에 굶어 죽을 것이기 때문)와 결함이 있는 동물이 종의 유전자 풀에 기여하는 이유를 수학적으로 설명하는 "내쉬 평형"의 개념 없이는 불가능합니다. 이 경우 종은 새로운 유용한 특성을 얻을 수 있습니다.

이제 내쉬는 거창한 발견을 하지 않을 것입니다. 그는 인생에서 가장 중요한 두 가지 일을 처리했기 때문에 더 이상 중요하지 않은 것 같습니다. 그는 젊었을 때 인정받는 천재가되었고 노년기에 난치병을 이겼습니다.

그리고 몇 가지 과학적 이론이 더 있습니다. 여기에 예가 있습니다. 에 대해서도 기억합시다. 그리고 아직 있다 원본 기사는 웹 사이트에 있습니다. InfoGlaz.rf이 사본이 만들어진 기사에 대한 링크 -

게임에 참여하는 에이전트는 무엇을 해야 하나요? 어떤 전략이 다른 전략보다 더 나은지 어떻게 결정할 수 있습니까?

어떤 전략이 확실히 효과가 없을지 결정하는 좀 더 겸손한 목표부터 시작하겠습니다.

정의 1.2. 에이전트의 전략은 다음과 같은 전략이 존재하는 경우 지배적이라고 합니다.

이 경우, 그들은 그것이 지배적이라고 말합니다.

즉, 다른 에이전트의 전략의 가능한 조합에 대해 모든 지점에서 더 나쁘지 않은 다른 전략이 있으면 전략이 지배적입니다. 따라서 선호할 이유가 전혀 없으며 분석에서 단순히 폐기할 수 있습니다.

예 1.4. Blotto 대령이 현장에 군대를 배치하려고 했던 예 1.2를 상기하십시오. 예 1.2의 매트릭스를 분석하면 전략 , 및 이 다른 전략에 의해 지배된다는 것이 분명해집니다. 예를 들어, 전략은 그 어떤 전략보다 우수할 것입니다. 물론 Blotto의 적도 마찬가지입니다. 따라서 매트릭스가 크게 줄어 듭니다.


예제 1.4 끝.

실시예 1.5. 우리가 Cournot 경쟁에 대해 논의한 예제 1.3에서 지배적인 전략이 많이 있었습니다. 모든 전략은 다음과 같았습니다. 마이너스 수익을 보장하는 반면 제로 전략(아무것도 생산하지 않음)은 수익을 0으로 보장합니다. 따라서 정사각형의 분석에 우리 자신을 제한하는 것이 즉시 가능했습니다. 전략의 집합으로.

예제 1.5 끝.

그러나 어떤 전략이 지배적 인 예를 구성하기가 쉽다는 점은 주목할 가치가 있습니다. 이것은 일부 전략이 동등하다는 것을 의미합니다. 즉, 서로를 지배합니다. 그러한 경우 적어도 하나는 남겨두어야 합니다. 그렇지 않으면 선택할 것이 전혀 없을 것입니다.

우리는 대화를 계속합니다. 지배적 전략 후에 다음을 도입하는 것이 논리적일 것입니다. 지배적인 전략.

정의 1.3. 에이전트의 전략은 우성, 다른 모든 전략이 그것에 의해 지배되는 경우, 즉,

지배적인 전략대리인을 위해 - 진정한 행복. 그는 생각할 필요가 전혀 없습니다. 지배적 인 전략을 선택하는 것으로 충분합니다. 어쨌든 다른 사람은 어떤 결과에서도 더 나은 것을 제공하지 않습니다.

또한 모든 에이전트가 지배적인 전략, 그런 다음 이러한 게임의 분석은 시작되기 전에 종료됩니다. 모든 에이전트가 자신의 지배적인 전략.

정의 1.4. 지배적 전략의 균형전략 게임의 경우 이는 모든 에이전트에 대해 전략이 지배적인 전략 프로필입니다.

이 균형이 가장 안정적입니다. 다음 강의에서는 이러한 균형이 발생하는 경제 메커니즘 이론의 예를 들어, 이른바 Vickrey 경매(정리 2.1.1 참조)를 제공합니다.

그러나 불행히도 행복이 항상 성취되는 것은 아닙니다. 예 1.1, 예 1.2, 예 1.3 모두에서 평형이 존재하지 않습니다. 지배적인 전략작동하지 않았다. 각 플레이어의 전략에는 다른 플레이어의 전략 프로필이 있었고 플레이어가 하나 또는 다른 것으로 변경하는 것이 도움이 될 것입니다.

내쉬 균형

이전 단락에서 에이전트가 지배적인 전략, 그러면 그는 생각하거나 걱정할 것이 없습니다. 그는 단순히 이 전략을 선택할 수 있습니다. 그러나 그러한 전략이 존재하지 않고 예상되지 않을 때 게임에 참여하는 에이전트는 무엇을 해야 합니까?

그런 다음 자신의 전략뿐만 아니라 다른 에이전트의 전략도 고려해야 합니다. 이 설명은 1950년 John Nash가 공식화한 평형 개념으로 이어질 것입니다.

정의 1.5. 순수 전략의 내쉬 균형전략 게임의 경우 이것은 모든 에이전트에 대해 다음 조건이 충족되는 전략의 프로필입니다.

즉, 이전과 마찬가지로 에이전트가 선택한 전략에서 벗어나는 것은 수익성이 없습니다. 그러나 이제 다른 대리인을 위한 전략 선택과 함께 추상적으로 하지 않고 특정 전략 프로필에서만 이 작업을 수행하는 것은 수익성이 없습니다.

실시예 1.6. 우리는 가난한 Blotto를 계속 고려합니다. 지배 전략이 없는 대령의 게임 매트릭스는 예제 1.4에 나와 있습니다. 매트릭스에서 한 플레이어가 전략을 선택하면 다른 플레이어의 선택에 의존하지 않는다는 것을 쉽게 알 수 있습니다. 즉, 다른 플레이어가 전략에서 벗어날 이유가 없다고 말할 수 있습니다. 이 모든 것은 이 게임의 전략 프로파일이 내쉬 균형에 있음을 의미합니다.

예제 1.6 끝.

계속해서 예를 들어 보겠습니다. 저를 믿으세요. 우리는 여전히 그러한 추론을 기다리고 있으며 조금 더 진지한 분석에 익숙해져야 할 때입니다.

실시예 1.7. 예 1.3의 경쟁에 대한 쿠르노 분석으로 돌아가 보자. 이번에는 어떤 것도 단순화하지 않을 것입니다. 가격이 알려지지 않은 함수로 주어집니다. , 그리고 각 기업의 생산 비용은 의 미지의 함수입니다. 내쉬 균형을 찾기 위해 최선의 답 함수를 찾습니다. 회사의 이익은 다음과 같이 정의됩니다.

fixed 에 대한 함수의 최대값을 결정하려면 도함수를 구하면 됩니다.

그리고 그것을 0과 동일시하십시오. 따라서 내쉬균형은 양 기업이 상대방의 전략, 즉 다음 시스템의 결정에 대해 최적의 대응을 하는 경우에 도달한다. 미분 방정식:


우리는 예 1.3에서 고려된 특정 경우에 내쉬 평형이 실제로 그림 1.3의 선의 교차점이 될 것임을 확인하기 위해 독자에게 맡깁니다. 1.1.

예제 1.7 끝.

정의 1.5에서 이상한 용어를 언급했습니다. 순수한 전략": 그것들은 또 무엇입니까? 전략은 순수할 뿐만 아니라 혼합되어 있음이 밝혀졌습니다. 혼합 전략은 전략 개념의 논리적 확장입니다. 플레이어가 그 중 하나를 선택할 뿐만 아니라 만들 수도 있습니다. 그들로부터 다소 무작위 선택.

정의 1.6. 혼합 전략전략 게임의 플레이어에게 확률 분포, 모두의 집합은 어디에 있습니까 확률 분포위에 .

혼합 전략은 모든 가중치의 합(연속적인 경우 적분)이 1이 되도록 각 전략에 대한 가중치를 설정하는 것으로 생각할 수도 있습니다.

내쉬 균형이 없는 게임이 있습니다. 순수한 전략. 그러나 그것은 항상 (궁극적으로) 혼합 전략.

실시예 1.8. 예제 1.1에서 이미 작성한 매트릭스인 "가위바위보" 게임을 상기하십시오.

분명히, 아니 순수 전략의 내쉬 균형여기가 아닙니다. 어떤 전략이든 이를 반박할 사람이 있습니다. 그러나 내쉬균형은 혼합 전략여기에서 사용할 수 있습니다. 두 번째 플레이어는 확률로 바위, 가위 또는 종이를 선택하고 첫 번째 플레이어는 확률로 선택하고 . 그런 다음 첫 번째 플레이어가 확률로 승리합니다.

또한 같은 확률로 지고 무승부가 됩니다. 즉, 상대방이 동일한 확률로 전략을 선택하면 모든 전략이 플레이어에게 동일합니다. 게임이 대칭이기 때문에 혼합 전략 프로파일이

균형을 이루고 있습니다.

예제 1.8 끝.

의 균형을 증명 혼합 전략항상 존재하며 Kakutani 고정 소수점 정리 [ , ]를 따릅니다.

정리 1.1(Kakutani) 비어 있지 않은 볼록 컴팩트 부분집합을 하자 유클리드 공간, ㅏ - 다중값 함수집합이 비어 있지 않고 닫혀 있으며 모두 볼록하도록 닫힌 그래프를 사용합니다. 그럼 당신은

게임에서 0이 아닌 합계게임의 모든 참가자는 이기거나 질 수 있습니다. 바이매트릭스 게임는 0이 아닌 합을 가진 두 플레이어의 유한 게임입니다. 이 경우 각 게임 상황 A i B j에 대해 각 플레이어는 첫 번째 플레이어에 대해 ij를, 두 번째 플레이어에 대해 bij를 지불합니다. 예를 들어, 불완전 경쟁 시장에서 생산자의 행동은 이중 매트릭스 게임으로 축소됩니다. 온라인 계산기를 사용하여 솔루션 찾기 바이매트릭스 게임, 상황뿐만 아니라 파레토 최적 및 내쉬 안정 상황.

두 참가자 각각이 자신의 행동 방식을 선택하기 위해 다음과 같은 옵션을 가지고 있는 갈등 상황을 고려하십시오.

  • 플레이어 A는 전략 А 1 ,…,А m ,
  • 플레이어 В – 모든 전략 В 1 ,…,В n .

동시에, 그들의 공동 선택은 매우 명확하게 평가됩니다. 플레이어 A가 선택하면 i번째 전략 A i , 플레이어 B 는 k 번째 전략 B k 이고 결과적으로 플레이어 A 의 보수는 어떤 숫자 a ik 와 같을 것이고 플레이어 B 의 보수는 일반적으로 말해서 또 다른 숫자 b ik 입니다.
플레이어 A의 모든 전략과 플레이어 B의 모든 전략을 순차적으로 거치면 두 테이블을 결과로 채울 수 있습니다.

첫 번째 테이블은 플레이어 A의 보수를 설명하고 두 번째 - 플레이어 B의 보수를 설명합니다. 일반적으로 이러한 테이블은 행렬 형태로 작성됩니다.
여기서 A는 선수 A의 보수 행렬이고 B는 선수 B의 보수 행렬입니다.

따라서 플레이어의 이해 관계가 다른 경우(반드시 반대는 아님) 두 가지 결과 매트릭스가 얻어집니다. 하나는 플레이어 A에 대한 수익 매트릭스이고 다른 하나는 플레이어 B에 대한 수익 매트릭스입니다. 따라서 이름은 일반적으로 이러한 게임에 할당되는 것은 매우 자연스럽게 들립니다. 바이매트릭스.

내쉬 균형- 평형, 게임의 다른 참가자가 특정 전략을 고수하는 경우 게임의 각 참가자가 자신에게 최적인 전략을 선택할 때.
내쉬 균형이 항상 참가자에게 가장 최적인 것은 아닙니다. 이 경우, 우리는 평형이 아니라고 말한다. 파레토 최적.
순수한 전략- 다른 플레이어의 가능한 행동에 대한 플레이어의 특정 반응.
혼합 전략- 다른 플레이어의 행동에 대한 플레이어의 확률론적(정확히 정의되지 않음) 반응.

예 #1. 시장을 위해 싸워라.
기업은 더 큰 기업이 통제하는 두 시장 중 하나에서 위탁 상품을 판매하려고 합니다. b. 이를 위해 그녀는 준비 작업특정 비용과 관련이 있습니다. 기업 b가 어느 시장에서 자사 제품을 판매할지 추측하면 대응 조치를 취하고 시장의 "포착"을 방지합니다(이 옵션은 기업 a의 패배를 의미함). 그렇지 않으면 회사가 이깁니다. 기업의 경우 첫 번째 시장에 침투하는 것이 두 번째 시장에 침투하는 것보다 수익성이 높지만 첫 번째 시장에서 투쟁하려면 많은 자금이 필요합니다. 예를 들어, 첫 번째 시장에서 기업의 승리는 두 번째 시장에서 승리한 것보다 두 배의 이익을 가져오지만 첫 번째 시장에서 패배하면 완전히 그녀를 망칩니다.
작곡하자 수학적 모델기업 1을 기업 b로, 기업 2를 기업 2로 간주하는 이 갈등의 경우, 기업 1의 전략은 다음과 같습니다. 하지만 1 - 시장 침투 1, 하지만 2 – 시장 침투 2; 플레이어 2 전략: 1 - 시장 1에서의 대응책, 2 - 시장의 대응책 2. 회사와 회사의 첫 번째 시장에서의 승리는 2 단위로 추정되고 두 번째 시장의 승리는 1 단위로 추정됩니다. 첫 번째 시장에서 기업 a의 패배는 -10으로, 두 번째 시장에서는 -1로 추정됩니다. 기업 b의 경우 승리는 각각 5와 1이고 손실은 -2와 -1입니다. 결과적으로 우리는 보수 행렬이 있는 이중 행렬 게임 Г을 얻습니다.
.
정리에 따르면 이 게임은 순수하거나 완전히 혼합된 균형을 가질 수 있습니다. 순수 전략에는 균형 상황이 없습니다. 이제 이 게임이 완전히 혼합된 평형 상태인지 확인하겠습니다. 우리는 찾는다 , .
따라서 고려 중인 게임은 고유한 균형 상황을 갖습니다. 여기서 , . 다음과 같이 게임을 여러 번 반복함으로써(즉, 설명된 상황을 반복적으로 재현함으로써) 구현할 수 있습니다. 회사 a는 빈도 2/9 및 7/9로 순수 전략 1과 2를 사용해야 하고 회사 b는 순수 전략을 사용해야 합니다. 주파수 3/14 및 11/14의 1 및 2. 지정된 혼합 전략에서 벗어나는 모든 회사는 예상 수익을 줄입니다.

예 #2. 바이매트릭스 게임에 대한 파레토 최적 상황과 내쉬 안정 상황을 찾습니다.

예 #3. 2개의 회사가 있습니다. 첫 번째 회사는 두 제품 A 1 과 A 2 중 하나를 생산할 수 있고, 두 번째 회사는 두 제품 B 1 , B 2 중 하나를 생산할 수 있습니다. 첫 번째 회사가 제품 A i (i = 1, 2)를 생산하고 두 번째 - B j (j = 1, 2)를 생산하는 경우 이러한 회사의 이윤(해당 제품이 보완적인지 경쟁적인지에 따라 다름)은 다음과 같이 결정됩니다. 테이블 번호 1:

1에서2에서
1(5, 6) (3, 2)
2(2, 1) (5, 3)
기업들이 서로 합의했다고 가정하고 내쉬 차익거래 솔루션을 이용하여 공정한 이익 분배를 결정합니다.

학자들은 거의 60년 동안 게임 이론을 사용하여 기업이 내리는 전략적 결정에 대한 분석을 확장하여 특히 다음과 같은 질문에 답했습니다. 기업은 왜 일부 시장에서는 공모하고 다른 시장에서는 공격적으로 경쟁하는 경향이 있습니까? 잠재적 경쟁자를 배제하기 위해 회사를 이용하는 것; 가격 결정 방법, 수요 또는 비용 조건이 변경될 때 또는 새로운 경쟁자가 시장에 진입할 때 등

게임 이론 분야에서 최초로 연구를 수행한 사람은 J.-F. Neumann과 O. Morgenstern은 "게임 이론과 경제 행동"(1944)이라는 책에서 그 결과를 설명했습니다. 그들은 이 이론의 수학적 범주를 사회의 경제 생활로 확장하여 최적 전략의 개념, 기대 효용 극대화, 게임에서의 지배력(리이쿠에서), 연합 협정 등을 도입했습니다.

과학자들은 유리한 결과를 얻기 위해 시장 참가자의 합리적인 행동에 대한 기본 기준을 공식화하려고 했습니다. 그들은 게임의 두 가지 주요 범주를 구별했습니다. 첫 번째는 보상이 다른 플레이어를 잃는 것으로만 구성되는 "제로섬 게임"입니다. 이와 관련하여 일부의 이익은 다른 참가자의 손실을 희생하여 반드시 형성되어야하므로 이익과 손실의 총합은 항상 0과 같습니다. 두 번째 범주는 개별 플레이어가 자신의 지분으로 구성된 승리를 위해 경쟁하는 "승리 게임"입니다. 때로는 "출력"( 카드 게임인 브리지(in bridge)는 내기를 할 때 게임에 참여하지 않는 플레이어 중 한 명을 의미합니다.) 완전히 수동적이며 종종 착취의 대상이 됩니다. 두 경우 모두, 연구원들이 믿었던 것처럼 각 참가자가 "기능을 최대화하려고 노력하고 변수가 통제되지 않는" 것이기 때문에 게임에는 불가피하게 위험이 따릅니다. 모든 플레이어가 능숙하다면 기회가 결정적인 요소입니다. 그러나 이것은 거의 발생하지 않습니다. 교활함은 거의 항상 게임의 중요한 부분이며, 이를 통해 상대방의 의도를 밝히고 의도를 숨긴 다음, 이 상대방이 자신에게 해를 끼치도록 행동하게 만드는 유리한 위치를 차지하려는 시도가 이루어집니다. 많은 것이 "대책"에 달려 있습니다.

게임 중 중요한 합리적인 행동플레이어, 즉 최적의 전략을 신중하게 선택하고 구현합니다. 공식화된(모델 형태의) 설명 개발에 중요한 기여 갈등 상황, 특히 "평형 공식"의 정의에서, 즉 게임에서 상대방의 결정의 안정성은 미국 과학자 J.-F에 의해 도입되었습니다. 내쉬.

Nash John Forbes는 1928년(미국 G. Vluefild)에서 태어났습니다. 그는 Carnegie Mellon University에서 화학 공학 학위를 취득하고 "국제 경제학" 과정을 마스터했습니다. 그는 학사 학위와 동시에 수학 석사 학위를 받았습니다.

1950년, Iriaston 대학에서 그는 "비협조적 게임"에 대한 박사 학위 논문을 변호했습니다. 1951년부터 그리고 거의 8년 동안 내쉬는 매사추세츠 대학의 교수였습니다. 기술 연구소동시에 활발한 연구 활동을 수행합니다.

1959년 봄부터 과학자는 병에 걸려 일할 능력을 잃었습니다. 70년대에는 수학 취미로 돌아갈 수 있었지만 과학적 결과를 내기는 어려웠다. 1994년 노벨 위원회는 실제로 1949년에 쓰여진 작품을 수여했습니다

미국 국립 과학 아카데미, Bkonometric Society 및 미국 예술 과학 아카데미의 회원입니다.

다양한 게임을 철저히 연구하고 일련의 새로운 수학 게임을 만들고 다양한 게임 상황에서 참가자의 행동을 관찰한 Nash는 시장이 어떻게 작동하는지, 회사가 위험 관련 결정을 내리는 방법, 구매자가 특정 상황에서 행동하는 이유에 대해 더 깊이 이해하려고 노력했습니다. 방법. 경제학에서 게임과 마찬가지로 회사 관리자는 최신 단계뿐만 아니라 경쟁사의 이전 단계와 전체 경제(예: 체스) 분야의 상황 및 기타 여러 중요한 사항을 고려해야 합니다. 요인.

경제 생활의 과목- 경쟁 환경에서 시장에서 위험을 감수하는 적극적인 참가자이며 정당화되어야 합니다. 따라서 그들 각자는 플레이어로서 자신의 전략을 가지고 있어야 합니다. 이것이 Nash가 나중에 자신의 이름을 따서 명명된 방법(Nash 균형)을 개발할 때 염두에 두었던 것입니다.

게임 이론의 기본 개념으로서의 전략에 대한 그의 이해 J.-F. Nash는 각 플레이어가 특정 수의 전략을 가지고 있는 "제로섬 게임"(그는 이를 "대칭 게임"이라고 부름)의 관점에서 설명합니다. 각 플레이어의 보수는 그와 그의 상대가 선택한 전략에 따라 다릅니다. 이를 기반으로 게임을 여러 번 반복한 후 이 플레이어에게 가능한 최대 평균 이득(또는 가능한 최대 평균 손실)을 제공하는 최적의 전략을 찾기 위해 매트릭스가 구성됩니다. 플레이어는 상대방이 어떤 전략을 선택할지 모르기 때문에 자신을 위해 상대방의 최악의 행동에 대해 설계된 전략을 선택하는 것이 (합리적으로) 더 좋습니다 (소위 "보장 된 결과"의 원칙) . 신중하게 행동하고 상대방을 강력한 경쟁자로 간주하여 우리 플레이어는 각 전략에 대해 가능한 최소 보수를 선택할 것입니다. 그런 다음 모든 최소 승리 전략 중에서 그는 모든 최소 수익의 최대값인 최대값을 제공하는 전략을 선택합니다.

하지만 적도 아마 그렇게 생각할 것입니다. 그는 플레이어의 모든 전략에서 가장 큰 손실을 발견한 다음 이러한 최대 손실에서 최소값인 최소값을 선택합니다. maximin이 minimax와 같으면 플레이어의 결정이 안정적이고 게임이 균형을 이룹니다. 결정(전략)의 안정성(균형)은 선택한 전략에서 벗어나 게임의 두 참가자 모두에게 이익이 되지 않는다는 것입니다. maximin이 minimax와 같지 않은 경우 두 플레이어의 결정(전략)이 어떻게든 상대방의 전략 선택을 추측하면 불안정하고 신경 중요합니다.

일반적인 짧은 정의내쉬 균형은 각 플레이어의 전략이 전략 게임의 나머지 참가자가 채택한 다른 전략 중 가장 좋은 결과입니다. 이 정의는 다른 참가자가 자신의 행동 라인을 확고히 고수한다면 자신의 역할을 변경하여 최대 이익(효용 기능의 극대화)을 달성할 수 있는 참가자가 없다는 사실에 기반합니다.

J.-F. Nash는 최적의 정보량을 나타내는 지표인 전략 개발에 없어서는 안될 요소로 이를 포함하여 반복적으로 강화해 왔습니다. 그는 (1) 플레이어가 상대에 대해 충분히 알고 있는 상황과 (2) 상대에 대한 불완전한 정보를 갖고 있는 상황의 분석에서 최적의 이 지표를 도출했습니다. 이 가정을 수학적 언어에서 경제학의 언어로 번역한 후 Nash는 시장 관계의 통제되지 않는 변수를 환경 조건에 대한 지식의 중요한 정보 요소로 도입했습니다. 그 후 내쉬 균형은 복잡한 관계를 더 잘 이해하기 위해 경제학의 거의 모든 분야에서 사용되는 방법이 되었습니다. 이는 1994년 10월 스웨덴 왕립 아카데미 회원이자 회장인 A. Lindbeck의 새로운 노벨 경제학상 수상자 발표에서 언급되었습니다. 노벨경제학상 위원회.

내쉬균형의 적용은 미시경제학에서 중요한 단계였다. 그것의 사용은 시장의 발전과 기능, 다양한 기업의 관리자가 내리는 전략적 결정의 근거에 대한 심층적인 이해에 기여했습니다. 내쉬 균형은 과점 시장을 포함하여 정치적 협상과 경제적 행동의 과정을 연구하는 데 사용할 수 있습니다.

비협조적 게임의 균형 분석을 개척한 공로로 1994년 노벨 경제학상을 J.-F. Nash in, R. Selten 및 J. Harshani. J. Neumann과 O. Morgenstern의 "게임 이론과 경제 행동"의 고전 연구를 시작으로 경제 분석의 필수적인 부분은 자신의 라인을 개발하기 위해 조건에서 경제 주체 간의 상호 작용 전략에 대한 연구가되었습니다. 행동의 다른 하위 "대상의 행동을 고려할 필요가 있습니다 (특히 체스, 선호도 및 기타 게임에서 발생).이 세 명의 노벨상 수상자는 게임 이론의 파생물에 큰 공헌을했습니다. 비협조적 게임 이론(즉, 참가자 간에 합의에 도달했을 때의 게임). 이 이론의 기본 요점은 평형의 개념이며, 상호 작용의 결과를 예측하는 데 사용됩니다.

내쉬 균형은 게임 이론의 기본 개념이 되었습니다.

이산 선택 분석

20세기의 마지막 분기까지. 소비자 행동의 주요 역할은 상식과 계산이 지배한다는 의견. 자유주의 경제 이론이 공식화되는 것은 소비자의 상식을 염두에 두고 있습니다. 이 과학적 방향의 경제학자들은 경제 주체 간의 관계 시스템으로서의 시장이 상식에 따라 상품과 서비스에 대한 공정한 가격을 자율 규제하고 설정할 수 있다고 믿습니다.

자유주의 경제 학파가 경쟁적인 보수 학파보다 더 많은 과학적 성과를 세상에 내놓았지만, 그 이론은 그 지지자들이 인정하는 적용 범위가 제한적입니다. 예를 들어, 통화주의자(그들도 자유주의자임)는 아직 국제 금융 시장에서 투자자의 행동과 세계 원자재 가격의 엄청난 변동을 합리적으로 설명할 수 없습니다.

자유주의 시장 접근 방식은 신뢰할 수 있는 예측을 하기에는 너무 단순했습니다. 소비자 요구소비자가 그러한 상품을 엄청나게 선택하고 동시에 구매량에 제한이 없는 환경에서 서비스 및 상품에 대해 선진국소비자 신용은 매우 일반적입니다. 또한, 자유주의 이론은 예를 들어 미국(또는 영국) 가족이 미국(또는 영국) 자동차를 사는 반면 한국 자동차가 더 저렴하다는 것을 설명할 수 없습니다. 즉, 이 이론은 상식적인 관점에서 설명하기 어려운 소비자 행동의 국가적 특성 및 기타 특성을 고려하지 않습니다.

따라서 최근 몇 년 동안 에코 자미스트 과학자들은 통계적 방법을 사용하여 연구해야 하는 소비자 행동에 대한 데이터를 기반으로 직접 개발한 새로운 경제 이론의 출현에 대해 점점 더 자주 이야기하고 있습니다. 이 이론은 효용이 측정되는 방법에 대한 설명을 제공합니다. 이러한 평가가 주관적이라는 사실에도 불구하고 경제 정책 시행에 대한 가치를 결정하는 것은 주관성입니다. 많은 경제학자들은 XXI 세기에 소비자 행동 이론 (유명한 저자 - D. - L. McFedden)이 될 것이라고 예측합니다. 선진국의 경제 및 정치 전략을 결정하는 기초.

McFedden Daniel Little은 1937년에 태어났습니다. (미국 캐롤라이나 주 롤리). 미네소타 대학교에서 공부하고 일했습니다. 1962년에 그는 박사 학위 논문을 변호했고, 피츠버그 대학에서 경제학 조교수로 일했고, 당시에는 캘리포니아 대학에서 경제학 교수로 일했으며 1991년부터 계량 경제학 연구소를 책임지고 있습니다.

공동 저자로 출판된 다음과 같은 작품: "에세이 경제적 행동불안정한 조건에서"(1974), "도시 이동에 대한 수요: 행동 분석"(1976), "생산 경제학: 이론과 실천에 대한 이중 접근"(1978), "경제적 응용을 통한 이산 데이터의 구조 분석" (1981), "미시경제적 모델링 및 수치해석: 공공시설의 수요에 관한 연구"(1984)," 계량경제학 핸드북"(Vol. 4, 1994) 및 많은 과학 기사.

1983-1984년 동안. 그는 부사장이었고 1985년에는 계량 경제학 학회 회장이었습니다. 1994년에는 미국 경제 협회 부회장으로 선출되었습니다. 미국 국립 과학 아카데미, 미국 계량 학회 및 예술 과학 아카데미의 회원인 미국 경제 협회는 그에게 J.-B. Clark, 계량 경제학 학회 - R. Frisch 메달.

아주 자주 마이크로데이터는 개별적인 선택, 즉 유한한 대안 솔루션 세트 중에서 선택을 반영하는 것으로 알려져 있습니다. 경제 이론에서 전통적인 수요 분석은 개인의 선택이 연속 변수로 표현되어야 한다고 가정했지만 이 처리는 이산 선택의 행동을 연구하는 것과 일치하지 않습니다. 많은 과학자들의 이전 업적에 의해 그러한 선거에 대한 경험적 연구는 경제 이론에서 입증되지 않았습니다.

이산 선택 분석 방법론 D.-l. McFadden은 각 개인이 자신의 효용을 극대화하는 특정 대안을 선택한다는 미시경제학 이론에 뿌리를 두고 있습니다. 효용 함수는 소비자 선택을 설명하는 방법입니다. 서비스 집합 X가 선택되고 서비스 집합 B를 사용할 수 있는 경우 X는 B보다 더 큰 효용을 가져야 합니다. 소비자의 선택을 연구하여 추정치를 도출할 수 있습니다. 그들의 행동을 적절하게 설명할 효용 함수. 분명히 개인의 선택에 영향을 미치는 전체 사실을 조사하는 것은 불가능하지만 거의 동일한 특성을 가진 개인 간의 변화 역학을 분석하면 상당히 객관적인 결론을 도출 할 수 있습니다.

디.-엘. McFedden은 T. Domenick과 공동으로 정기 운송 여행과 관련된 소비자 행동을 연구했습니다1. 대부분의 주요 도시에서 통근자들은 대중교통을 이용할 것인지 운전하여 출근할 것인지 선택할 수 있습니다. 이러한 각 대안은 집합으로 볼 수 있습니다. 다양한 특성 A: 이동 시간, 대기 시간, 이용 가능한 비용, 편안함, 편리성 등. 따라서 여행 종류별 이동 시간의 길이를 x(, 여행 종류별 대기 시간의 길이를 x2 등으로 나타낼 수 있습니다.

(xx, x2, xx)가 자동차 여행의 n개의 다른 특성 값을 나타내고 (y1, y2 ... .. y n) - 버스 여행 특성 값을 나타내는 경우 다음 모델을 고려할 수 있습니다. 소비자는 특정 특성 세트에 대한 선호도에 따라 자동차로 갈 것인지 버스로 갈 것인지 결정합니다. 보다 구체적으로, 이러한 특성과 관련하여 일반 소비자의 편익은 다음 형식의 효용 함수로 나타낼 수 있다고 가정할 수 있습니다.

여기서 계수 b 및, b 2 i 등 D - 알 수 없는 매개변수. 이 효용 함수의 단조 변환은 소비자 선택을 설명할 수 있지만 통계적 관점에서 선형 함수로 작업하는 것이 훨씬 쉽습니다.

이동 시간, 비용 및 그들이 만나는 기타 여행 특성에 대한 특정 데이터를 기반으로 자동차 또는 버스로 여행할지 여부를 선택하는 유사한 소비자 그룹이 있다고 가정해 보겠습니다. 통계에는 주어진 복수의 소비자가 선택한 연구 구조에 가장 적합한 계수 D의 값을 찾는 데 사용할 수 있는 기술이 있습니다. 이러한 통계적 기법을 통해 추정된 효용 함수를 도출할 수 있습니다. 다양한 방법수송 운동.

McFadden과 Domenick은 다음 형식의 효용 함수를 제안했습니다.

여기서 TW는 버스 또는 자동차를 오가는 총 도보 시간입니다. TT - 총 이동 시간(분) C는 여행의 총 비용(달러)입니다.

추정된 효용 함수를 사용하여 저자가 취한 표본에서 93%의 가구에 대해 자동차와 버스 운송 사이의 선택을 올바르게 설명하는 것이 가능했습니다. 위 방정식의 변수에 대한 계수는 이러한 각 특성의 한계 효용을 보여줍니다. 한 계수 대 다른 계수의 비율은 한 특성이 다른 특성으로 대체되는 한계 비율을 나타냅니다. 예를 들어, 전체 이동 시간의 한계 효용에 대한 도보 시간의 한계 효용의 비율은 평균 소비자가 도보 시간이 이동 시간보다 약 3배 느리다고 생각한다는 것을 나타내지 않습니다. 즉, 소비자는 걷는 1분을 절약하기 위해 여행에 3분을 추가로 보낼 의향이 있습니다. 유사하게, 총 여행 기간에 대한 여행 비용의 비율은 이 두 변수에 대한 평균 소비자의 선택을 나타냅니다. 이 연구에서 일반 승객은 0.0411 x x 2.24 = 분당 $0.0183, 즉 시간당 $1.10로 운송으로 1분의 이동 시간을 추정했습니다. (비교하자면 1967년 여객의 평균 시급은 시간당 2.85달러였다.)

이러한 효용 기능의 추정은 대중 교통 시스템에 변경 사항이 있는지 여부를 결정하는 데 유용할 수 있습니다. 예를 들어 위의 유틸리티 함수에서 다음 중 하나가 중요한 요소소비자가 선택에 따라 무엇을 선택하는지 설명하는 것은 여행 기간입니다. 도시의 교통 당국은 적은 비용으로 이 총 여행 시간을 줄이기 위해 버스 수를 늘릴 수 있지만 비용 증가를 정당화하려면 추가 승객 수를 계산해야 합니다.

효용 함수와 소비자 표본을 사용하여 어떤 소비자가 자동차로 여행하고 싶어하고 어떤 소비자가 버스를 선호할지 예측할 수 있습니다. 이를 통해 수익이 추가 비용을 충당하기에 충분한지 여부를 알 수 있습니다. 또한, 한계 대체율은 각 소비자의 이동 시간 감소 추정치에 대한 통찰력을 제공하는 데 사용할 수 있습니다. McFadden과 Domenick의 연구에 따르면 1967년의 평균 승객은 이동 시간을 시간당 $1.10로 추정했으며 이동 시간을 20분 단축하기 위해 37센트를 지불할 용의가 있었습니다. 이 숫자는 보다 시기 적절한 버스 서비스의 달러 가치를 나타냅니다. 이득의 양적 측정의 존재는 확실히 채택에 기여합니다 합리적인 결정교통 정책 분야에서.

McFedden의 또 다른 중요한 기여는 1974년에 개발된 소위 조건부 로짓 분석입니다. 이 모델은 각 사람이 인생에서 수많은 대안에 직면한다고 가정합니다. 각 대안과 관련된 특성을 X로 표시하고 가용 데이터를 사용하여 연구자가 관찰할 수 있는 개인의 특성을 2로 표시합니다. 예를 들어, 자동차, 버스 또는 지하철이 대안이 될 수 있는 여행 선택 연구의 경우 X에는 시간 및 비용에 대한 정보가 포함될 수 있고 X에는 연령, 수입 및 교육에 대한 데이터가 포함될 수 있습니다. 그러나 개인과 폴더에 대한 대안의 차이점은 X \% 사이와 같이 연구원에게는 보이지 않지만 개인의 가장 유용한 선택을 결정합니다. 이러한 특성은 임의의 오류 벡터로 표시됩니다. McFadden은 이러한 무작위 오류가 모집단 사이에 특정 통계적 분포(분포)를 가지고 있다고 제안했으며 이를 극단값 분포라고 합니다. 이러한 조건(몇 가지 기술적 예측 포함)에서 그는 사람이 대안을 선택할 확률이 로짓 모델의 다항식으로 작성될 수 있음을 보여주었습니다.

여기서 e는 자연 로그의 밑수입니다. b와 b는 매개변수(벡터)입니다. 그의 데이터베이스에서 연구원은 개인이 대안을 선택함에 따라 실제로 변수 X와 Z를 관찰할 수 있습니다. 결과적으로 과학자는 매개변수 p와<5, использовав известные статистические методы. Мак-Федденивське дифференцировки логит-модели осталось новацией и признается фундаментальным достижением.

모델은 도시 교통 수요 연구에서 일반적으로 사용됩니다. 또한 사회적 또는 환경적 변화뿐만 아니라 정치적 조치의 효과를 연구할 계획인 경우 운송에 사용할 수도 있습니다. 예를 들어 *이 모델은 상품 가격의 변화가 가용성을 향상시키는 방법, 인구 통계 학적 상황, 대체 교통 수단을 사용하는 여행량에 영향을 미치는 방법을 설명 할 수 있습니다. 이 모델은 특히 주택, 거주지 또는 교육 선택에 대한 연구와 같이 다른 많은 영역에도 적용할 수 있습니다. McFadden은 개발된 방법을 사용하여 가계 에너지 수요, 전화 서비스 및 노인 주택과 같은 많은 사회적 문제를 분석했습니다.

그의 연구 결과 과학자는 조건부 로짓 모델이 다른 여행 옵션의 비용과 관계없이 버스 또는 기차 여행과 같은 두 가지 대안 중에서 선택할 확률과 관련하여 특정 기능이 있다는 결론에 도달했습니다. 비관련 대안의 독립성(NNA)이라고 하는 이 기능은 통계적 소비에 비현실적입니다. 디.-엘. McFadden은 NHA 일치를 위한 통계적 테스트를 발명했을 뿐만 아니라 개인의 선택이 특정 순서로 이루어질 수 있다고 가정하는 죄수 로짓 모델에 의해 호출되는 일반 모델을 제안했습니다. 예를 들어, 거주지와 주택 유형에 관한 결정을 검토할 때 시민이 먼저 소구를 선택한 다음 주택 유형을 선택한다고 가정합니다.

이러한 일반화에도 불구하고 모델은 모집단 전체에서 관찰할 수 없는 특성의 분포에 대한 특정 예측에 매우 민감합니다. 지난 10년 동안 D.-l. McFadden은 훨씬 더 기본적인 가정을 하는 이산 모델 선택의 통계적 평가를 위해 시뮬레이션 모델(모멘트 모멘트 방법)을 개발했습니다. 강력한 컴퓨터는 이러한 수치 방법의 실제 적용 가능성을 확장했습니다. 결과적으로 개인의 개별적인 선택을 보다 현실적으로 설명할 수 있고 자신의 결정을 보다 정확하게 구상할 수 있습니다. McFadden은 그의 새로운 이론을 바탕으로 다른 대안을 선택할 인구의 의도를 예측하는 데 사용할 수 있는 미시경제학적 모델을 개발했습니다. 개별 통계 및 경제 데이터의 공식 처리 방법을 개발한 공로로 McFedden은 노벨상을 수상했습니다.

디.-엘. 1960년대에 McFadden은 또한 생산 기술을 평가하기 위한 계량 경제학 방법을 발명했고 자본과 노동에 대한 기업의 필요에 간접적으로 영향을 미치는 요인을 탐구했습니다. 1990년대에 재능있는 과학자는 환경 관리의 경제학을 과학적으로 발전시키고 천연 자원의 가치 평가에 대한 방법론 문헌을 풍부하게 했으며 특히 1989년 유막 이동으로 인한 환경 피해로 인한 공공 부의 손실을 연구했습니다. 사고로 손상된 유조선 "Exxon Valdez"에서 * 알래스카 해안을 따라.

교수 D.-l의 연구 주제. McFedden의 도움으로 사회 문제를 해결하기 위해 경제 이론, 통계 및 경험적 방법을 결합하려는 시도. 그의 과학적 발전은 또한 사회학자와 정치가가 소득 등을 기준으로 유권자의 선택을 평가하는 데 도움이 됩니다.

McFadden은 각 개인이 자신의 효용을 극대화하는 특정 대안을 선택하는 이산 선택 분석 방법론을 최초로 제안했습니다. 효용 기능은 소비자 선택을 설명하는 방법입니다. 소비자의 선택을 연구함으로써 소비자의 행동을 적절하게 설명할 수 있는 추정된 효용 함수를 도출하는 것이 가능합니다.

이는 이 개념이 단순한 추상적인 용어가 아니라 실생활 패턴의 일반화임을 보여주기 위해 현실에서 드러난다. 그러나 예제의 명확성에도 불구하고 단 하나의 경우에만 우리가 일종의 퇴화 사례를 발견한 것처럼 보일 수 있습니다. 따라서이 규칙에 대한보다 일반적인 설명을 고려하는 것이 좋습니다.

많은 독자들은 내쉬 균형의 매우 흔한 특수한 경우인 이른바 "죄수의 딜레마"를 통해 내쉬 균형에 대해 잘 알고 있을 것입니다. 그 본질은 다음과 같습니다.

교도소에는 따로 적발된 두 명의 죄수가 있지만 여전히 더 심각한 범죄로 의심받고 있다. 참여가 입증되면 수감 기간이 10년으로 늘어납니다. 이제 그들은 각각 1년 동안 앉아 있습니다. 조사는 그들 각각을 거래하고 두 번째에 대해 증언하도록 초대합니다. 이 경우 첫 번째 임기는 6개월로, 두 번째 임기는 10개월로 단축된다. 그러나 죄수들은 서로를 비방할 경우 두 사람 모두에게 5년을 더 추가하게 될 것이라는 점을 이해하고 있습니다.

레이아웃은 다음 표를 사용하여 표시할 수 있습니다.

"녹색" 옵션(1, 2)과 (2, 1)이 대칭인 반면 다른 두 옵션에서는 죄수의 위치가 동일하다는 것을 쉽게 알 수 있습니다. 따라서 수감자 중 한 사람의 관점에서 상황의 논리를 고려할 수 있습니다. 두 번째 경우에는 동일합니다.

물론 죄수는 자신에게 가능한 가장 짧은 형을 원합니다. 그러나 그가 침묵을 지키면 아마도 그의 동료가 그에 대해 증언할 것이며, 이는 그의 형을 10년으로 늘릴 것입니다. 약속한 기간 단축이 아니었다면 "내가 왜 그래야 하지?" 라는 생각으로 위안을 삼을 수 있지만, 기간을 단축하고 싶은 유혹이 너무 큽니다. 또한 두 번째 죄수는 첫 번째가 이해하는 대로 첫 번째 죄수를 의심하여 ​​두 번째 죄수에 대해 증언하여 형을 늘립니다.

첫 번째 사람은 “10년 동안 극단적이고 천둥번개치는 것은 수치스러울 것입니다.”라고 생각합니다. 그러나 “두 번째 사람도 아마 같은 생각을 하고 나를 의심할 것입니다. 따라서 동료가 나를 배신하지 않을 가능성은 거의 없습니다. 증언이 필요하다는 것이 밝혀졌습니다. 두 번째 기적에 의해 침묵이 유지되면 그가 목소리를 내면 6 개월이 될 것입니다. 5. 글쎄, 적어도 10은 아니지만 조사를 시작한 공범 때문에 필연적으로 얻을 것입니다!

"주황색" 옵션(1, 1)은 둘 다 소화할 수 있으며 어떤 의미에서는 이 상황에서 최적입니다. 그러나 모든 사람은 해당 "녹색"(1, 2) 또는 (2, 1)보다 더 나은 옵션을 가지고 있습니다. 결과적으로 "빨간색"버전 (2, 2)이 실제로 구현됩니다.

우리는 각 죄수에 대해 그렇게 나쁘지 않다고 말할 수 있습니다. 공범자에게 유리한 "녹색"버전에서 10 년 대 5 년입니다. 그러나 "빨간색" 버전에서 둘 다 10이 주어질 것이라고 상상해 봅시다. 이 경우 논리는 약간 바뀔 것입니다. "내가 그를 넘겨준다면 적어도 10년은 빠져나갈 수 있는 기회가 있고, 내가 침묵을 지키면 기회가 없을 것입니다. 그는 아마 저를 같은 자리에 눕힐 것입니다." 원인." 그러나 여기서 시스템은 죄수들로 하여금 가능한 최악의 선택을 하도록 강요합니다. 전형적인 연기는 철저히 자신의 이익을 위한 것입니다.

이제 다른 상황을 고려해 보겠습니다. A와 B의 두 회사가 있습니다. 각각 X 또는 Y 전략을 사용할 수 있습니다. 그러나 결과는 기업 자체가 선택한 전략뿐만 아니라 두 번째 기업의 전략에도 영향을 받습니다. 우리는 다음 표의 형태로 각 기업의 손익을 제시할 것입니다.

열정의 강도를 높이기 위해 두 회사의 무익한 상태가 "이웃" 상태와 약간만 다를 수 있도록 숫자를 선택했습니다. 엄격하게 자신의 이익을 위해 행동하는 회사는 100 루블 대신 1000 루블을 원할 가능성이 높으므로 아무 것도받지 못하지만 반대로 잃을 수도 있습니다. 회사 중 하나를 X 전략으로 전환하면 위치가 훨씬 더 악화됩니다. 다른 회사는 더 부자가 되고 두 번째 회사는 약간 더 많지만 더 많이 잃게 됩니다.

위의 행렬을 "회사", "죄수", "조건" 및 "루블"에서 추상화하여 보다 일반적인 형식으로 작성해 보겠습니다. 두 명의 플레이어 A와 B가 각 이동에서 X 또는 Y의 두 가지 이동 중 하나를 수행할 수 있는 게임을 하고 있다고 가정해 보겠습니다. 상금은 단순히 "포인트"로 각 플레이어가 득점하려고 하는 가장 큰 수입니다.

A가 움직인다 X 그리고 Ygrek이 움직입니다.
B가 X를 움직인다 답: 0
나: ㄴ 0
A: 1 > 0
나: ㄴ 1< b 3
B가 Y를 움직이게 한다 A: 2< a 3
B: b 2 > b 0
답: b 3
나: 3

이 매트릭스로 표시되는 게임의 규칙은 이 경우 플레이어의 보수가 다른 모든 옵션보다 훨씬 적더라도 "빨간색" 옵션(2, 2)을 구현하도록 플레이어를 "푸시"합니다. 사실, 인덱스가 있는 "a"와 "b"라는 문자로 표시되는 승률(음수일 수도 있음 - 손실)에 따라 각 옵션의 구현 빈도가 다릅니다.

특히, 선택은 각 전략을 선택할 때의 보수의 산술 평균과 플레이어가 하나 또는 다른 이동을 할 예상 확률에 의해 영향을 받을 수 있습니다. 이전 라운드에서 이루어진 이동 빈도). 따라서 가장 간단한 경우 플레이어 A는 0과 2를 더하여 이동 X를 평가하고 결과를 2로 나눕니다. 그는 Y 이동에 대해서도 동일한 작업을 수행합니다. 1에 3을 더한 다음 결과를 2로 나누고 결과를 비교합니다. 더 복잡한 경우에 플레이어는 합계 a 0 *p x + a 2 *p y 를 계산합니다. 여기서 p x 및 p y는 플레이어 B가 수행한 X 및 Y 이동의 확률입니다. 결과는 a 1 *p x + a 3 *피 .

물론 결과를 다시 2로 나눌 수 있지만 이동의 두 변형 모두에 대해 2로 나누기 때문에 "동등한 이동"의 경우와 같이 값을 비교하는 데 이 작업이 필요하지 않습니다.

또한 플레이어는 가치 자체에 집중할 수 있습니다. 예를 들어, 이동 중 하나가 가능한 손실을 의미하는 경우(특히 플레이어가 감당할 수 없는 큰 손실) 플레이어는 다른 이동의 예상 결과가 평균적으로 더 낮지만 두 경우 모두 긍정적인 경우에도 다른 이동을 선택할 것입니다. .

마지막으로 우리는 사람들이 종종 "다른 플레이어를 기억하라"는 것을 기억해야 합니다. 두 번째 플레이어가 경쟁자이거나 심지어 적이라면 첫 번째 플레이어가 이득을 거의 얻지 못하고 심지어 이로 인해 잃는 경우에도 다른 플레이어에게 해를 끼치는 움직임을 선택하는 경향이 있을 수 있습니다. 두 번째 플레이어가 친구 인 경우 "게임"이 미리 선언 된 경쟁이 아니라 실제 생활의 어떤 종류의 프로세스 인 경우 조금 더 많이 이길 수있는 움직임이 선택됩니다. 물론 복수와 방종의 가능성은 매트릭스의 비율에 달려 있습니다. 그 중 일부는 상대방과 조금 놀기 시작하는 것보다 상대방이 당신의 친구라는 것을 잊어 버릴 것입니다.

즉, 우리가 고려하고 있는 원칙은 결정론이 아니라 그 추세를 정확히 반영하고 있습니다. 승패의 비율이 "죄수의 딜레마"와 유사할수록 시스템은 플레이어를 "최악" 옵션으로 더 자주 그리고 더 빠르게 이끌고 이 옵션은 "최악"으로 이끌 것입니다.

말하자면 "시장의 보이지 않는 손"이 있습니다. 말하자면 보이지 않게 플레이어를 밀어내는 ... 글쎄요. 더 정확히 말하면, 아니 어쩌면 당신이 모를 수도 있습니다. 클래식 버전에서 "시장의 손"은 모든 사람이 필요로 하는 곳으로 밀어붙이는 것처럼 보이지만 여기서는 전혀 잘못된 방향으로 밀고 있습니다. 공동선이 아니라 "죄수의 딜레마"로 설명되는 다른 시나리오에서는 피할 수 있었던 영구적인 위기와 기업 간의 경쟁에 대한 가상의 예, 소프트웨어의 불가피한 과대 평가가 있는 실제 예 이전 기사에서 논의된 개발 시간.

시장은 플레이어를 내쉬 균형으로 밀어붙이며, 이는 공동의 이익과 개인적 이익에서 임의로 멀어질 수 있습니다.

이 경우 우리는 두 명의 플레이어와 두 개의 움직임이 있는 게임만을 고려했지만 더 넓은 일반화가 가능하며 이는 정확히 내쉬 균형의 공식화입니다.

임의의 수의 플레이어와 보수 매트릭스가 있는 일부 게임에서 플레이어 중 한 명이 이에 해당하지 않는 이동을 개별적으로 선택하면 개인의 보수가 감소하는 상태가 되면 이 상태는 다음과 같이 나타납니다. 이 게임의 "평형".

또한, 어떤 경우에는 플레이어의 움직임이 이 상태로 이동하는 경향이 있습니다. 이 게임에 플레이어 전체 및/또는 개별의 보수가 더 높은 다른 상태가 있더라도 마찬가지입니다.

이전에 사용된 것과 유사한 방식으로 이 일반적인 경우의 예를 제공하는 것이 눈에 띄게 더 어렵습니다. 각 플레이어를 추가하면 수익 매트릭스에 다른 차원이 추가되기 때문입니다. 그러나 나중에 자세히 설명합니다.