Teoria dos Jogos | Jogos de Duas Pessoas de Soma Zero

Teoria dos Jogos | Jogos de Duas Pessoas de Soma Zero

postado em: Anpec, Mathematics | 0

Tempo de Leitura: 7 Minutos

Alguns diziam que o pequeno John era a pessoa mais inteligente viva. John Neumann foi uma criança-prodígio que se tornou uma lenda no mundo matemático. Quando souberam que ele tinha chegado a uma reunião de táxi e acabado de rabiscar o seu “teorema minimax” da teoria dos jogos, não ficaram surpreendidos. Era exatamente o tipo de coisa que John von Neumann fazia. Neumann contribuiu para a mecânica quântica, a lógica, a álgebra, logo porque deveria a teoria dos jogos escapar-lhe? Não escapou – com Oskar Morgenstern, foi co-autor da influente Teoria dos Jogos e Comportamento Econômico. No sentido mais lato, a teoria dos jogos é um assunto antigo, mas von Neumann foi a chave para aprimorar o jogo de duas pessoas de soma zero.

Parece complicado, mas um jogo de duas pessoas de soma zero é simplesmente um jogo jogado por duas pessoas, empresas ou equipes, em que um dos lados ganha e o outro perde. Se A ganha R$ 200,00, B perde R$ 200,00: é isto que significa soma zero. Não tem sentido A cooperar com B – é uma competição pura, apenas com vencedores e perdedores. Na linguagem todos ganham, A ganha R$ 200,00 e B ganha – R$ 200,00 e a soma 200 + (- 200) = 0. Esta é a origem da expressão soma zero.

Imaginemos duas empresas de televisão, ATv e BTv, que licitam a operação de um serviço noticioso extra ou em São Paulo ou no Rio de Janeiro. Cada empresa deve fazer uma licitação para um único estado e basear a sua decisão no aumento de audiências previsto. Os analistas do Ibope estimaram o aumento das audiências e ambas as empresas têm acesso ao estudo. O aumento é convenientemente previsto numa tabela de retorno e medido em unidades de um milhão de espectadores.

Tab-1

Se tanto a ATv como a BTv decidirem operar em São Paulo, a ATv ganhará 5 milhões de espectadores, mas a BTv perderá 5 milhões de espectadores. O significado do sinal de menos, como no retorno -3, é que a ATv poderá perder uma audiência de 3 milhões de espectadores caso opte por operar no Rio de Janeiro e a BTv faça o mesmo.

Presumamos que as empresas tomam as suas decisões únicas com base na tabela de retorno e que fazem as suas ofertas, simultaneamente, em carta fechada. Obviamente que ambas agem no seu melhor interesse.

Se a ATv escolhe São Paulo, o pior que poderá acontecer será a perda de 3 milhões de espectadores, se optar pelo Rio de Janeiro, o pior resultado será um ganho de 2 milhões. A estratégia óbvia para a ATv será escolher o Rio de Janeiro independente do que a BTv escolha. Analisando numericamente, a ATv consegue -3 e 2 (os mínimos das linhas) e escolhe a linha que corresponde ao máximo deles.

A BTv está numa posição mais fraca, mas ainda pode conseguir uma estratégia que limite o seu potencial de perdas e esperar por uma melhor tabela de retorno no ano seguinte. Se a BTv escolher São Paulo (coluna 1), o pior que pode acontecer é uma perda de 5 milhões de espectadores, se optar pelo Rio de Janeiro (coluna 2), o pior será uma perda de 4 milhões. A estratégia mais segura para a BTv é escolher o Rio de Janeiro independente do que a ATv decida.

Estas são as estratégias mais seguras para cada jogador, e, se seguidas, a ATv ganhará 4 milhões de espectadores, enquanto a BTv os perderá.

Quando é que um Jogo está Determinado?

No ano seguinte, as duas empresas de televisão têm outra opção – operar em Minas Gerais. Como as circunstâncias mudaram, existe uma nova tabela de retorno.

Tab-2

Como antes, a estratégia mais segura para a ATv é escolher a linha que maximiza o pior que pode acontecer. O máximo de { +1,-1,-3} é a escolha de Minas Gerais (linha 1). A estratégia segura para a BTv é escolher a coluna que minimiza {-4,-5,-1}, ou seja, Rio de Janeiro (coluna 3).

Escolhendo Minas Gerais, a ATv garante ganhar não menos que 1 milhão de espectadores, qualquer que seja a escolha da BTv e, escolhendo o Rio de Janeiro (coluna 3), a BTv garante perder não mais de 1 milhão de espectadores, seja o que for que a ATv decida. Estas escolhas representam, portanto, as melhores estratégias para cada emissora e é, neste sentido, que o jogo está determinado (embora seja injusto para a BTv). Neste jogo, o máximo {+1,-1,-3} e o mínimo {-4,-5-1} têm o valor comum 1. Ao contrário do primeiro jogo, esta versão tem um ponto de equilíbrio (ou ponto de sela) representado por +1,-1 da terceira coluna.

Jogos Repetitivos

O jogo repetitivo icônico é o tradicional jogo do pedra, papel, tesoura. Ao contrário do jogo das empresas de televisão, que é um jogo de uma só jogada, o pedra, papel, tesoura é normalmente jogado meia dúzia de vezes, ou algumas centenas de vezes pelos competidores do seu campeonato mundial anual em Toronto, realizado pela associação mundial de jogadores World Rock Paper Scissors Society.

No jogo do pedra, papel, tesoura, dois jogadores mostram uma mão, dois dedos ou um punho, cada um simbolizando papel, tesoura e pedra, respectivamente. Jogam simultaneamente à contagem de três: O papel ganha da pedra (embrulhando-a), a pedra ganha da tesoura (amassando ou quebrando-a) e a tesoura ganha do papel (cortando-o). Ao jogar papel, os retornos são então 0,-1,+1 na coluna de cima da tabela completa de retornos.

Tab-3

Não há nenhum ponto de sela para este jogo e nenhuma estratégia para adotar.

Se um jogador escolher sempre a mesma ação, digamos papel, o oponente detecta-o e simplesmente escolherá sempre tesoura. Pelo teorema minimax de von Neumann, há uma estratégia mista ou uma forma de escolher diferentes ações, com base em probabilidades.

Os jogadores devem escolher aleatoriamente, mas, no geral, apostar um terço das vezes em cada escolha: papel, tesoura ou pedra. Contudo, a aleatoriedade cega pode nem sempre ser o melhor caminho, dado que os campeões mundiais têm sempre maneiras de escolher a sua estratégia com uma pequena volta psicológica. São bons em prever as escolhas dos oponentes.

Quando é que um Jogo Não é de Soma Zero?

Nem todos os jogos são de soma zero – cada jogador tem por vezes a sua própria tabela de retorno. Um exemplo famoso é o dilema do prisioneiro criado por A. W. Tucker.

Duas pessoas, André e João, são apanhados pela polícia por suspeita de roubo na auto-estrada e fechados em celas separadas, para não poderem conferenciar um com o outro. Os retornos (neste caso as penas de prisão), dependem não só das suas respostas individuais ao interrogatório policial, mas também do conjunto das respostas. Se André confessar e João não, André só cumprirá 1 ano de prisão (da tabela de retorno de André), mas B sofrerá uma sentença de 10 anos (da tabela de retorno de João). Se André não confessar e João confessar, as sentenças serão ao contrário. Se ambos confessarem, servirão 4 anos de cadeia cada um, mas se nenhum confessar e ambos mantiverem a sua declaração de inocência, sairão impunes!

Tab-4

Tab-5

Se os prisioneiros pudessem cooperar, conversariam entre si e tomariam a decisão ótima de não confessarem, esta seria uma situação em que ambos ganham.

Uma Mente Brilhante

John F. Nash (n. 1928), cuja vida conturbada foi retratada em 2001 no filme Uma Mente Brilhante, ganhou o Prémio Nobel da Economia em 1994, pelas suas contribuições para a teoria dos jogos. Nash e outros alargaram a teoria dos jogos ao caso de mais de dois jogadores e a jogos em que ocorre a cooperação entre jogadores, incluindo o acrescento um terceiro jogador. O equilíbrio de Nash (como um equilíbrio de ponto de sela) deu uma perspectiva muito mais alargada do que a estabelecida por von Neumann, resultando numa maior compreensão das situações econômicas.

Deixe uma resposta