Como o método da teoria dos jogos impulsiona a tomada de decisões

Como o método da teoria dos jogos impulsiona a tomada de decisões

Como a estratégia da teoria dos jogos melhora a tomada de decisões

A teoria dos jogos , a pesquisa da tomada de decisão tática, reúne diversas técnicas, como matemática, psicologia e ponto de vista. A teoria dos jogos foi criada por John von Neumann e Oskar Morgenstern em 1944 e percorreu um longo caminho desde então. O valor da teoria dos jogos para a avaliação e a tomada de decisões modernas pode ser avaliado pelo fato de que, em 1970, até 12 economistas e cientistas importantes receberam o Prêmio Nobel de Ciências Econômicas por seus pagamentos à teoria dos jogos.

CONSELHOS SECRETOS

  • A teoria dos jogos é uma estrutura para entender as opções nas circunstâncias entre os jogadores em disputa.
  • A teoria dos jogos pode ajudar os jogadores a alcançar a tomada de decisão ideal quando desafiados por atores independentes e completos em um cenário tático.
  • Um tipo usual de “jogo” que aparece em circunstâncias financeiras e organizacionais é a situação do detento, onde os tomadores de decisão individuais sempre têm um incentivo para escolher de uma maneira que desenvolva um resultado abaixo do ideal para as pessoas como um grupo.
  • Existem vários outros tipos de jogos de vídeo. A aplicação funcional desses jogos pode ser uma ferramenta valiosa para ajudar a avaliar indústrias, campos, mercados e qualquer interação crítica entre 2 ou até mais estrelas.

Problema do detido

Uma das estratégias mais populares e fundamentais da teoria dos jogos é o dilema do prisioneiro. Este conceito explora a abordagem de tomada de decisão adotada por duas pessoas que, agindo em seu próprio interesse privado, acabam com resultados piores do que se tivessem cooperado, para começar.

No dilema do prisioneiro, dois suspeitos detidos por um crime são mantidos em quartos diferentes e não podem interagir. O procurador do distrito informa o Suspeito 1 e o Suspeito 2 separadamente que se ele admitir e também testemunhar contra os outros, ele pode ficar em liberdade, mas se não cooperar.

A diferença que o outro suspeito fizer, será punido com três anos de prisão. Se ambos admitirem, sem dúvida receberão uma sentença de dois anos e, se nenhum deles aceitar, serão sentenciados a um ano de prisão.

Embora a cooperação seja a melhor técnica para os dois suspeitos, quando confrontados com tal problema, a pesquisa mostra que a maioria das pessoas razoáveis ​​prefere confessar e testemunhar contra o outro indivíduo do que permanecer em silêncio e aproveitar a oportunidade que a outra parte admite.

Supõe-se que os jogadores são lógicos e visam maximizar seus retornos.

A situação do prisioneiro estabelece as bases para métodos inovadores de teoria dos jogos, dos quais os mais proeminentes incluem:

Dimensões correspondentes

Este videogame de soma zero envolve dois jogadores (chame-os de Jogador A e Jogador B) de uma só vez, posicionando uma moeda de dez centavos na mesa, com o retorno dependendo da correspondência das moedas. Se ambas as moedas derem cara ou coroa, o Jogador A ganha e mantém o centavo do Jogador B. O Jogador B vence e dá suporte ao centavo do Jogador A se eles não fizerem check.

Dilema

Este é um cenário de problema social como a situação do prisioneiro porque 2 jogadores podem trabalhar juntos ou desertar (ou seja, não coordenar). Em uma emergência, se o Jogador A e o Jogador B cooperarem, cada um receberá uma recompensa de 1, e se ambos emitirem, cada um obterá um benefício de 2. No entanto, se o Jogador A cooperar e o Jogador B desistir, então A recebe um retorno de 0, e B recebe uma recompensa de 3. No diagrama de benefícios listado abaixo, o primeiro numeral nas células (a) a (d) representa o retorno do Jogador A, e também o segundo numeral é o do Jogador B:

Matriz de pagamento de impasseJogador BJogador B
ColaborarDefeito
Jogador AColaborar(a) 1, 1(b) 0, 3
Defeito(c) 3, 0(d) 2, 2

O impasse varia da situação de um detento porque a atividade da vantagem mútua mais significativa (ou seja, ambos os defeitos) também é a abordagem principal. Uma técnica definitiva para um jogador é especificada como aquela que cria a recompensa mais crítica de qualquer curso disponível, apesar das práticas empregadas pelos vários outros jogadores.

Um exemplo de situação tipicamente citado é o de duas potências nucleares tentando concordar em remover seus arsenais de bombas atômicas. Nesse caso, o trabalho em equipe indica a adesão ao acordo, enquanto a deserção sugere a renegação privada do acordo e a retenção da coleção nuclear.

No entanto, o resultado mais eficaz para qualquer nação é quebrar o acordo e preservar a opção nuclear. Em contraste, os vários outros países removem sua coleção porque isso, sem dúvida, oferecerá ao anterior uma incrível vantagem secreta sobre a última batalha já iniciada entre os dois. A segunda melhor escolha é que ambos desertem ou cumpram de outra forma, uma vez que isso mantém sua condição de potências nucleares.

Concurso Cournot

Essa versão também é conceitualmente semelhante ao problema do detento e leva o nome do matemático francês Augustin Cournot, que a apresentou em 1838. Uma das aplicações mais típicas do modelo de Cournot é descrever um duopólio ou mais fabricantes primários em um mercado.

Por exemplo, suponha que as empresas A e B criem um produto similar e possam produzir grandes ou baixas quantidades. Se ambos coordenarem e aceitarem a produção em graus reduzidos, então restritos, a oferta se traduzirá em um alto preço do produto no mercado e ganhos significativos para ambos os negócios.

Por outro lado, se o problema for gerado em alto grau, sem dúvida o mercado ficará sobrecarregado e causará um pequeno custo para o produto e menores ganhos para ambos. Mas se uma coordena (ou seja, cria em graus baixos) e as várias outras falhas (ou seja, gera sub-repticiamente em graus altos), depois disso, a primeira recupera o custo. Ao mesmo tempo, este último obtém uma receita maior do que se ambos fossem coordenados.

A matriz de retorno para as empresas A e B é mostrada (os números representam a receita em vários dólares). Portanto, se A coordena e gera em graus reduzidos enquanto B cria problemas e cria em níveis altos, a recompensa é recebida pela célula (b) – ponto de equilíbrio para o negócio A e $ 7 milhões em receita para a empresa B.

Matriz de pagamento de CournotEmpresa BEmpresa B
ColaborarDefeito
Company AColaborar(a) 4, 4(b) 0, 7
Defeito(c) 7, 0(d) 2, 2

Videogame de coordenação

Na coordenação, os jogadores obtêm recompensas mais significativas quando escolhem a mesma estratégia.

Por exemplo, pense em dois titãs da tecnologia determinando entre a introdução de uma nova tecnologia revolucionária em chips de memória que poderia render centenas de milhões em lucros ou uma variação modificada de uma tecnologia moderna mais antiga que os tornaria muito menos.

Assim, uma empresa opta por continuar com a tecnologia totalmente nova, o preço da promoção pelos clientes certamente seria substancialmente reduzido. Além disso, consequentemente, sem dúvida, ganharia menos do que se ambas as empresas escolhessem o mesmo curso de ação. A matriz de retorno é revelada abaixo (os números representam o lucro em vários dólares).

Portanto, se ambas as empresas decidissem apresentar a nova tecnologia moderna, elas ganhariam US$ 600 milhões cada. Oferecer uma versão revisada da tecnologia moderna mais antiga certamente renderia US$ 300 milhões cada, conforme mostrado na célula (d).

Mas se a Empresa A decidir sozinha introduzir a nova tecnologia, ela ganhará apenas US$ 150 milhões. No entanto, o negócio B ganharia $ 0 (presumivelmente porque os clientes podem não estar dispostos a pagar por sua inovação agora obsoleta). Nesse caso, faz sentido que ambas as empresas trabalhem juntas e não de forma independente.

Matriz de Playoffs de CoordenaçãoEmpresa BEmpresa B
Nova tecnologiaTecnologia antiga
Company ANova tecnologia(a) 600, 600(b) 0, 150
Tecnologia antiga(c) 150, 0(d) 300, 300

Jogo de vermes

Este é um videogame de formato extenso no qual dois jogadores alternadamente têm a chance de obter a parte mais significativa de um estoque de dinheiro que aumenta lentamente. O jogo da centopéia é seqüencial porque os jogadores dão seus passos um após o outro e não simultaneamente; cada jogador também conhece as técnicas escolhidas pelos jogadores que jogaram antes deles. O videogame termina assim que um jogador pega o estoque, com esse jogador recebendo a parte mais significativa e o outro jogador recebendo a seção menor.

Como exemplo, suponha que o jogador A seja o primeiro e tenha que decidir se ele deve “pegar” ou “passar” o estoque, que atualmente totaliza até $ 2. Se ele pegar, depois disso, An e também B obtêm $ 1 cada, mas se A passar, a escolha de aceitar ou passar agora precisa ser feita pelo Jogador B.

Se B pega, ela obtém $ 3 (ou seja, o último estoque de $ 2 + $ 1) e também An obtém $ 0. No entanto, se B passar, A agora decide se quer receber ou dar, e muito mais. Se ambos os jogadores optarem constantemente por passar, cada um receberá uma recompensa de $ 100 no final do jogo.

O ponto do videogame é que, se An e B coordenarem e continuarem a passar até a conclusão do videogame, eles obterão o pagamento ideal de $ 100 cada. No entanto, se eles se perguntarem sobre os outros jogadores e anteciparem que eles “pegarão” na primeira oportunidade, Nash Balance espera que os jogadores aceitem o pedido mais acessível possível (US $ 1 nesta situação).

Estudos de pesquisa experimental revelaram. No entanto, essas ações “racionais” (como previsto pela teoria dos jogos) raramente são exibidas no mundo real. Isso não é chocante, dada a diminuta dimensão do pagamento inicial em relação ao último. Os sujeitos experimentais também exibiram comportamento semelhante no dilema do viajante.

Dilema do viajante

Este jogo de soma diferente de zero, no qual ambos os jogadores tentam otimizar seu próprio pagamento apesar do outro, foi criado pelo especialista financeiro Kaushik Basu em 1994. Por exemplo, no dilema do turista, uma companhia aérea concorda em pagar a dois turistas uma compensação por danos a produtos similares. No entanto, ambos os turistas são independentemente necessários para aproximar o valor do produto, com um mínimo de $ 2 e um máximo de $ 100.

Se ambos anotarem o mesmo valor, a companhia aérea, sem dúvida, compensará cada um deles nessa quantidade. No entanto, se os valores variarem, a companhia aérea certamente pagará o peso reduzido, com um benefício de US$ 2 para o viajante que anotou esse valor mais baixo e uma multa de US$ 2 para o turista que listou o valor mais alto.

Com base na indução para trás, o grau de equilíbrio de Nash é $ 2 neste cenário. No entanto, como no videogame de vermes, os experimentos de laboratório demonstram continuamente que a maioria dos participantes, ingenuamente ou não, escolhe um número muito superior a US$ 2.

Os problemas dos turistas podem ser colocados na análise de uma seleção de situações da vida real. O procedimento de indução reversa, por exemplo, pode ajudar a esclarecer como duas empresas que participam de concorrentes agressivos podem reduzir constantemente as taxas de produtos em uma cotação para adquirir participação de mercado, o que pode resultar em perdas mais significativas progressivamente no processo.

Luta dos sexos

Este tipo de jogo de coordenação foi definido anteriormente, mas com algumas assimetrias de benefícios. Inclui um casal tentando coordenar sua saída à noite. Embora tenham consentido em cumprir seja no jogo de bola (escolha do homem) ou em uma peça (escolha da dama), esqueceram o que decidiram, além de compor a questão, não poderem interagir entre si.

Onde eles devem ir? A matriz de recompensas é revelada abaixo, com os numerais nas células representando o grau relativo de prazer do evento para a mulher e o homem, respectivamente. Por exemplo, a célula (a) representa o benefício (em termos de graus de prazer) tanto para a mulher quanto para o homem na peça (ela gosta muito mais do que ele).

A célula (d) é o retorno se ambos chegarem ao jogo (ele aprecia mais do que ela). A célula (c) representa a frustração se ambos vão não apenas para o lugar errado, mas também para a ocasião em que menos gostam – a mulher para o jogo e o homem para o jogo.

Matriz de Pagamento da Batalha dos SexosHomemHomem
JogarJogo de bola
MulherJogar(a) 6, 3(b) 2, 2
Jogo de bola(c) 0, 0(d) 3, 6

Jogo opressor

Este é um videogame fácil em que o Jogador A deve decidir como dividir o prêmio em dinheiro com o Jogador B, que não tem nenhuma participação na decisão do Jogador A. Embora esta não seja uma abordagem da teoria dos jogos em si, ela fornece alguns entendimentos fascinantes sobre o comportamento das pessoas.

Experimentos revelam que 50% mantêm todo o dinheiro para si, 5% dividem de forma semelhante e os outros 45% oferecem ao outro indivíduo uma parcela menor. O jogo do ditador está intimamente relacionado ao jogo do ultimato. O Jogador A recebe uma quantia em dinheiro, que precisa ser entregue ao Jogador B, que pode aceitar ou rejeitar a quantidade oferecida.

O problema é que se o segundo jogador recusar a quantia fornecida, tanto A quanto B não obtêm absolutamente nada. Os videogames totalitários e de última oferta contêm lições cruciais para preocupações como a oferta filantrópica e a filantropia.

Guerra da paz

Esta é uma variação do dilema do prisioneiro em que as escolhas de “cumprir ou não” são alteradas por “tranquilidade ou batalha”. Um exemplo poderia ser duas empresas envolvidas em uma batalha custosa. Se ambos se abstêm de cortar custos, eles se deliciam com a prosperidade do ente querido (célula a); no entanto, uma guerra de custos diminuiria substancialmente os retornos (célula d).

No entanto, se A participa do corte de preços (ou seja, “guerra”), mas B não, A teria um retorno maior de 4, uma vez que pode ser capaz de capturar uma participação de mercado substancial, bem como essa quantidade mais alta equilibraria preços reduzidos dos produtos.

Matriz de Pagamento da Guerra de PazEmpresa BEmpresa B
PazGuerra
Company APaz(a) 3, 3(b) 0, 4
Guerra(c) 4, 0(d) 1, 1

Problema do Voluntário

Na questão do voluntário, alguém tem que embarcar no dever ou trabalhar para o bem de sempre. O pior resultado possível é entendido se ninguém se voluntariar. Por exemplo, considere um negócio onde a fraude de auditoria é generalizada; no entanto, a alta administração é desinformada.

Alguns funcionários juniores do departamento de contabilidade estão cientes da fraude, mas relutam em contar à administração completa, pois isso faria com que os funcionários envolvidos nos golpes fossem demitidos e provavelmente processados.

Ser classificado como denunciante também pode ter algumas consequências no futuro. No entanto, se ninguém se oferecer, os grandes golpes podem causar a eventual falência da empresa e a perda de empregos de todos.

perguntas frequentes

Quais são os ‘jogos’ sendo jogados na teoria dos jogos?

É chamada de teoria dos jogos porque o conceito tenta entender as atividades calculadas de 2 ou até mais “jogadores” em uma circunstância fornecida contendo diretrizes e resultados estabelecidos. Embora tenha feito uso de várias técnicas, a teoria dos jogos é mais significativamente utilizada como uma ferramenta no estudo de pesquisa de negócios e economia empresarial.

Os “videogames” podem, portanto, envolver exatamente como duas empresas concorrentes reagirão aos cortes de custos da outra se uma empresa precisar comprar mais uma, ou como os investidores em uma bolsa de valores podem reagir a modificações de valor. Em termos lógicos, esses videogames podem ser classificados como comparáveis ​​aos problemas do prisioneiro, o jogo do ditador, o falcão e a pomba, a luta dos sexos, entre outras variantes.

O que a situação do detido ensina aos Estados Unidos?

A situação do prisioneiro mostra que o trabalho em equipe direto nem sempre é do melhor interesse. Ao comprar algo caro, como um automóvel, a barganha é a estratégia preferida do ponto de vista do consumidor.

Ou então, a concessionária de automóveis pode adotar uma política de inflexibilidade na liquidação de tarifas, otimizando seus ganhos, mas fazendo com que os clientes paguem demais por seus caminhões. Compreender os retornos do ente querido de coordenar versus desertar pode levá-lo a participar de muitos acordos de preços antes de fazer uma grande aquisição.

O que é um equilíbrio de Nash na teoria dos jogos?

O equilíbrio de Nash na teoria dos jogos é quando um jogador continua com sua estratégia escolhida, sem motivação para se desviar dela, depois de pensar na técnica do desafiante.

Como as empresas podem utilizar a teoria dos jogos à medida que se enfrentam?

Cournot concorrentes, por exemplo, é um desenho econômico que define uma estrutura setorial na qual as empresas concorrentes estão fornecendo um item similar e competem pela quantidade de produção que produzem, de forma independente e ao mesmo tempo. É apropriadamente o jogo de vídeo da situação de um detento.

A linha inferior

A teoria dos jogos pode ser utilizada com muito sucesso como uma ferramenta para a tomada de decisões, seja em um cenário adversário, organizacional ou individual.


Leia o artigo original na investopedia.

Relacionado Proteína saudável do leite de vaca pode ativar o inchaço em pacientes com esclerose múltipla

Share this post