Criminal Player

Por que delatar ou colaborar é racional? O Dilema do Prisioneiro

Autor

31 de janeiro de 2025, 9h20

O Dilema do Prisioneiro, criado em 1950, por Merrill Flood e Melvin Dresher, consiste (vamos adaptar já ao contexto do processo penal):

Spacca

a) o agente da lei (delegado ou Ministério Público, que chamaremos de João) está investigando a conduta criminosa de dois investigados (denominaremos de Paulo e Raul);
b) as investigações são suficientes para acusação por crime menor (2 anos de prisão), mas apontam que podem estar envolvidos em condutas mais graves, cujas provas não são suficientes para sustentar uma acusação;
c) João, nosso agente da lei, obtém a prisão temporária de Paulo e Raul, colocando-os em celas separadas, sem a possibilidade de troca de informações ou de realizar acordos sobre as decisões: estão em posições simétricas;
d) valendo-se da assimetria de informações (Paulo e Raul não podem se comunicar ou não possuem mecanismos de forçar a cooperação entre si), e com o objetivo de obter provas sobre os crimes graves que supõe existir, João (o agente da lei) propõe, separadamente à cada um dos prisioneiros (Paulo e Raul), os seguintes termos do acordo, com três cenários possíveis:

1) Se você confessar os crimes mais graves de ambos e o outro prisioneiro ficar calado, você receberá a pena de dois anos de prisão e o outro a pena de dez anos;
2) Se você ficar calado e o outro prisioneiro confessar, você receberá dez anos de prisão e o outro a pena de dois anos; e,
3) Se vocês dois confessarem, a pena será a de cinco anos para cada um.

Antes de respondermos o que Paulo e Raul deveriam fazer (confessar ou ficar em silêncio), vale conferir as nossas pressuposições teóricas, a saber, de que os jogadores devem agir de modo racional, maximizando a utilidade: receber a menor consequência possível (a menor pena possível). Diante das propostas apresentadas, a matriz do jogo será (jogadores: Paulo e Raul; Comportamentos: ficar em silêncio ou confessar (trair); Resultados possíveis: dez, cinco ou dois anos de pena):

Matriz: ações e pena Paulo: ficar em silêncio Paulo: confessar
Raul: ficar em silêncio 2,2 10,2
Raul: confessar 2,10 5,5,

A decisão racional (e maximizadora da utilidade esperada: pessoal) será a de escolher o melhor resultado (menor pena). Dentre as opções (dez, cinco ou dois anos de pena), a melhor é, pela ordem: x) dois anos; y) cinco anos; e, z) dez anos. Tanto para Paulo, como para Raul, a melhor alternativa é a de confessar porque, traindo, os resultados se reduzem às opções “x” e “y” (dois ou cinco anos), com a exclusão da pior: “z” (dez anos). A opção individual pelo silêncio terá como resultado as alternativas “x” ou “z” (dois ou dez anos).

Podemos concluir que a Estratégia Dominante de Paulo ou de Raul será a de confessar, independentemente do que o outro prisioneiro decidir. Permanecer em silêncio é Estratégia Dominada. O comportamento racional é o de escolher pela estratégia dominante: confessar.

Dilema

O dilema se configura na medida em que a escolha das alternativas (confissão ou silêncio), depende do comportamento cooperativo ou não entre os prisioneiros para além da avaliação individual (atômica) de Paulo e Raul. Caso ocorra a cooperação entre Paulo e Raul, permanecendo ambos em silêncio, o resultado será melhor para dois anos.

Podemos então concluir que o comportamento racional (equilíbrio: confessar), no caso, gera resultado pior aos dois prisioneiros (cinco anos). Ao mesmo tempo que manter o silêncio, sem saber o que o outro fará, aumenta o risco do pior cenário (dez anos).

O melhor cenário seria o “cooperativo” (silêncio), mas não seria racional (conforme o nosso pressuposto). O paradoxo é esse: agindo de modo racional, tanto Paulo como Raul, pioram o resultado individual (cinco anos para cada um). A questão colocada pelo Dilema do Prisioneiro é a de que a estratégia dominante pode ser a menos eficiente, dado o resultado adverso, abrindo espaço para compreensão cooperativa.

O Dilema do Prisioneiro demonstrou a importância da cooperação nas interações humanas e que nem sempre o comportamento racional confere o melhor resultado. O comportamento racional de confessar (trair) de ambos os prisioneiros é pior do que o da cooperação (silêncio). Mas como esperamos que os demais agentes também se comportem de modo racional, a Estratégia Dominante é a de confessar (trair). O que poderia ser somente um exemplo da Teoria dos Jogos, pode nos servir para compreender comportamentos processuais, por exemplo, no campo da colaboração premiada ou das abordagens policiais.

O esquema de funcionamento é o mesmo: a) suposição dos agentes da lei de que há crimes praticados ocultos; b) dificuldades de obtenção da prova em face dos custos ou da complexidade; c) utilização de mecanismos de abordagem (separação ambiental dos suspeitos/investigados) ou processual (p.ex. prisão preventiva ou prisão temporária, em celas separadas, desde que sem possibilidade de contato direto ou indireto) para impedir a comunicação e a possibilidade de forçarem a cooperação mútua; d) aproveitamento da assimetria de informação para obtenção de provas e/ou confissão acerca de supostas práticas criminalizadas; e) proposta de benefícios ou prêmios (diretos ou indiretos) para o fim de obter a cooperação; e, f) aposta no comportamento racional dos alvos.

Podemos verificar, também, a aplicação nos casos de abordagens policiais de suspeitos (p.ex. em veículos, residências ou interrogatórios investigativos), em que os agentes da lei poderiam revistar os suspeitos, o carro, a casa, com maior alocação de ativos (tempo, esforço físico etc.) e se valem da tática.

Operacionalização

A operacionalização pressupõe a participação de pelo menos dois agentes da lei e dois suspeitos/investigados (podem ser mais). Em seguida, cada agente da lei conduz um dos alvos para local distante ou ambiente separado o suficiente para impedir a comunicação. Estabelecido o cenário promove-se diálogo generalista (De onde são? De onde se conhecem? O que estavam fazendo? Para onde iriam?) por tempo suficiente ao estabelecimento das condições necessárias (o outro alvo precisa saber que houve diálogo e por tempo razoável, sem saber o conteúdo).

Aproveitando-se da assimetria de informação entre os alvos, os agentes da lei trocam de posições, ou seja, mantêm os alvos separados e sem saber o conteúdo do diálogo realizado com o outro. Com as posições trocadas, fornecem sinalizações genéricas/abstratas de que o outro confessou e que “seria melhor” também confessar (“jogar verde e colher maduro”). Cada alvo se encontra, agora, submetido à situação do Dilema do Prisioneiro, mesmo não estando preso. Pode ser que não haja nada a ser confessado, mas se houver, a tática promove um atalho substancial (equivale-se ao interrogatório de filhos, amigos e colegas de trabalho).

No regime da Colaboração Premiada o uso do Dilema do Prisioneiro é ainda mais ostensivo. A criação das condições se dá pelo uso de prisão preventiva ou temporária (antes se usava a também condução coercitiva). Em seguida, a lógica é aplicada, com incentivos próprios do instituto, consistentes na possibilidade de o primeiro delator receber prêmios maiores.

A eficiência da colaboração premiada depende da análise de custo-benefício entre as penas possíveis e as oferecidas, motivo pelo qual no mercado da colaboração premiada, a despeito das disposições legais, as práticas comerciais de negociação de pena, estabeleceram a delação com pena pré-fixada. Com a prática da pena pré-fixada e não dependente da futura aplicação da pena (legalmente o efeito da colaboração deveria ser utilizado na terceira fase da aplicação da pena, depois de condenado o colaborador), mitigou-se o risco associado ao evento futuro (sentença condenatória), reduzindo-se os “custos de transação” (Teorema de Coase). É que o acordo depende de evento futuro e incerto (sentença), na qual o juiz pode conceder o perdão, reduzir a pena em 2/3 ou substituir a pena (Lei 12.850/13, artigo 4º).

Daí se segue que faz toda a diferença a redução da metade da pena de oito e nenhum sentido a redução pela metade da pena de 90 anos. A tática da pena pré-fixada gerou adesão dos colaboradores. O Pacote Anticrime proibiu, mais uma vez, a pena pré-fixada (artigo 4, § 7º, II) o que levou ao “inverno” da colaboração premiada.

O mercado novamente esquentou com a decisão do STJ, no julgamento da “operação faoreste”, pela qual a prática foi validada. Ademais, é paradoxal declarar nulas as cláusulas fora do padrão legal por dois argumentos.

O primeiro é o de que se os termos da colaboração premiada foram homologados pelo Judiciário (condição de validade), criando a expectativa de boa-fé objetiva do Estado, motivo pelo qual o comportamento posterior (negar validade) é contraditório (O Estado, por seus agentes, estaria agindo de má-fé ou na homologação ou na não validade posterior: venire contra factum proprium).

O segundo é o de que aplicada em seus termos pela sentença, o Juiz da Execução Penal não poderá majorar a pena aplicada em face da força da coisa julgada, porque intangível e agiria para prejudicar o colaborador.

A questão colocada pelo Dilema do Prisioneiro é a de que a Estratégia dominante pode ser a menos eficiente, dado o resultado adverso, abrindo espaço para compreensão cooperativa. Nem sempre as decisões aparentemente melhores individualmente o são no contexto de jogos interdependentes, como acontece no processo penal.

O Dilema do Prisioneiro é o exemplo teórico de tal modelo. Nos serve de “chave interpretativa” em diversos momentos do Processo. A não cooperação entre os agentes (estratégia dominada para TER — Teoria da Escolha Racional) tende a levar ao pior resultado individual (a estratégia dominante é prejudicial).

Daí que não se pode começar ou permanecer em um processo por meio de julgamentos aparentemente racionais, desprovidos de avaliações contingentes das “consequências das consequências”, a saber, os “efeitos dos efeitos” (curto, médio e longo prazo).

Anote-se, por fim, que medidas cautelares podem configurar como mecanismos de pressão cooperativa e/ou táticas de aniquilamento (simbólico e real, dadas as condições em que são executadas), para fins de colaboração premida (Dilema do Prisioneiro).

A prisão do indiciado/acusado é modalidade de guerra com tática de aniquilação, uma vez que os movimentos da defesa estarão vinculados à soltura. Clausewitz deixou herdeiros no processo penal ao apontar que a pressão pela liberdade ou por finalizar o processo ajuda na estratégia, uma vez que atua no centro de gravidade: a liberdade.

Além disso, a facilidade probatória (testemunhas e informantes com memória mais próxima da conduta, mídia acompanhando etc.) e redução da condição do acusado a objeto (subjugação psicológica do acusado, defensor, familiares etc.) podem ser úteis à acusação, como já apontava o Manual dos Inquisidores, ainda que constituam práticas típicas de abuso de autoridade.

O Dilema do Prisioneiro demonstra que o resultado coletivo não decorre necessariamente de escolhas individuais utilitaristas, mas de contingências e interações do contexto, vinculados ao objetivo final (meta). Cooperar ou trair é decisão individual. O paradoxo é que se os dois espertos agirem de modo racional, ambos se dão mal. Compreender o espaço negocial do processo penal é um desafio constante. Recomendo o livro operacional de Luisa Walter da Rosa sobre o tema: Colaboração Premiada (aqui).

Leve consigo: delatar e colaborar é racional. Pode não ocorrer por outros motivos. Mas, todo cuidado é pouco.

Autores

Encontrou um erro? Avise nossa equipe!