Max Bennett: Uma breve história da inteligência
A evolução da base cognitiva do aprendizado: um resumo de Max Bennett
Por Marco Antonio Pereira Querol
Esta postagem tem por objetivo apresentar o surgimento da estrutura cognitivas e do aprendizado, desde os primeiros animais até os seres humanos. Meu argumento aqui é que para entender a fundo o comportamento humano e em especial a aprendizagem social, é importante entender a sua base biológica evolutiva. Dentre as perguntas básicas que esta publicação visa responder destaca-se: quais são as funções cognitivas presentes entre os humanos? Quando e por que elas surgiram? Como elas afetam o nosso comportamento?
A necessidade de entender a base e origem das funções cognitivas
Na Teoria da Atividade, a unidade básica para entender as funções cognitivas superiores e comportamento humano complexo é uma ação humana mediada por artefatos culturais e por outros sujeitos. Leontiev, aluno de Vygostky, vai um passo adiante sugerindo que a unidade básica de análise é um sistema de atividade (Engeström, 1987). Uma atividade humana é composta por ações direcionadas a objeto que visa satisfazer uma ou mais necessidades humanas. Tal atividade é essencialmente coletiva e mediada por ferramentas, divisão do trabalho, as regras e uma comunidade. Nas últimas décadas foi sugerido que devido à constante divisão social do trabalho e a crescente interdependência entre
Como apontado pelos editores do livro de Vygotsky (1978), Mind in Society: The Development of Higher Psychological Processes, no início do século XX havia uma reconhecida crise na psicologia. Por um lado, estavam os cientistas das ciências naturais, que explicavam os processos sensoriais elementares e os reflexos; por outro, os representantes das “ciências mentais”, que eram capazes de descrever o surgimento de propriedades dos processos psicológicos superiores, mas não conseguiam explicá-las. Para Vygotsky, era necessária uma abordagem que descrevesse e explicasse as funções psicológicas superiores, como a consciência e a memória voluntária. Tal esforço incluía a identificação do mecanismo cerebral subjacente a uma determinada função, bem como uma explicação detalhada do seu desenvolvimento histórico.
Desde a morte de Vygotsky, em 1934, já se passaram mais de 90 anos, durante os quais houve grandes avanços nas pesquisas em neurociência e no conhecimento sobre a evolução das funções cognitivas. Em um trabalho recente de Max Bennett (2023), intitulado A Brief History of Intelligence: Why the Human Brain Holds the Key to the Future of AI, o autor compila o conhecimento sobre a evolução das estruturas cognitivas desde o surgimento dos animais até os seres humanos.
Aqui, não proponho que a unidade de análise deva ser reduzida ao indivíduo ou a uma parte específica do cérebro, mas sim que se reconheça a necessidade de entender a origem e a lógica evolutiva das funções cognitivas, pois elas constituem a base estrutural sobre a qual o aprendizado ocorre, criando tanto possibilidades quanto limitações. Compreender essa base nos ajuda a entender e conceitualizar melhor o próprio aprendizado.
A história da evolução cognitiva nos lembra que o aprendizado possui uma base biológica e evolutiva, e que mudanças culturais externas aos indivíduos exigem também transformações cognitivas internas. Não se trata de escolher entre uma coisa ou outra, mas de reconhecer que, entre os seres humanos, o aprendizado se dá em ambos os níveis. Obviamente, é possível abstrair o indivíduo e ignorar o processo biológico interno, afirmando simplesmente não haver interesse por ele. No entanto, ao fazer isso, o indivíduo permanece como uma “caixa de Pandora”, e as abstrações e teorizações permanecem superficiais, pois ignoram a base evolutiva e funcional de determinado comportamento humano.
A seguir são apresentadas as estruturas cognitivas e formas mais simples de aprendizado, como o neurônio e o reflexo até chegarmos ao cérebro e aprendizado entre humanos que é não apenas individual, mas coletivo, social, político e cultural.
OS ANIMAIS
O surgimento do neurônio e o movimento reflexo
A história do surgimento das funcões cognitivas surge com o surgimento dos animais e do primeiro neurônio. Tomemos como ponto de partida o surgimento do neurônio, a célula e unidade básica que forma o nosso cérebro. Os neurônios surgem com o surgimento dos animais - organismos pluricelulares com digestão interna. Ao contrário das plantas que produzem o seu próprio alimento através da fotossíntese, os animais e os fungos são os organismos pluricelulares que consomem os alimentos produzidos por outros organismos. Para isso o organismo tem que digerir o seu alimento. No caso dos fungos, a estratégia é esperar o alimento chegar até si, em seguida promover a digestão externa através da liberação de enzimas. Já entre os animais, a estratégia é capturar o alimento no ambiente e fazer a digestão interna.
Uma das caraterísticas básicas dos animais para capturar o alimento é o movimento. O movimento não é algo novo entre os seres vivos. Bactérias e outros organismos unicelulares são capazes de locomover. No entanto, o movimento entre organismos pluricelulares era um desafio. Como coordenar milhares de células para contrair e produzir um movimento? A solução foi criar uma célula especializada em comunicação, o neurônio, cuja função inicial era detectar (e.g. a presença de alimento) e produzir um estímulo a fim de gerar um movimento (e.g. contrair ou descontrair uma célula). Portanto, o neurônio foi inicialmente uma solução evolutiva para obter informação do meio e responder a mesma.
No século XIX descobriu-se que os neurônios se comunicam a partir de sinais elétricos que seguem em uma única direção. Em 1920, Edgar Adrian descobriu três características sobre a comunicação entre neurônios. A primeira era que os sinais elétricos entre os neurônios não é contínuo, mas sim na forma de pico, chamado de potencial de ação. A segunda descoberta está relacionada ao fato que cada pico tinha uma mesma intensidade. Isso levou a questionar, como os organismos conseguem diferenciar a variações de pressão, cor ou se os sinais têm uma mesma intensidade? Adrian descobriu que diferentes intensidades de estímulo (contraste, pressão e concentração) são comunicadas com diferentes frequências de picos. Quanto mais intenso o estímulo, maior a frequência dos picos. A terceira descoberta é que os neurônios estão em constante adaptando as firing rates com a variação no ambiente.
No final do século XIX, Charles Sherrington descobriu que os neurônios se comunicam entre si por meio de sinapses, que são pequenos espaços entre eles. Os picos de potencial de ação provocam a liberação de neurotransmissores, que atravessam a sinapse em frações de nanosegundos e se ligam a receptores proteicos na membrana do neurônio-alvo. Isso permite a entrada ou saída de íons, alterando a carga elétrica da célula e modulando sua atividade.
Em 1950 John Eccles descobriu a existência de dois tipos de neurônios, os excitatórios e os inibitórios. Os excitatórios ativam um pico enquanto o inibitório inibe o pico. A existência desses dois tipos de neurônio permitiu movimentos reflexos como abrir e fechar a boca em um pólipo de um coral. Ao detectar um alimento em um tentáculo, uma célula sensorial transmite um pico para um músculo estimulando o abrir a boca e, ao mesmo tempo, um pico a um neurônio inibitório que inibe o fechamento da mesma.
OS BILATERAIS
O surgimento do cérebro, da valência, e das emoções
Os primeiros animais, como os pólipos de coral e as águas-vivas, não possuíam cérebro, mas sim um sistema de rede nervosa com circuitos que implementavam seus reflexos de forma independente. O cérebro surge apenas com os animais bilaterais como uma forma de condução (steering). Animais bilaterais são animais com boca por onde entra o alimento e um ânus por onde saem os excrementos. Uma das vantagens desse tipo de animal é que se direcionam apenas para um sentido (para frente), o que lhes permite se locomover com mais facilidade, podendo ir em direção ao se afastar de algo dependendo do estímulo sensorial.
Em geral, animais bilaterais tem vários sensores, de luz, odor, tato e elementos químicos específicos. Esses animais classificam os sentidos em sinais para se aproximar (bom) e sinais para se afastar (ruim). Neste sentido, valência é a classificação de algo como bom ou ruim. Ao contrário de nós humanos, nematoides não interpretam um objeto, mas sim eles têm sensores que medem diretamente uma valência positiva e outros sensores que medem a valência negativa.
Em um ambiente natural, é comum que um animal receba estímulos contraditórios ou conflitantes. Por exemplo, ele pode detectar sinais de que há alimento em determinado local, mas também perceber a presença de uma substância química tóxica. Diante disso, o animal precisa tomar uma decisão. O cérebro atua como um centro de integração desses diferentes estímulos, com o objetivo de gerar uma resposta comportamental única e coerente. Essa decisão ocorre em neurônios específicos, capazes de integrar múltiplos neurotransmissores, que resultam na excitação ou inibição da emissão de um potencial de ação (ou spike). A decisão final depende fortemente do estado interno do animal. Se estiver com fome, por exemplo, é mais provável que responda ao estímulo associado ao alimento, ignorando o sinal de perigo. O contrário também é verdadeiro: se estiver saciado ou em alerta, o estímulo de ameaça pode prevalecer sobre o atrativo.
As decisões não são determinadas apenas pela valência, mas também pelo estado emocional do animal. Entre animais mais primitivos, como o nematoide, utiliza-se o termo estado comportamental ou estado afetivo para evitar a disucssão sobre sentimentos. Esses estados podem variar de acordo com duas dimensões principais: excitação (arousal) e valência (valence). Um nível baixo de excitação leva o animal a apresentar pouca atividade motora, enquanto um nível alto de excitação promove maior movimentação. Já uma valência positiva favorece processos como digestão e reprodução, enquanto uma valência negativa inibe essas funções. A combinação dessas duas dimensões dá origem a quatro estados comportamentais distintos: exploração (exploiting), saciedade (satiation), estresse crônico (chronic stress) e fuga (escaping). As emocões que nós humanos sentimos surgem a partir desses estados de comportamentos. Qual é a lógica evolutiva dos estados de afetivos?
A ideia dos estados afetivos é que, apesar de serem desencadeados por estímulos externos, eles persistem por muito mais tempo mesmo após o desaparecimento do estímulo. Essa persistência é fundamental para orientar o comportamento de forma eficaz. Os estímulos sensoriais (ex: um odor ou tato) fornecem pistas, e não certezas, sobre o que realmente existe no ambiente. No mundo real, os estímulos muitas vezes não são constantes o suficiente para sustentar um comportamento — como, por exemplo, procurar alimento ou fugir de um predador. Assim, os estados afetivos funcionam como uma espécie de estratégia adaptativa que permite aos animais lidar com essa incerteza. Se, por exemplo, um odor de alimento é detectado, é razoável supor que há comida por perto — portanto, faz sentido persistir no comportamento de exploração. O mesmo vale para o odor de um predador: é mais seguro continuar fugindo mesmo após o estímulo ter desaparecido. Dessa forma, é mais vantajoso manter um comportamento por meio de um estado interno duradouro, em vez de depender da presença contínua de um estímulo externo.
Os estados afetivos em nematoides são gerados por meio de um equilíbrio entre diferentes neuromoduladores, como, por exemplo, a dopamina e a serotonina. A dopamina indica que algo bom está prestes a acontecer, enquanto a serotonina sinaliza que algo bom está acontecendo no momento. A dopamina motiva a busca por alimento, enquanto a serotonina está associada ao prazer de consumir o que foi obtido. A dopamina é liberada quando você vê ou antecipa algo que deseja, enquanto a serotonina é liberada quando você realiza ou consome aquilo que desejava. Dopamina é liberada quando um animal está próximo a comida e não quando a consume. A serotonina promove a sensação de saciedade e atua para reduzir ou desativar as respostas tanto à valência positiva quanto à negativa.
A lógica por trás dos estados emocionais de saciedade e exploração é relativamente fácil de compreender. No entanto, outros estados como estresse, depressão e ansiedade não parecem tão intuitivos à primeira vista. Estes estados surgem a partir de uma valência negativa, como por exemplo a presença de um predador, desencadeia a liberação de diversos neurotransmissores (como a adrenalina), que geram um estado de luta ou fuga (fight or flight), conhecido como estresse, o qual pode durar minutos ou até horas. Contudo, quando o estresse se torna crônico, o organismo adota uma estratégia diferente: entra em um estado de economia de energia. Nesse estado, ocorre a liberação de serotonina, que atenua as respostas tanto a estímulos de valência positiva quanto negativa, resultando em supressão do movimento, redução do nível de excitação (arousal) e da motivação. Esse estado é conhecido como anedonia — ou seja, a incapacidade de sentir prazer — e está relacionado ao que chamamos de depressão. Nos animais, a depressão pode ser entendida como uma estratégia adaptativa para preservar energia diante de uma situação de estresse prolongado e inescapável. Esses estados afetivos foram herdados ao longo da evolução e permanecem presentes no comportamento humano atual.
O surgimento da aprendizagem associativa
Uma das formas mais primitivas de aprendizagem é a aprendizagem por associação, descoberta por Ivan Pavlov em 1904. Em um experimento com cães, Pavlov identificou o chamado reflexo condicionado, no qual o animal associa um estímulo neutro (por exemplo, o som de um sino) a um estímulo incondicionado (como a comida). Com o tempo, o estímulo neutro passa a provocar a mesma resposta que o estímulo original. Os reflexos condicionados são involuntários e inconscientes, e ocorrem automaticamente, sem necessidade de controle consciente por parte do animal.
A formação de associações entre dois estímulos permitiu aos animais aprender e ajustar seu comportamento de acordo com mudanças no ambiente. Dessa forma, novas associações podem ser estabelecidas, enquanto associações antigas podem ser eliminadas, possibilitando respostas mais eficazes e adaptativas. Uma vez adquirida, uma resposta reflexa condicionada pode ser extinta se o estímulo condicionado (por exemplo, o som de um sino) deixar de ser acompanhado do estímulo incondicionado (como o alimento). No entanto, esse reflexo pode ser recuperado se o animal for exposto novamente ao estímulo condicionado após algum tempo — fenômeno conhecido como recuperação espontânea.
O cérebro dos animais bilaterais utiliza quatro estratégias principais para formar associações entre estímulos: eligibilidade, ofuscamento, inibição latente e bloqueio. A eligibilidade ocorre quando o cérebro seleciona a pista preditiva que aconteceu entre 0 e 1 segundo antes do evento relevante, focando em estímulos temporalmente próximos ao resultado. O ofuscamento acontece quando há várias pistas disponíveis, mas o cérebro escolhe aquela que é mais forte ou saliente, ignorando as demais. Já a inibição latente refere-se à tendência do cérebro de ignorar estímulos que já foram previamente expostos, mas que nunca estiveram associados a consequências significativas, evitando assim a formação de associações com elementos irrelevantes. Por fim, o bloqueio ocorre quando uma pista já conhecida foi previamente associada a um resultado, impedindo que novas pistas presentes no mesmo contexto sejam associadas ao mesmo evento.
O mecanimso geral do aprendizado cognitivo
Do ponto de vista individual e neurológico, o aprendizado ocorre quando sinapses são formadas, fortalecidas ou eliminadas. Uma sinapse fortalecida significa que um neurônio pré-sináptico precisa de menos estímulos (spikes) para ativar um neurônio pós-sináptico. Esse fortalecimento pode acontecer de duas maneiras: quando o neurônio de entrada libera mais neurotransmissores em resposta a um estímulo elétrico (spike), ou quando o neurônio de saída aumenta a quantidade de proteínas receptoras, tornando-se mais sensível à mesma quantidade de neurotransmissores. Mas surge uma questão importante: como o neurônio “sabe” que precisa fortalecer uma sinapse?
Os neurônios possuem mecanismos específicos para decidir se uma sinapse deve ser fortalecida ou não. Um dos princípios fundamentais que orienta esse processo é conhecido como a regra de Hebb, resumida na expressão: "neurônios que disparam juntos, se conectam juntos" (neurons that fire together, wire together). Esse mecanismo foi proposto pelo neuropsicólogo Donald Hebb em 1949 e é chamado de aprendizado hebbiano (Hebbian learning).
De forma simplificada, se um neurônio pré-sináptico (de entrada) é ativado pouco antes de um neurônio pós-sináptico (de saída), essa coincidência temporal é interpretada como uma relação causal, e a sinapse entre eles tende a ser fortalecida. Esse processo envolve uma maquinaria proteica especializada, que é capaz de detectar quando o sinal de entrada (input) ocorre dentro de uma janela de tempo crítica em relação à ativação do neurônio de saída. Quando essa sincronização é detectada, são ativadas vias moleculares que levam ao reforço da sinapse, como o aumento na liberação de neurotransmissores ou na sensibilidade dos receptores pós-sinápticos. No entanto, o mecanismo pode ser ainda mais sofisticado, sendo modulado por neuromoduladores como a dopamina e a serotonina, que ajustam a eficácia do aprendizado com base no contexto emocional ou motivacional. Por exemplo, a dopamina pode sinalizar que um determinado evento foi recompensador, favorecendo o fortalecimento de sinapses associadas a esse estímulo.
OS VERTEBRADOS
Aprendizado por reforco
Como visto anteriormente, a forma mais primitiva de aprendizado — o reflexo condicionado ou aprendizado associativo — é inconsciente e involuntário, e está limitado a eventos que ocorrem com uma diferença de tempo muito curta, geralmente entre 0 e 1 segundo. Isso impõe uma limitação importante: dificulta o aprendizado de ações em sequência, nas quais a recompensa não é recebida de forma imediata. Esse desafio passou a ser superado a partir dos vertebrados, com o surgimento de um novo mecanismo: o aprendizado por reforço, baseado em tentativa e erro.
A lógica é a seguinte: o animal realiza ações exploratórias de forma aleatória e, em seguida, ajusta seu comportamento com base na valência dos resultados. Se o resultado for positivo, ele reforça as ações realizadas anteriormente; se for negativo, tende a enfraquecer ou abandonar essas ações. Esse processo permite que os animais aprendam sequências de comportamento mais complexas, mesmo quando a consequência não é imediata. É nesse contexto que surge o aprendizado por reforço — a capacidade de aprender cadeias de ações por meio de tentativa e erro.
O problema da diferença temporal entre uma ação e a recompensa foi resolvido, nos vertebrados, com o surgimento de um pequeno grupo de neurônios dopaminérgicos no cérebro. É importante destacar que a dopamina não é simplesmente um sinal de prazer, como muitas vezes se acredita. Esse mecanismo foi estudado na década de 1980 pelo neurocientista Wolfram Schultz, que demonstrou que os neurônios dopaminérgicos são ativados por sinais preditivos (cues) que indicam um aumento esperado de recompensa futura. Ou seja, esses neurônios enviam uma mensagem do tipo: “continue, algo bom está para acontecer”. A quantidade de dopamina liberada varia conforme a probabilidade de que o estímulo preditivo realmente leve a uma recompensa. Quanto maior a previsibilidade, maior a liberação de dopamina. Portanto, a dopamina não representa diretamente a recompensa em si, mas sim um sinal de reforço, que orienta o aprendizado com base na antecipação de resultados positivos.
Com o surgimento do aprendizado por reforço, também emerge a curiosidade — um impulso ou motivação interna para explorar o novo no ambiente, mesmo diante de possíveis riscos. Esse impulso é fundamental para que o aprendizado por reforço ocorra, permitindo que o indivíduo adquira conhecimento e, assim, se adapte melhor ao ambiente. A novidade e a surpresa, por si só, podem desencadear a liberação de dopamina, mesmo na ausência de uma recompensa concreta. Isso sugere que evoluímos para considerar a surpresa e a novidade como reforçadores intrínsecos, o que nos leva naturalmente a buscá-las e explorá-las. Portanto, mesmo quando há risco de um resultado negativo, o simples fato de algo ser novo é suficiente para nos impulsionar em sua direção.
Resumindo, para resolver o problema da atribuição temporal de crédito (temporal credit assignment), o cérebro passou a reforçar comportamentos com base em mudanças nas recompensas futuras previstas, e não apenas nas recompensas reais recebidas no momento. Essa adaptação permitiu que os vertebrados aprendessem sequências de ações mais complexas, nas quais a recompensa não ocorre imediatamente após uma única ação, mas sim ao final de uma cadeia de ações.
Reconhecimento e memorizacão de padrões e mapas mentais
A capacidade dos invertebrados de perceber o mundo ao seu redor era limitada por uma estrutura sensorial baseada em neurônios isolados. Por exemplo, eles conseguiam detectar a presença de um predador por meio da identificação de uma molécula específica por um único neurônio sensorial. Embora isso permitisse algum grau de orientação no ambiente, muitas informações eram perdidas. Para superar essa limitação, os vertebrados desenvolveram, no córtex cerebral, uma estrutura capaz de reconhecer e memorizar não apenas sinais individuais mas padrões complexos de cheiro, som e imagem, o que ampliou drasticamente a quantidade de informações que podiam ser processadas e identificadas.
Nos vertebrados, essa capacidade avançada permitiu o aprendizado contínuo de novas informações sem a perda do que já havia sido aprendido. Esse processo ocorre graças a um mecanismo de monitoramento constante realizado pelo tálamo, que compara os dados sensoriais recebidos com os padrões já representados no córtex. Quando há correspondência entre eles, nenhum aprendizado ocorre. No entanto, se houver uma discrepância significativa — ou seja, se o padrão for suficientemente novo — isso desencadeia a liberação de neuromoduladores, que alteram as conexões sinápticas no córtex, permitindo ao animal aprender e incorporar o novo padrão.
Os vertebrados são capazes de memorizar não apenas objetos isolados, mas também de armazenar informações sobre a localização de um objeto em relação a outros no ambiente. Experimentos com peixes demonstram que eles conseguem formar mapas mentais espaciais, memorizando a posição relativa de elementos ao seu redor. Essa capacidade evolutiva permitiu aos animais se orientarem no ambiente — isto é, saber 'onde estou' — e localizar fontes de alimento ou predadores.
Diferentemente dos invertebrados, que geralmente se orientam com base em regras fixas (como 'vire à direita, depois à esquerda'), os vertebrados podem reconhecer posições arbitrárias no espaço e calcular a direção correta para qualquer destino, a partir de qualquer ponto de partida. Essa habilidade de construir modelos internos de representação espacial do mundo foi fundamental para a evolução de funções cognitivas mais complexas nos mamíferos.
OS MAMÍFEROS
Nos mamíferos, ocorreu uma transformação significativa no córtex cerebral, resultando no surgimento de uma nova região chamada neocórtex. Essa estrutura permitiu uma habilidade inédita: a capacidade de simular mentalmente eventos antes que eles de fato acontecessem. Enquanto os demais vertebrados aprendiam principalmente por tentativa e erro — ou seja, fazendo —, os mamíferos passaram a ter a capacidade de aprender antes de agir, ou seja, aprender imaginando.
Essa habilidade de simulação só se tornou possível graças a duas outras importantes inovações evolutivas. A primeira foi o desenvolvimento de uma visão mais aguçada, capaz de captar o ambiente com maior riqueza de detalhes. A segunda foi a homeotermia — a capacidade de manter a temperatura corporal constante. Como os sinais elétricos entre os neurônios são produzidos por processos bioquímicos sensíveis à temperatura, os neurônios de animais de sangue quente conseguem se comunicar mais rapidamente do que os de animais de sangue frio.
Como a simulação mental é computacionalmente mais custosa e lenta do que o aprendizado por reforço simples, ela exigiu a base fisiológica de um sistema que mantivesse o cérebro em funcionamento ideal, ou seja, com temperatura ideal estável. Assim, a manutenção da temperatura corporal foi uma condição necessária para o surgimento dessa forma mais avançada de aprendizado.
A percepcão e intencão entre mamíferos
A percepção nos mamíferos é processada pelo neocórtex e apresenta três propriedades distintas. A primeira é o preenchimento perceptivo: o cérebro, de forma automática e inconsciente, completa informações que estão ausentes. É por isso que conseguimos compreender uma palavra, letra ou imagem mesmo quando uma parte está faltando. A segunda propriedade é a atenção seletiva: o cérebro consegue focar e processar apenas uma imagem, cena ou conversa por vez com clareza. A terceira é o fenômeno do não consigo deixar de ver: uma vez que o cérebro atribui um significado ou interpretação a um estímulo sensorial, tende a manter essa interpretação, mesmo quando novas informações são apresentadas. Segundo Hermann von Helmholtz, essas características da percepção se devem ao fato de que o cérebro dos mamíferos não realiza uma observação direta da realidade, mas sim uma inferência — ou seja, uma simulação baseada nas informações sensoriais que recebemos.
O neocórtex dos mamíferos é dividido em duas partes: a posterior, onde se localiza o neocórtex sensorial, responsável pela percepção auditiva, visual e somatossensorial, e o neocortext frontal onde está o córtex pré-frontal agranular (aPFC). A simulação no neocórtex sensorial proporcionou três habilidades importantes aos mamíferos. A primeira é o ensaio vicário com erro (vicarious trial and error). Um rato, por exemplo, ao se deparar com uma situação que exige uma decisão, para e ativa neurônios associados a diferentes cenários futuros, como se estivesse avaliando mentalmente as opções antes de agir. A segunda habilidade é o aprendizado contrafactual (counterfactual learning), ou seja, a capacidade de aprender a partir de ações ou eventos que não chegaram a acontecer. Diferentemente de vertebrados como os peixes — que aprendem apenas por tentativa e erro, com base nas ações realmente executadas — os mamíferos são capazes de simular o que teria ocorrido caso tivessem escolhido uma alternativa diferente. Assim, eles não apenas projetam cenários futuros, mas também reconstroem possibilidades passadas, aprendendo com ações que nunca chegaram a ser tomadas. A terceira habilidade é a memória episódica, que envolve a simulação de eventos passados. Tanto o planejamento do futuro quanto a rememoração do passado são processos de simulação mental.
No neocórtex sensorial é o local onde ocorrem simulações mentais, tanto para gerar correspondência com os dados sensoriais recebidos (percepção por inferência) quanto para imaginar realidades alternativas. Já o neocórtex frontal é responsável por controlar essas simulações, decidindo o que imaginar e quando. Em ratos, lesões nessa região frontal do cérebro tornam o animal mais impulsivo e inclinado a escolher opções mais fáceis, mesmo que levem a recompensas menores; também provocam perda de memória episódica, aumentando a probabilidade de repetir erros passados.
Tomada de decisões entre mamíferos
A primeira fase do processo de tomada de decisão é a detecção de uma situação de incerteza, o que leva à ativação do córtex pré-frontal agranular (aPFC). Ele pode estar (1) inativo, ou seja, sem identificar nenhuma intenção; (2) reconhecer uma intenção e prever um comportamento específico; ou (3) reconhecer a intenção, mas prever comportamentos conflitantes — por exemplo, o animal pode tanto ir à direita para beber água quanto à esquerda para comer. Quando surgem opções divergentes, inconsistências ou algo inesperado, o aPFC torna-se especialmente importante, ativando o mecanismo de simulação mental. Mas quais cenários serão simulados?
Na segunda fase, o aPFC seleciona e simula os cenários que considera possíveis com base nas intenções previstas. A terceira fase é a tomada de decisão propriamente dita, mediada pelo sistema de decisão dos gânglios da base. Para cada cenário simulado, o cérebro do animal produz e acumula neuromoduladores associados a cada opção, com diferentes populações de neurônios representando as ações em competição aumentando gradualmente sua atividade até que uma delas ultrapasse um limiar, momento em que a ação correspondente é selecionada. Por exemplo, se os gânglios da base se ativam mais fortemente diante da comida, o animal optará por buscar alimento; se a resposta for mais intensa à água, ele irá em direção à água. Assim como a tomada de decisão baseada em tentativa e erro com reforço, a tomada de decisão por simulação também é influenciada pelo estado afetivo ou emocional do animal.
Em resumo, o processo de tomada de decisão começa com a identificação de uma discrepância entre o comportamento previsto e os possíveis desdobramentos. Em seguida, o cérebro simula mentalmente as alternativas viáveis. Por fim, a decisão é tomada com base no cenário simulado cuja representação neural aultrapassa uma limiar de ativação.
Formacão de Hábitos
Na década de 1980, Tony Dickinson realizou um experimento com ratos e identificou que, ao associar um alimento a uma substância que causava mal-estar, os animais passavam a consumir significativamente menos desse alimento. No entanto, quando os animais tinham a opção de apertar uma alavanca que liberava esse mesmo alimento, Dickinson observou que um grupo de ratos não reduzia a frequência de uso da alavanca. Ele descobriu que a sensibilidade à desvalorização do reforço estava relacionada ao número de vezes que o animal havia acionado a alavanca antes do experimento. Ratos que haviam utilizado a alavanca mais de 500 vezes continuavam a acioná-la mesmo quando o alimento havia sido desvalorizado ou sequer era mais entregue. Esses animais tornaram-se insensíveis à desvalorização (Bennett, 2023).
Dickinson estava observando a formação de hábitos. A repetição leva ao desenvolvimento de uma resposta motora automática, que é desencadeada por um estímulo sensorial e dissociada do objetivo final da ação. Quando um comportamento é repetido muitas vezes, o córtex pré-frontal anterior (aPFC) e os gânglios da base deixam de detectar incerteza, e o animal não precisa mais interromper o comportamento para analisar alternativas e consequências. Nesses casos, os gânglios da base assumem o controle da ação. O hábito permite a execução de comportamentos complexos de forma mais rápida e com menor gasto de energia. No entanto, quando ativado em momentos inapropriados, pode levar a decisões irracionais (Bennett, 2023).
Esse contraste entre comportamento habitual e comportamento orientado por metas também é observado em seres humanos. Diversos estudiosos apontam essa distinção, como Daniel Kahneman em sua teoria dos dois sistemas: o Sistema 1, que gera respostas rápidas e automáticas, e o Sistema 2, que permite parar, refletir e tomar decisões deliberadas.
A formação de um objetivo e da volição
As ações promovidas pelos gânglios da base — os hábitos — são desprovidas de intenção ou objetivo, no sentido de que não visam conscientemente alcançar um resultado. Os gânglios da base aprendem por meio da repetição de comportamentos que foram previamente reforçados. Do ponto de vista da neurociência, um objetivo envolve a simulação de um futuro comportamento pelo córtex pré-frontal anterior (aPFC), no qual se antecipa um resultado desejado. Esse resultado é representado de forma consciente. Diferentemente da simulação realizada pelo neocórtex sensorial que engaja em um inferência inativa, o aPFC engaja-se em inferência ativa: ele explica o comportamento do animal e utiliza previsões para modificá-lo de maneira deliberada.
Autocontrole, atenção e memória de trabalho
Como discutido acima, o neocórtex sensorial desencadeia uma simulação. Quando essa simulação é restringida por dados sensoriais, ela é chamada de atenção ou percepção; quando não é restringida, é denominada imaginação. Para que o animal consiga executar uma sequência de ações após imaginar o plano correspondente, ele precisa manter-se fiel a esse plano — do contrário, não será bem-sucedido. Durante a execução, surgirão situações não previstas, o que pode levar o animal a se distrair e redirecionar sua atenção para outro objetivo. Para evitar essa distração, é necessário que ele seja capaz de exercer autocontrole.
O autocontrole exige memória de trabalho, ou seja, a capacidade de manter representações mentais ativas mesmo na ausência de estímulos sensoriais. Essas representações continuas são sustentadas por simulações continuamente reativadas pelo aPFC, até que não sejam mais necessárias. A aPFC também é capaz de inibir os neurônios ao redor da amígdala, impedindo que eles acionem suas próprias respostas emocionais. Esse processo é o que os psicólogos chamam de força de vontade ou autocontrole. No cérebro dos mamíferos — incluindo os humanos — há uma tensão constante entre os desejos imediatos, impulsionados pelos gânglios da base e pelas amígdalas, e as escolhas deliberadas, mediadas pelo aPFC, que visam o que consideramos ser melhor para nós no longo prazo. Em momentos de vulnerabilidade, como fome, cansaço ou privação de sono, a amígdala tende a se sobrepor ao aPFC, pois este último consome grandes quantidades de energia. Quando estamos fatigados, o aPFC perde parte de sua capacidade de regular as amígdalas — e acabamos cedendo aos impulsos.
PRIMATAS
A meta-cognicão e teoria da projecão social
Além do aumento no tamanho do neocórtex, uma das principais diferenças entre o cérebro dos primatas e o dos demais mamíferos é o surgimento de uma região chamada córtex pré-frontal granular (gPFC). Essa área é especialmente desenvolvida em primatas e acredita-se que tenha desempenhado um papel crucial na capacidade de o animal modelar a si mesmo, ou seja, construir uma representação interna de seus próprios estados mentais — como intenções, sentimentos, desejos e conhecimentos. Psicologos e filósofos chamam isso de meta-cognicao. Atraves da gPFC consegue-se modelar o seu conhecimento, explicando o porque acha algo, e por que o mundo externo é como é.
Do ponto de vista evolutivo, acredita-se que o desenvolvimento dessa área tenha sido possível graças a mudanças na dieta de certos primatas ancestrais, especialmente a transição para uma dieta frugívora (rica em frutas). A maior densidade energética e disponibilidade desses alimentos reduziu o tempo necessário para buscar comida, permitindo que os animais passassem mais tempo em interações sociais. Esse tempo extra favoreceu a complexificação dos vínculos sociais, levando à formação de grupos hierárquicos mais estruturados. Nesses contextos, indivíduos com maiores habilidades sociais e cognitivas — como empatia, cooperação estratégica e manipulação social — tiveram vantagens evolutivas. O gPFC, portanto, pode ter evoluído em resposta direta às pressões sociais, permitindo aos primatas navegar ambientes sociais cada vez mais sofisticados.
Mas qual é a vantagem de ser capaz de modelar as próprias intenções e o próprio conhecimento?
Estudos mostram que danos na gPFC em humanos comprometem severamente a capacidade de imaginar a si mesmo em diferentes situações ou até de reconhecer a própria imagem no espelho — um marco clássico de autoconsciência. Além disso, pacientes com lesões nessa área apresentam sérias dificuldades em reconhecer emoções em outras pessoas, diferenciar mentira da verdade, e identificar situações sociais inapropriadas (como um comentário ofensivo ou embaraçoso). Eles também têm dificuldade em assumir a perspectiva de outra pessoa e em enganar ou manipular socialmente, comportamentos que dependem da compreensão das intenções e crenças alheias. Isso sugere que o surgimento do gPFC não apenas permitiu aos primatas modelarem sua própria mente, mas também desenvolver a capacidade de modelar a mente dos outros — uma habilidade essencial para a vida em grupos sociais complexos.
Esse processo de modelar a mente dos outros com base em nossa própria experiência é conhecido como teoria da projeção social (social projection theory). Ele envolve a capacidade de imaginar o que nós faríamos ou sentiríamos se estivéssemos na situação do outro. Uma evidência que apoia essa teoria é o fato de que tarefas que exigem compreender a si mesmo e aquelas que exigem compreender os outros ativam as mesmas regiões cerebrais, especialmente áreas do córtex pré-frontal, a gPFC. Acredita-se que o processo se dê em duas etapas: primeiro, o indivíduo constrói um modelo interno da própria mente, baseado em suas experiências, emoções e intenções; em seguida, projeta esse modelo sobre o outro, simulando como a outra pessoa pode estar pensando ou sentindo.
Uso de ferramentas e aprendizado por imitacão
Já de conhecimento que os primatas são capazes de usar ferramentas simples, como por exemplo, usar um graveto para retirar cupins de um buraco, ou uso de pedras para abrir nozes, clubs to smash beehives. outros animais também conseguem usar ferramentas, mas somente os primatas conseguem manufatura-las, por exemplo, encutando, removendo folhas ou afiando sticks. Além disso, grupos diferentes de primatas de uma mesma especie pode usar ferramentas de forma diferente.
Em meados de 1992, um grupo de pesquisadores da Universidade de Parma (Itália), liderado por Giacomo Rizzolatti, com a colaboração de Giuseppe Di Pellegrino, Luciano Fadiga, Leonardo Fogassi e Vittorio Gallese, descobriu um tipo especial de neurônio no córtex pré-motor de macacos — os chamados neurônios‑espelho (mirror neurons) . Esses neurônios disparam tanto quando o macaco executa um movimento (por exemplo, pegar um alimento) quanto quando observa outro indivíduo realizando a mesma ação — como se estivesse simulando internamente o movimento. O principal benefício desse sistema é facilitar o aprendizado por observação, permitindo que um indivíduo adquira uma nova habilidade ao assistir alguém realizando-a. Isso promove a transmissão social de conhecimento, possibilitando que habilidades se espalhem dentro do grupo e sejam passadas de geração a geração .
A transmissão de habilidades e do uso de ferramentas foi facilitada pela teoria da mente. Em primeiro lugar, isso ocorre porque ensinar exige a capacidade de compreender o que outra pessoa ainda não sabe e quais demonstrações poderiam ajudá-la a aprender. Em segundo lugar, a teoria da mente permite que o animal identifique a intenção por trás de uma determinada habilidade, o que o motiva a continuar tentando executá-la mesmo sem receber uma recompensa imediata. Em terceiro lugar, essa capacidade possibilita diferenciar entre movimentos intencionais e não intencionais. O aprendizado é mais eficaz quando se compreende o que a outra pessoa pretende alcançar com determinado gesto ou ação. Em resumo, entender a intenção do outro é essencial para o aprendizado por observação, pois permite filtrar os movimentos irrelevantes e identificar a essência da habilidade.
Acredita-se também que a teoria da mente tenha permitido aos primatas realizar ações com base em necessidades antecipadas, mesmo que ainda não tenham sido experimentadas diretamente. Esse processo envolve a capacidade de simular mentalmente situações futuras nas quais determinadas necessidades possam surgir, permitindo a tomada de decisões preventivas e adaptativas.
HUMANOS
A questão sobre o que os seres humanos têm que os demais animais não possuem tem sido tema de um longo debate. Pesquisas recentes indicam que compartilhamos, em grande parte, a mesma estrutura neurológica de nossos parentes primatas — talvez com uma escala ampliada. Essa maior complexidade pode nos tornar mais eficientes em aspectos como planejamento, antecipação de necessidades e teoria da mente, mas não nos torna completamente únicos. Então, existe algo que realmente nos diferencia dos outros animais?
O uso da linguagem.
O que nos distingue de forma mais marcante é a linguagem como meio sofisticado de comunicação. Nossa linguagem se manifesta de duas formas principais: Uso de símbolos declarativos (declarative labeling): atribuímos símbolos arbitrários a objetos, ações ou conceitos. Esses símbolos não têm relação direta com o que representam, mas são compreendidos socialmente, como as palavras em uma língua. Gramática: utilizamos regras combinatórias que nos permitem unir e modificar símbolos para expressar significados específicos. Isso nos permite formar frases complexas e, a partir delas, construir narrativas, argumentações e conceitos abstratos. Essa capacidade de articular símbolos com regras gramaticais permite aos humanos transmitir ideias complexas, imaginar mundos possíveis, preservar conhecimento e cooperar em larga escala — elementos centrais naquilo que nos torna únicos.
Tranimissão de ideias
A linguagem permite a transmissão de simulações mentais de um indivíduo para outro com um alto nível de detalhamento e flexibilidade. Isso possibilita que o aprendizado de uma pessoa seja compartilhado com muitos outros. Com apenas alguns sons ou gestos, é possível comunicar a mesma experiência vivida — ou até mesmo imaginada — para um número ilimitado de indivíduos. Essa habilidade de transferir intencionalmente nossas simulações internas só é possível graças à linguagem.
Outros primatas também se comunicam por meio de sons e gestos, mas esses sinais são, em grande parte, codificados geneticamente — ou seja, os animais já nascem com esse repertório, sem a necessidade de aprendizado. Isso torna sua comunicação limitada e pouco flexível. Em contraste, os seres humanos são capazes de criar novos símbolos, combiná-los de maneira criativa e formar um número praticamente ilimitado de pensamentos e expressões. Essa capacidade simbólica e combinatória da linguagem provavelmente trouxe uma série de vantagens evolutivas, como o ensino de técnicas e ferramentas, além da coordenação de atividades coletivas como a caça. Enquanto os outros primatas dependem principalmente da observação e imitação de ações reais, nós conseguimos transmitir ideias puramente imaginadas — experiências mentais que nunca foram diretamente observadas.
Formacão e evolucão das ideias
A linguagem — ou seja, a representação de ideias por meio de símbolos — possibilitou o compartilhamento de imaginações sobre episódios do passado, simulações do futuro e cenários contrafactuais. Isso permitiu o surgimento de mitos: entidades imaginárias e histórias que são transmitidas de pessoa para pessoa. Essa ideia, proposta por John Searle e popularizada por Yuval Harari, ajuda a explicar por que os seres humanos conseguem coordenar ações e cooperar com um grande número de indivíduos desconhecidos.
Ideias e narrativas compartilhadas — como, por exemplo, o dinheiro, as corporações, o Estado e os valores — promovem a coesão social, e permite a cooperação. A linguagem tem a vantagem de existir fora do cérebro e de se desenvolver com o tempo. Ao ser transmitida de pessoa para pessoa, de geração em geração, as ideias evoluem. Ideias ruins tendem a desaparecer, enquanto ideias boas permanecem e são aprimoradas. Esse processo de seleção e refinamento permitiu o desenvolvimento do conhecimento e de comportamentos complexos que existem hoje. Atualmente, só somos capazes de dirigir carros, voar em aviões ou enviar pessoas à Lua graças ao acúmulo de conhecimento produzido e transmitido por milhares de pessoas ao longo de milhares de anos e gerações.
A evolução das ideias não se limita aos artefatos tecnológicos ou técnicos, mas também se aplica aos artefatos culturais e sociais — como regras, formas de organização, valores e crenças. A linguagem permite um aprendizado mais rápido e preciso: as informações transmitidas são condensadas, priorizando apenas os elementos mais relevantes, o que ajuda a filtrar o desnecessário e economizar espaço cognitivo.O crescimento exponencial do conhecimento, aliado ao aumento de sua complexidade de uma geração para outra, gerou um desafio fundamental: como armazenar e transmitir esse conhecimento de forma eficiente.
Inicialmente, a solução evolutiva envolveu o aumento do tamanho do cérebro humano e a formação de grupos sociais maiores. No entanto, essas mudanças não foram suficientes para acompanhar o ritmo acelerado da expansão do conhecimento, o que levou à necessidade de outras inovações. Uma dessas inovações foi a especialização. A divisão do trabalho permitiu que indivíduos ou grupos se concentrassem em tarefas específicas, acumulando conhecimento e desenvolvendo habilidades aprofundadas em determinadas áreas. Por fim, surgiu a escrita — uma revolução que possibilitou aos seres humanos criar uma memória coletiva externa ao cérebro. Com ela, tornou-se possível armazenar e transmitir um volume praticamente ilimitado de informações ao longo do tempo e entre gerações.
Tabela 1. Resumo dos tipos de aprendizado e evolucão das estrutura cognitivas.
Vygotsky, L. S. (1978). Mind in Society: The Development of Higher Psychological Processes. Cambridge, MA: Harvard University Press.
Comentários
Postar um comentário