Início ESTATÍSTICAS Cientistas revelaram por que a linguagem humana não é como o código...

Cientistas revelaram por que a linguagem humana não é como o código de computador

21
0

A linguagem humana é extremamente rica e complexa. No entanto, do ponto de vista da teoria da informação, as mesmas ideias poderiam, teoricamente, ser transmitidas num formato muito mais condensado. Isto levanta uma questão intrigante: por que os humanos não se comunicam no sistema digital de uns e zeros como os computadores fazem?

Michael Hahn, um linguista de Saarbrücken, decidiu responder a esta pergunta juntamente com Richard Futrell, da Universidade da Califórnia, Irvine. Juntos, eles criaram um modelo que explica por que a linguagem humana tem essa aparência. Sua pesquisa foi publicada recentemente em A Natureza do Comportamento Humano.

Linguagem humana e eficiência da informação

Cerca de 7.000 idiomas são falados em todo o mundo. Alguns são usados ​​apenas por alguns falantes restantes, enquanto outros, como chinês, inglês, espanhol e hindi, são falados por bilhões. Apesar das diferenças, todas as línguas servem ao mesmo propósito importante. Eles transmitem significado combinando palavras em frases, que são então transformadas em sentenças. Cada parte carrega seu próprio significado e juntas criam uma mensagem clara.

“Na verdade, é uma estrutura muito complexa. Como o mundo natural busca a máxima eficiência e economia de recursos, faz todo o sentido perguntar por que o cérebro codifica a informação linguística de uma forma aparentemente tão complexa, em vez de digitalmente como num computador”, explica Michael Hahn. Em teoria, codificar a fala como sequências binárias de uns e zeros seria mais eficiente porque comprime a informação de forma mais compacta do que a linguagem falada. Então, por que os humanos não se comunicam como o R2-D2 de Star Wars? Hahn e Futrell acreditam ter encontrado a resposta.

A linguagem é construída em torno de experiências do mundo real

“A linguagem humana é moldada pelas realidades da vida que nos rodeia”, diz Michael Hahn. “Se, por exemplo, eu falasse de meio gato e meio cachorro, e me referisse a ele usando o termo abstrato ‘objetivo’, ninguém entenderia o que eu quis dizer, porque é certo que ninguém viu um objetivo – ele simplesmente não reflete a experiência vivida de ninguém. Da mesma forma, não faz sentido misturar as palavras ‘gato’ e ‘cachorro’ em uma cadeia de caracteres que usa as mesmas letras, mas é impossível de interpretar”, continua ele.

Uma forma embaralhada como “gadcot” contém tecnicamente letras de ambas as palavras, mas não tem sentido para os ouvintes. Em contraste, a frase “gato e cachorro” é imediatamente compreensível porque ambos os animais são conceitos familiares. A linguagem humana funciona porque está diretamente relacionada ao conhecimento compartilhado e à experiência vivida.

O cérebro prefere padrões familiares

Hahn resume as descobertas da seguinte forma: “Simplificando, é mais fácil para o nosso cérebro escolher o que pode parecer um caminho mais difícil”. Embora a linguagem natural não seja tão comprimida quanto possível, é muito menos desgastante para o cérebro. Isso ocorre porque o cérebro processa palavras em constante interação com o que já sabemos sobre o mundo.

Um código puramente digital poderia transmitir informações mais rapidamente, mas estaria desconectado da experiência cotidiana. Hahn compara isso ao deslocamento diário: “Durante um trajeto típico, estamos tão familiarizados com a rota que é como se a viagem estivesse no piloto automático. Nosso cérebro sabe exatamente o que esperar, então o esforço necessário é muito menor. Seguir uma rota mais curta, mas menos familiar, parece muito mais cansativo porque a nova rota exige que prestemos muito mais atenção enquanto dirigimos.” Matematicamente, ele acrescenta: “O número de bits que o cérebro precisa processar é muito menor quando falamos de maneira familiar e natural”.

Em outras palavras, falar e compreender o código binário exigirá muito mais esforço mental tanto do falante quanto do ouvinte. Em vez disso, o cérebro avalia constantemente a probabilidade de certas palavras e frases aparecerem em seguida. À medida que usamos a nossa língua nativa diariamente durante décadas, estes padrões tornam-se profundamente enraizados, tornando a comunicação mais suave e menos exigente.

Como o processamento preditivo molda a fala

Hahn oferece uma ilustração clara: “Se eu disser a frase alemã ‘Die fünf grünen Autos’ (inglês: ‘cinco carros verdes’), essa frase quase certamente fará sentido para outro falante de alemão, enquanto ‘Grünen fünf die Autos’ (inglês: ‘cinco carros verdes’) não fará”, diz ele.

Quando se ouve “Die fünf grünen Autos”, o cérebro imediatamente começa a interpretar o significado. A palavra “Die” sinaliza certas possibilidades gramaticais. Um ouvinte alemão pode restringir instantaneamente as escolhas, eliminando substantivos singulares masculinos e neutros. A palavra seguinte, “fünf”, sugere algo quantificável, além de ideias abstratas como amor ou sede. Então “grünen” indica que o substantivo estará no plural e na cor verde. Neste ponto, o objeto pode ser carros, bananas ou sapos. Somente quando a última palavra, “Autos”, é pronunciada é que o significado se ajusta totalmente. A cada palavra, o cérebro reduz a incerteza até que reste apenas uma interpretação.

Em contraste, “Grünen fünf die Autos” quebra esse padrão previsível. As pistas gramaticais esperadas aparecem na ordem errada, de modo que o cérebro não consegue construir facilmente o significado a partir da sequência.

Implicações para IA e modelos de linguagem

Hahn e Futrell conseguiram demonstrar matematicamente esses padrões. Suas descobertas, publicadas em A Natureza do Comportamento Humanomostram que a linguagem humana prefere carga cognitiva reduzida à compressão máxima.

Essas informações também podem ajudar a melhorar os grandes modelos de linguagem (LLM), os sistemas por trás das ferramentas generativas de inteligência artificial, como o ChatGPT ou o Copilot da Microsoft. Com uma melhor compreensão de como o cérebro humano processa a linguagem, os pesquisadores poderiam desenvolver sistemas de inteligência artificial que correspondam mais de perto aos padrões naturais de comunicação.

Source link

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui