Início APOSTAS O momento em que a revolução da IA ​​começou

O momento em que a revolução da IA ​​começou

18
0

Lee Sedol competiu contra AlphaGo em 2016

Foto AP/Ahn Young Jun/Alamy

Quando o AlphaGo revelou pela primeira vez todas as suas capacidades, houve uma reação visceral. Lee Sedol, o melhor jogador do mundo do antigo jogo de tabuleiro chinês Go, ficou claramente perturbado com a proeminência da inteligência artificial. A multidão silenciosa no centro de Seul, na Coreia do Sul, mal conseguia recuperar o fôlego. Lee e as dezenas de milhões de pessoas que assistiam em casa perceberam rapidamente que essa IA era diferente de todas as anteriores.

Não apenas derrotou Lee, mas também com uma aptidão quase humana. “AlphaGo realmente tem intuição”, disse o cofundador do Google, Sergey Brin. novo cientista Em 2016, logo após a vitória do AlphaGo por 3 a 0. “Isso cria um movimento lindo. Cria um movimento ainda mais bonito do que a maioria de nós pode imaginar.”

A série terminou com uma vitória por 4 a 1 para o sistema AlphaGo do Google DeepMind. Lee disse que ficou “chocado”.

Já se passaram 10 anos desde este momento decisivo para AlphaGo e IA como um todo. Com o sucesso de modelos de linguagem em larga escala como o ChatGPT, é comum ficar maravilhado com a IA. AlphaGo foi, em muitos aspectos, nosso primeiro vislumbre do que estava por vir. Dez anos depois, qual é o legado do AlphaGo e a tecnologia está à altura do seu potencial?

“O modelo de linguagem grande é bastante diferente do AlphaGo em alguns aspectos, mas existem linhas tecnológicas realmente fundamentais que não mudaram”, diz ele. Chris Madison Ele é professor da Universidade de Toronto e fez parte da equipe original do AlphaGo.

Sua tecnologia subjacente são as redes neurais. Esta é uma estrutura matemática inspirada no cérebro e escrita em código. Historicamente, a criação de máquinas para jogar exigia que os humanos escrevessem regras a seguir em diversas situações. Com as redes neurais, as máquinas aprendem por conta própria.

Mas mesmo com redes neurais, quebrar o Go era uma tarefa difícil. O antigo jogo chinês, em que dois jogadores movem fichas pretas e brancas para capturar território num tabuleiro 19 x 19, permite 10 jogos.171 Posição possível. Comparado a isso, existem apenas 1080 átomos em todo o universo observável.

Esta descoberta ocorreu quando Madison e os seus colegas procuraram replicar a intuição dos jogadores humanos, treinando uma rede neural para prever o próximo movimento mais poderoso com base em milhões de movimentos de jogos reais. É claro que os jogadores humanos não precisam jogar tantos jogos para desenvolver sua intuição, mas nunca conseguirão fazer isso. Esta é uma clara vantagem para a IA.

Além disso, o AlphaGo não se limitou a aprender com jogadores humanos. Você pode jogar milhões de jogos consigo mesmo para aprimorar suas habilidades. “Ao aprender através destes jogos, temos o potencial de descobrir novos conhecimentos e superar jogadores de nível humano”, diz ele. Pushmeet Kohli Com o Google DeepMind.

O sistema final que derrotou Lee era mais complexo que o modelo inicial de Maddison, mas a mensagem geral era simples. Então a rede neural funcionou. “AlphaGo mostrou conclusivamente que as redes neurais podem realizar o reconhecimento de padrões melhor do que os humanos. Eles podem ter uma intuição inerente que excede os humanos”, diz ele. Norma Marrom Com OpenAI.

Outros alfas

Então, o que aconteceu a seguir? Depois do AlphaGo, os pesquisadores do Google DeepMind e de IA decidiram aplicar suas lições básicas a aplicações do mundo real, como matemática e biologia. Um dos exemplos mais óbvios disso é AlphaFold. Muito melhor do que qualquer programa projetado por humanos, o AlphaFold pode prever a aparência de uma proteína no espaço tridimensional a partir de sua composição química, rendendo à equipe que desenvolveu a IA um Prêmio Nobel de Química.

Mais recentemente, outra IA baseada em redes neurais, a AlphaProof, surpreendeu os matemáticos com o seu desempenho ao nível da medalha de ouro na Olimpíada Internacional de Matemática, um prestigiado teste de matemática para estudantes. “Você não só pode obter essa inteligência sobre-humana no jogo, mas também pode obter essa experiência em aplicações científicas importantes”, disse Kohli.

A lógica por trás da IA ​​estilo AlphaGo e da IA ​​usada para modelos de linguagem de grande escala (LLMs), como ChatGPT, é semelhante. A primeira etapa, chamada de pré-treinamento, alimenta a rede neural com uma grande quantidade de dados humanos, como um jogo Go completo ou, no caso do LLM, toda a Internet. Na segunda etapa, chamada de pós-treinamento, a rede é aprimorada por meio de uma técnica chamada aprendizagem por reforço, mostrando à IA como é o sucesso e fazendo-a entender como alcançá-lo.

Para o AlphaGo, isso significava jogar contra si mesmo milhões de vezes até encontrar a melhor estratégia vencedora. Para AlphaFold, era importante dizer à IA como é uma proteína devidamente dobrada e fazê-la entender as regras. No caso do ChatGPT, um processo chamado aprendizagem por reforço a partir do feedback humano informa o modelo que responde às preferências dos humanos, dá ao modelo uma solução para um problema definido, como matemática ou codificação, e alimenta esse resultado de volta para si mesmo, semelhante à forma como os humanos pensam em voz alta, para fazê-lo pensar sobre a melhor forma de “raciocinar” em direção à solução.

No entanto, isto também tem suas desvantagens. As redes neurais são caixas pretas em muitos aspectos. Apesar dos esforços para descobrir como funcionam, muitos deles são demasiado grandes e complexos para serem compreendidos a um nível fundamental.

Quando AlphaGo fez seus agora famosos 37 movimentos, os espectadores inicialmente pensaram que a IA havia enlouquecido, mas à medida que o jogo avançava ficou claro que foi um golpe de mestre estratégico. Mas os engenheiros do Google DeepMind não poderiam ter perguntado ao AlphaGo por que ele fez essa mudança, e isso poderia facilmente ter sido um erro, e não saberíamos o porquê.

“Esses modelos nos dão respostas, mas não sabemos se são insights geniais ou alucinações”, diz Kohli. “Ainda estamos trabalhando ativamente para resolver esse tipo de questões.”

Uma grande parte do sucesso do AlphaGo é que ele tinha dados ricos para alimentar o modelo e uma definição clara de sucesso. Portanto, faz sentido que as áreas onde a IA tem mais sucesso hoje sejam aquelas onde ambas as condições são verdadeiras. Madison diz que existem áreas como matemática e programação onde é fácil definir e verificar o que é certo e o que é errado. “As semelhanças entre estas abordagens dizem-nos algo e dizem-nos quais são as matérias-primas necessárias para o progresso.”

tópico:

Source link

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui