Início ESTATÍSTICAS A IA poderia descobrir novas físicas mais rapidamente, mas há um problema...

A IA poderia descobrir novas físicas mais rapidamente, mas há um problema estranho

23
0

A inteligência artificial já desempenha um papel importante ao ajudar os cosmólogos a estudar o universo. Agora, uma nova pesquisa mostra que uma técnica de aprendizado de máquina chamada aprendizagem por transferência poderia tornar a busca por uma nova física muito mais rápida e barata. No entanto, a investigação também revelou uma falha surpreendente: a IA pode por vezes tornar-se tão dependente do que já aprendeu que tem dificuldade em reconhecer algo verdadeiramente novo.

Um estudo publicado em Jornal de Cosmologia e Astrofísica de Partículas (JCAP), estudaram como a aprendizagem por transferência pode ajudar os pesquisadores a explorar teorias além do modelo cosmológico padrão.

IA e a busca por uma nova física

O atual Modelo Padrão de cosmologia, conhecido como ΛCDM, explica com sucesso muitas características de grande escala do Universo, incluindo a sua expansão e a distribuição de galáxias. No entanto, os cientistas acreditam que o modelo não é a resposta final.

Observações recentes levantaram questões que podem apontar para uma nova física, incluindo efeitos massivos de neutrinos, gravidade modificada e o desenvolvimento da energia escura. Explorar essas possibilidades exige que os pesquisadores criem um enorme número de simulações computacionais detalhadas, cada uma representando um universo virtual construído usando diferentes suposições físicas.

Criar essas simulações é computacionalmente caro e muitas vezes requer um poder de processamento significativo.

Usando a aprendizagem por transferência para reduzir custos de simulação

Os investigadores investigaram se a aprendizagem transferível poderia tornar este processo mais eficiente.

A aprendizagem por transferência permite que um sistema de IA aplique o conhecimento aprendido em uma tarefa em outra tarefa relacionada. Em vez de treinar a rede neural inteiramente na simulação mais complexa e computacionalmente cara, a equipe primeiro a treinou em uma simulação mais simples baseada em ΛCDM. Esta fase inicial, conhecida como pré-treinamento, foi seguida por um treinamento adicional usando modelos mais complexos que incorporam possíveis novas físicas.

“É basicamente um caminho curto”, explica Adrian Bayer, cosmólogo do Flatiron Institute e da Universidade de Princeton, coautor do estudo. “Normalmente, as pessoas treinam IA diretamente nas simulações computacionalmente mais caras. Em vez disso, primeiro usamos simulações ΛCDM mais simples e menos dispendiosas para dar à IA uma ideia do que está acontecendo, antes de passar para modelos mais complexos.”

Bayer compara a abordagem do livro didático à aprendizagem.

“Você primeiro lê um livro básico para ter uma ideia do contexto”, diz Bayer, “e depois passa para um livro realmente difícil”.

De acordo com a primeira autora Vena Krishnaraj, estudante da Universidade de Princeton, essa estratégia evita que a IA tenha que “digerir tudo de uma vez”.

Os resultados foram impressionantes. Em alguns casos, a aprendizagem por transferência reduziu o número de simulações dispendiosas exigidas em mais de dez vezes.

Quando o conhecimento prévio se torna um problema

O estudo também identificou um problema menos óbvio conhecido como transferência negativa.

Para usar a analogia dos livros didáticos de Bayer, imagine estudar medicina a partir de um texto introdutório e depois encontrar uma doença rara que se parece muito com uma doença comum. O conhecimento existente é geralmente útil, mas às vezes pode levar a conclusões erradas.

O mesmo problema pode surgir em sistemas de inteligência artificial.

Em alguns casos, as assinaturas da nova física assemelham-se a padrões que a IA já associou ao modelo cosmológico padrão. Quando isso acontece, a rede pré-treinada pode interpretar informações desconhecidas através das lentes do que já conhece, dificultando o reconhecimento de efeitos verdadeiramente novos.

Os pesquisadores observaram esse efeito enquanto estudavam simulações que incluíam neutrinos massivos. Algumas das assinaturas observacionais associadas à massa dos neutrinos se assemelham muito às mudanças associadas a um parâmetro ΛCDM existente chamado σ8, que mede a intensidade da matéria nos aglomerados em todo o universo.

Devido a esta semelhança, foi inicialmente difícil para a rede neural pré-treinada distinguir entre os dois efeitos.

“A transferência negativa não é acidental. É devida às degenerescências físicas subjacentes ao modelo”, diz Krishnaraj.

Em outras palavras, diferentes processos físicos podem produzir características observáveis ​​muito semelhantes, tornando difícil para a inteligência artificial identificar corretamente qual parâmetro é responsável.

“Portanto, isso é algo que precisamos estar atentos e tentar mitigar”, conclui ela.

Perspectivas e riscos para a cosmologia futura

As descobertas destacam as vantagens e limitações potenciais da aplicação dos conceitos básicos do modelo em física. Essas abordagens são amplamente semelhantes em espírito aos métodos subjacentes aos atuais sistemas generativos de inteligência artificial e aos grandes modelos de linguagem.

Como observam os pesquisadores no artigo, o treinamento prévio pode acelerar a inferência, “mas também pode dificultar o aprendizado de novas físicas”.

Até agora, esta abordagem só foi testada através de simulações. O próximo passo será aplicá-lo a observações astronômicas reais.

A equipa acredita que a aprendizagem transferível pode ser uma ferramenta importante para futuras pesquisas cosmológicas, que deverão recolher uma quantidade sem precedentes de dados de alta precisão sobre o Universo nos próximos anos.

Movendo a aprendizagem além do modelo padrão, de Vena Krishnaraj, Adrian E. Bayer, Christian Krag Jespersen e Peter Melchior, agora está disponível em SER.

Source link

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui