Início COMPETIÇÕES Transformando a IA com o poder das redes generativas

Transformando a IA com o poder das redes generativas

133
0

A evolução das técnicas de aprendizado de máquina continua a ultrapassar os limites do que é possível com a inteligência artificial. Em um estudo inovador, o professor Johan du Preez e a Dra. Emilie-Reine Engelbrecht, da Universidade de Stellenbosch, preencheram a lacuna conceitual entre duas áreas significativas do aprendizado de máquina: aprendizado semissupervisionado (SSL) e reconhecimento generativo de conjunto aberto (OSR). As suas descobertas, publicadas na revista Science Africa, revelam uma ligação profunda com redes adversárias generativas (GANs), levando a modelos de aprendizagem automática mais rentáveis ​​e eficazes.

No centro de sua pesquisa está o uso inovador de GANs, uma ferramenta dinâmica que tradicionalmente coloca duas redes neurais uma contra a outra: uma para gerar dados e outra para avaliá-los. O estudo explora como essas redes podem ser usadas não apenas para SSL, onde apenas uma parte dos dados é rotulada, mas também para OSR, que precisa identificar categorias novas e inéditas na fase de teste.

Os investigadores acreditam que a chave para combinar SSL e OSR reside na geração do que chamam de modelos “feios” – pontos de dados concebidos para serem deliberadamente ambíguos ou enganosos. Esses modelos preenchem o “espaço de preenchimento”, uma região conceitual no espectro de dados que existe entre categorias conhecidas. Ao treinar classificadores com esses modelos, os modelos podem não apenas reconhecer, mas também classificar corretamente novas entradas nas quais não foram explicitamente treinados.

Dr. Engelbrecht explica: “Ao ampliar nossa compreensão do espaço complementar em SSL para OSR, descobrimos que nossos modelos podem generalizar efetivamente esse espaço aberto, melhorando significativamente nossa capacidade de lidar com dados inesperados”. Esta exposição é importante para aplicações comuns onde se deparam com coisas desconhecidas, como ferramentas de diagnóstico automatizadas e tecnologia de automóveis autónomos, onde a classificação incorreta pode ter consequências graves e potencialmente fatais.

O estudo conduziu comparações detalhadas entre SSL-GANs básicos e OSR-GANs de última geração sob condições de teste idênticas. Os resultados foram surpreendentemente semelhantes, confirmando assim a teoria dos investigadores de que os mecanismos subjacentes que governam tanto o SSL como o OSR estão interligados através do tratamento do espaço complementar.

Para realizar esta investigação, a equipe testou vários modelos GAN para determinar quais configurações fornecem desempenho ideal em cenários SSL-OSR. Entre os modelos testados, os margin-GANs se destacam pela sua abordagem elegante para definir e explorar o espaço complementar.

A estrutura integrada do SSL-OSR não apenas simplifica o processo de treinamento, mas também melhora o desempenho dos sistemas de aprendizado de máquina, tornando-os mais adaptáveis ​​e eficientes em aplicações do mundo real. À medida que o campo da inteligência artificial continua a evoluir, estudos como estes abrem caminho para sistemas mais robustos e versáteis, capazes de lidar com a complexidade e a imprevisibilidade dos dados do mundo real.

Nota de diário

Engelbrecht, E.-R., & du Preez, JA “Sobre a ligação entre aprendizagem generativa semissupervisionada e reconhecimento generativo de conjunto aberto.” Ciência África, 2023. DOI: https://doi.org/10.1016/j.sciaf.2023.e01903

Sobre os professores

Ésmile Émim Ele é pesquisador do Departamento de Engenharia Eletrônica da Universidade de Stellenbosch. Ele é um autor proeminente e relevante de estudos recentes que introduzem Aprendizagem de conjunto aberto com categoria aumentada usando dados não rotulados (open-LACU)Ele propõe uma estrutura integrada de aprendizado de máquina que combina aprendizado semissupervisionado, reconhecimento de conjunto aberto e detecção de novidades por meio de redes adversárias generativas. Ele também é coautor de um trabalho explorando a relação entre aprendizagem semissupervisionada e reconhecimento de conjunto aberto (SSL-OSR) com GANs.

Professor John A. Para Brisa Ele é uma figura ilustre na área de engenharia elétrica e eletrônica na Universidade de Stellenbosch, com foco em pesquisa em aprendizado de máquina, sistemas probabilísticos e processamento de fala e imagem. Seu trabalho notável inclui projetos relacionados à detecção de locutores e verificação de caligrafia, e ele foi membro fundador do Centro Stellenbosch para Tecnologia de Linguagem e Fala (SU’CLaST). Ele está associado ao Grupo de Visão e Aprendizagem e contribuiu para tecnologias de fala, imagem e processamento de sinais.

Source link