Início NOTÍCIAS Gigantes da tecnologia chineses e a ‘madrinha’ da IA, Li Fei-fei, correm...

Gigantes da tecnologia chineses e a ‘madrinha’ da IA, Li Fei-fei, correm para dominar os modelos globais

47
0

Uma onda de empresas, de start-up a start-up Inteligência artificial Li Fei-fei, a “madrinha” das maiores empresas de tecnologia da China, está correndo para apresentar suas mais recentes inovações. Modelos do mundo – Um campo emergente que visa alargar a IA para além do processamento da linguagem, para a aprendizagem e compreensão da realidade física.
Participação do Grupo Alibaba De acordo com um comunicado da unidade de negócios Alibaba TokenHub (ATH) do grupo de comércio eletrônico, a HappyOyster revelou na quinta-feira o que chamou de modelo de mundo aberto projetado para criar e interagir com mundos virtuais “fluidos” e em tempo real, recentemente projetado para reforçar suas principais iniciativas de IA. Alibaba é dona do South China Morning Post.

De acordo com a ATH, o Happy Oyster suportava dois modos de criação de mundo virtual: um modo de direção para criar mundos com base em texto e pistas visuais e um modo errante para explorar esse mundo.

Ao contrário das ferramentas tradicionais de vídeo de IA, que produzem clipes únicos que duram uma dúzia de segundos ou alguns minutos, o HappyOyster pode produzir videoclipes de até três minutos apresentando mundos virtuais, disse a empresa. Além disso, o modelo pode responder continuamente às instruções durante o processo de geração, em oposição ao paradigma tradicional de IA única, disse a empresa.

Happy Oyster oferece suporte a dois modos de criação de mundo virtual: um modo de direção para construir um mundo baseado em dicas de texto e imagem e um modo errante para explorar esse mundo.
ATH disse que isso significa que os usuários poderiam continuar a desenvolver seus mundos imaginativos com novas ideias. Por exemplo, um Vídeo de demonstração Parecia que durante o processo de geração, um usuário poderia simplesmente digitar “black crow fly past” para convocar um bando de corvos voadores ou ordenar que os personagens “conversassem entre si”.

O lançamento ocorre um dia depois que o WorldLabs, com sede em São Francisco, cofundado pelo professor Lee de Stanford, revelou o Spark 2.0 no início de 2024, um mecanismo de renderização 3D de divisão gaussiana de código aberto que visa trazer a capacidade de visualizar imagens 3D em grande escala para dispositivos ainda menos potentes, como smartphones.

Source link