Início APOSTAS O novo modelo de IA do Google faz tudo é incrível

O novo modelo de IA do Google faz tudo é incrível

30
0

No ano passado, eu falsifiquei um bicho de pelúcia de uma criança para fazer parecer que o cervo de pelúcia estava de férias.

Este foi um experimento que o Google estava realizando para ver se conseguiam recriar os eventos retratados no anúncio do Gemini, e eles nunca mostraram um vídeo das aventuras de Buddy, o Cervo, para uma criança de 4 anos. Mas foi um exercício de descoberta que me fez pensar muito sobre a diferença entre diversão inofensiva com IA generativa e desleixo total. Talvez esse diagrama de Venn seja um círculo perfeito. Provavelmente não. Mas o que tenho certeza é que as ferramentas para criar vídeos realistas são incrivelmente boas e exigem surpreendentemente pouco esforço e conhecimento. E essa tendência continuará forte até a era Omni de Gêmeos.

Omni é uma nova família de modelos generativos que um dia será capaz de transformar qualquer tipo de entrada, incluindo fotos, vídeos e texto, em outras coisas. Mas primeiro, basta criar um vídeo. Omni Flash é o primeiro desses modelos lançado pelo Google e agora está disponível no Flow, plataforma de geração e edição de vídeos com IA da empresa. Você ainda pode usar modelos anteriores do Veo se quiser, mas o Omni melhorou o Veo de várias maneiras.

Omni permite que você carregue um vídeo e use-o, junto com instruções de texto, como ponto de partida para suas criações geradas por IA. O Google também afirma que Omni incorpora mais conhecimento do mundo real ao criar vídeos, resultando em melhor consistência de caracteres entre os vídeos. Só há uma maneira de realmente saber se essas afirmações são verdadeiras. Trouxe meu amigo de IA de volta para arrumar uma pequena sacola gerada por IA para outra aventura.

Os resultados são muito complexos e desconcertantes. Alguns eram muito bons, muito mais consistentes e fiéis às minhas instruções do que quando testei o Veo há 5 meses. Mas mesmo com os melhores clipes que Omni criou para mim, certos sustos de salto de IA ainda permanecem, como quando Buddy se vira repentinamente enquanto salta de paraquedas.

Em outro vídeo, dei alguma liberdade artística ao Omni. “Criamos uma montagem de Buddy fazendo as malas para as férias e embarcando em um navio de cruzeiro para uma escapadela tropical. É uma vibração fofa e divertida. Buddy traz algo interessante em sua mala, que vem mais tarde no clipe.” Isso fez Buddy embalar um pote de mel. Mais tarde no clipe, ele o pega como se fosse um frasco de protetor solar. “Hmm”, diz o personagem, esguichando mel no casco.

Honestamente, não é ruim. Porém, a garrafa de mel muda constantemente ao longo do vídeo, passando de uma jarra para uma garrafa de esguicho transparente com água e de volta para uma garrafa squeeze com mel. E não consigo nem começar a explicar como a modelo surgiu no quadro final do vídeo. É como se você vomitasse vários elementos da sequência que acabou de criar.

Sugira edições em seu vídeo usando instruções baseadas em texto. Parabéns ao Google. Isso funciona melhor no Omni do que quando testei o Veo 3. Mas o resultado é: ruim O caso do Veo foi tão decepcionante que achei muito mais fácil simplesmente solicitar que eu criasse um novo vídeo do zero sempre que eu quisesse mudar alguma coisa. Na verdade, o Omni refletirá suas edições, mas os resultados nem sempre serão um sucesso.

Tivemos um clipe de férias destacando as reações faciais de Buddy, e os resultados pareceram estranhos. Além disso, Buddy às vezes cria chifres, mas ele não os tem. Amigo é bebêmuito obrigado. Quando solicitei a remoção dos chifres que apareciam em uma cena, ele obedeceu e adicionou os chifres a todas as outras cenas também.

O problema é que nada disso é gratuito. Gerar um vídeo custa créditos, que podem variar de 15 a 40 créditos dependendo da duração da cena e das “coisas” com as quais você começa. Cada edição custa 40 créditos. Estou no plano AI Pro de US$ 20/mês, que vem com 1.000 créditos por mês. Depois de fazer algumas edições e gerar cerca de 20 clipes, caí para 145. Se você tem uma ideia específica do vídeo que deseja que o Omni produza, pode acabar gastando muito tempo interagindo com o modelo para obter um vídeo que corresponda melhor à sua visão.

Posso dizer honestamente que não estava preparado para o que vi.

Um dos supostos pontos fortes do Omni é adicionar coisas geradas por IA a vídeos reais, então dei uma folga ao Buddy e fiz uma deepfake. Comecei com uma selfie em branco e pedi ao Omni para gerar vídeos meus comendo espaguete, sentado no assento de um avião, em frente à Torre Eiffel e mordendo uma baguete. E posso dizer com certeza que não estava preparado para o que vi.

Meu vídeo deepfake tem IA falando. O som de um garfo batendo em uma tigela de macarrão é um pouco exagerado. Uma mulher aparece duas vezes no fundo do vídeo do avião. Mas, além dessas pequenas falhas e uma vaga sensação de estranheza, eles são bastante convincentes.

Mostrei ao meu marido o clipe de macarrão. Ele sabia que eu estava testando uma ferramenta de vídeo de IA, mas não contei a ele o que estava sendo gerado pela IA na cena. Sem saber o que a IA havia produzido, ele presumiu que eu estava sentado na frente de uma câmera comendo macarrão e disse que a única pista de que algo havia acontecido era que a tigela parecia estranha. Comer macarrão em si parecia convincentemente real. meu marido. Basicamente homens que me viram na vida real todos os dias nos últimos 10 anos.

Meus outros deepfakes são em vários graus de “bons o suficiente para enganar as pessoas nas redes sociais”. Alguns dos clipes da Torre Eiffel parecem um pouco de desenho animado, mas um é tão convincente que talvez você precise assisti-lo algumas vezes para confirmar que é IA. EU Quando o “eu” da IA ​​se vira e me mostra seu cabelo preso em um rabo de cavalo, eu sei que não sou eu. Mas não tenho certeza se outras pessoas conseguem entender a diferença e isso me faz sentir estranho.

Estamos definitivamente no fundo do vale misterioso

Para ser sincero, estou um pouco cansado de tudo. Quando testei o Veo 3, fiquei impressionado com o realismo que ele produziu. Repetidamente nos últimos anos, fiquei chocado ao ver como é fácil criar uma persona falsa com fotos falsas. Eu provavelmente deveria estar chocado com Omni também, e provavelmente estou, mas a vantagem desapareceu.

Criar uma obra-prima cinematográfica gerada por IA não é tão fácil quanto o Google espera. Mas Omni melhora o Veo de algumas maneiras reconhecíveis. Com apenas um pouco de esforço, se você tiver uma conta do Google e um cartão de crédito, poderá gravar um vídeo de si mesmo sentado em casa e fazer parecer que está em um avião para Maui. Não creio que estejamos exatamente na “base da singularidade”, mas estamos definitivamente nas profundezas do vale misterioso.

Todas as imagens e vídeos desta história foram gerados pelo Google Gemini.

Siga tópicos e autores Veja mais histórias como esta no feed da sua página inicial personalizada e receba atualizações por e-mail.


Source link

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui