Início NOTÍCIAS Google Maps usa Gemini para escrever legendas para suas fotos

Google Maps usa Gemini para escrever legendas para suas fotos

71
0

Resumindo: O Google Maps agora usa o Gemini para sugerir legendas quando os usuários compartilham fotos de locais, lançando no iOS nos EUA e expandindo globalmente para o Android nos próximos meses, o último passo em uma campanha de seis meses para incorporar IA em todos os mapas do Maps.

Adicionar uma foto ao Google Maps sempre exige uma pequena decisão de vontade: você tira uma foto, coloca e depois considera em um campo de texto em branco se o restaurante que você visitou tem vista completa ou nada. A maioria das pessoas não escolhe nada. A partir de 7 de abril de 2026, o Google está tentando consertar isso com o Gemini. A empresa anuncia que o Google Maps agora analisará imagens e vídeos enviados e sugerirá automaticamente uma legenda, dando aos colaboradores o que a legenda descreve durante a escrita. Os usuários podem aceitar, editar ou excluir uma sugestão. O recurso está atualmente disponível em inglês para iOS nos Estados Unidos, com lançamento global para Android nos próximos meses.

A mudança é pequena em escopo e significativa em intenção. O Google Maps é capaz de incorporar conteúdo gerado pelo usuário em uma escala que poucas plataformas possuem: mais de 120 milhões de Local Guides contribuem para a plataforma, carregando coletivamente cerca de 300 milhões de imagens por ano e gerando mais de 20 milhões de contribuições por dia, por meio de avaliações, classificações, edições e imagens. O conteúdo dessa tabela forma o substrato do objeto. A qualidade da listagem do restaurante, as fotos detalhadas do hotel, a legibilidade da nova página comercial, tudo depende da escolha das pessoas por escrever algo em vez de nada ao abrir uma parte da tela. Remover o atrito de uma caixa de texto em branco, ou mesmo leve, é um dado de qualidade no que diz respeito à experiência do usuário.

Como funcionam as legendas de Gêmeos

Mecânica simples. Quando um usuário seleciona uma foto ou vídeo para compartilhar no Maps, o Gemini captura a imagem, identifica o assunto e o contexto e sugere uma legenda. O usuário pode visualizar a sugestão à sua frente e alterá-la livremente ou removê-la completamente. O Google tornou a ferramenta útil em vez de automatizada: é uma fonte cativa, não um resultado editado. Compilando coisas tanto para a confiança do usuário quanto para a plataforma de padrões de conteúdo, quando um Google cativo ajudasse a escrevê-lo, ele teria um tipo diferente de responsabilidade se realmente cometesse um erro.

Tecnologia da UE

As últimas notícias sobre o cenário tecnológico da UE, uma história sobre os sábios do autor Boris e alguma arte questionável de IA. É grátis, toda semana, na sua caixa de entrada. Cadastre-se agora!

O recurso vem sendo desenvolvido no Google Maps há vários meses. Em novembro de 2025, a empresa introduziu seus primeiros recursos de navegação com tecnologia Gemini, incluindo instruções sinalizadas que dizem aos motoristas para virarem “atrás do restaurante Thai Siam” em vez de “em 200 metros”. Em janeiro de 2026, o governo estrelado por Gêmeos expandiu-se para o ciclismo e a caminhada. Em 12 de março de 2026, o Google anunciou o Ask Maps, uma forma de pesquisar conversas em mais de 300 milhões de lugares e 500 milhões de avaliações da comunidade para responder perguntas complexas, linguagens naturais, juntamente com navegação imersiva, que descreveu a maior direção de revisão em uma década. O recurso de captura de fotos com IA é o próximo passo dessa série, estendendo a navegação e a pesquisa do Gemini para um fluxo de trabalho de criação de conteúdo que mantém o quadro atualizado. Um ano de implantação agressiva de IA em todo o conjunto de produtos do Google Esta implementação é entusiasmante e os mapas são agora claramente um alvo prioritário.

Volante de dados por trás do recurso

A lógica estratégica não é difícil de decifrar. A proposta de valor do Google Maps baseia-se no fornecimento de informações mais precisas, abrangentes e atualizadas sobre mais lugares do que qualquer concorrente. Essas informações úteis são mantidas principalmente pelas contribuições dos usuários, e não pela própria equipe editorial do Google. Qualquer coisa que aumente o volume de contribuições — especialmente legendas, imagens contextuais, em vez de despejos de legendas de imagens — reforça a relevância do mapa para pesquisa e descoberta. Uma foto com uma descrição (“assentos ao ar livre, adequado para cães, ocupado depois das seis”) é mais útil para alguém que planeja uma visita do que uma imagem de pôster em branco.

O tempo também reflete a pressão competitiva. ChatGPT expande seu papel na pesquisa local e recomendação disponibilizada por listagens do Google e pesquisadores de empresas e À medida que os modelos de IA começam a monetizar diretamente a localização, a qualidade dos dados de localização subjacentes que eles podem utilizar torna-se um ponto discutível. O Google Web Site Leaders é um dos ativos mais valiosos neste contexto. Reduzir o padrão de recursos-chave ajuda a ficar à frente de um conjunto de dados que os rivais podem obter ou replicar.

Que paradoxo

A tensão do recurso de captura precisará ser navegada com cuidado. A facilidade de compartilhar conteúdo no Maps não torna o conteúdo automaticamente melhor. O Google removeu mais de 160 milhões de fotos e 3,5 milhões de tabelas geográficas no período mais recente de contenção de conteúdo, citando violações de políticas ou baixa qualidade. A plataforma também retirou mais de 960.000 avaliações em 2024 que eram falsas ou fraudulentas em massa e detalhou com a Gemini para detectar avaliações geradas por IA e edições suspeitas. A redução do desgaste na comunicação fotográfica significa desgaste por conteúdo pobre ou reeditado, bem como por contribuições de boa qualidade.

A aparente resposta do Google é usar a mesma IA que gera legendas para ajudar na moderação – usando o Gemini tanto para escrever conteúdo quanto para exibi-lo. Essa dupla função torna-se uma característica da estrutura de grandes plataformas de gestão de conteúdos gerados pelos utilizadores assistidos por IA e levanta questões sobre governação que vão muito além de mapas ou imagens. IA governamental em organizações de conteúdo Continua a ser um dos desafios de resolver os problemas infra-estruturais desta época, e o registo de registos de captura é um estudo pequeno mas instrutivo: as vantagens da automatização e a redução do risco de conteúdo exigem que seja o mesmo modelo sob o qual duas partes opostas possam ser exercidas ao mesmo tempo.

iOS primeiro, depois o mundo

O lançamento primeiro no iOS e nos EUA é consistente com o lançamento oficial do recurso Gemini pelo Google. Search Maps lançado nos EUA e na Índia antes da expansão; O cruzeiro envolvente começou com motoristas dos EUA antes de passar para outros mercados. A restrição de legendas apenas em inglês representa a complexidade adicional de gerar texto contextualmente apropriado e gramaticalmente natural em idiomas onde o desempenho da IA ​​é mais variável. A expansão para os mercados Android e não-inglês é esperada “nos próximos meses”, embora o Google não tenha especificado quais idiomas irão buscar primeiro.

O cenário competitivo para o mapeamento de IA também ajudou a modelar a infraestrutura móvel. O impulso da Microsoft pela independência do modelo da OpenAI inclui a visão e as capacidades multimodais que são finalmente conhecidas como o poder da competição baseada em localização, e a inteligência de imagem das sugestões de captura do Google é exatamente o tipo de capacidade onde a lacuna entre os modelos de limite e a ordem média dos opostos é rapidamente reduzida. Por enquanto, a vantagem do Google é uma integração de profundidade e não um modelo de desempenho bruto: o Gemini funciona dentro do Maps porque o Maps é o Google, e nenhum concorrente tem igual influência na contribuição do trabalho de 120 milhões de usuários.

A caixa de legenda em branco existe no Google Maps há anos. Acontece que a maneira mais simples de as pessoas preencherem é preenchê-lo para elas e decidir se querem mantê-lo.

Source link