Um carro autônomo está dirigindo em uma estrada solitária. De repente, um enorme tornado apareceu à distância. O que os carros sem motorista farão a seguir?
Este é apenas um dos cenários que o Waymo pode simular no mundo virtual “hiperrealista” que acabou de criar com a ajuda do DeepMind do Google. O modelo mundial da Waymo é construído usando Genie 3, o novo modelo mundial de IA do Google que pode gerar espaços virtuais interativos que incluem texto e imagens como prompts. Mas Genie 3 não se trata apenas de criar cópias de baixa qualidade de jogos da Nintendo. Você também pode construir ambientes 3D interativos e fotorrealistas que são “adaptados aos rigores do domínio da direção”. Waymo diz.
A simulação é um elemento-chave no desenvolvimento de veículos autônomos, permitindo aos desenvolvedores testar veículos em uma variedade de configurações e cenários, muitos dos quais ocorrem apenas em casos muito raros e não representam risco físico de danos aos passageiros ou pedestres. As empresas AV utilizam estes ambientes virtuais para executar uma série de testes, acumulando milhões ou mesmo milhares de milhões de quilómetros no processo, na esperança de treinar melhor os seus veículos para “casos extremos” que possam encontrar no mundo real.
Quais casos extremos o Waymo está testando? Além do tornado mencionado, a empresa também pode simular coisas como uma ponte Golden Gate coberta de neve, um beco sem saída suburbano inundado com móveis flutuantes, um bairro em chamas e até mesmo um encontro com um elefante feroz. Em cada cenário, os sensores LIDAR da Waymo robotaxis geram uma renderização 3D do ambiente circundante, incluindo obstáculos na estrada.
“O Waymo World Model pode gerar praticamente qualquer cena, desde a condução cotidiana até raros cenários de cauda longa, em múltiplas modalidades de sensores”, disse a empresa em um blog.
Waymo diz que o Genie 3 é ideal para criar mundos virtuais para robotáxis, citando três mecanismos exclusivos: controle de ação de direção, controle de layout de cena e controle de idioma. Os controles de ação de direção permitem que os desenvolvedores simulem contrafactuais “e se”, e os controles de layout de cena permitem que os desenvolvedores personalizem os layouts das estradas, como semáforos e outros comportamentos dos usuários da estrada. Waymo descreve o controle de idioma como “a ferramenta mais flexível” que permite ajustar a hora do dia e as condições climáticas. Isto é especialmente útil quando os desenvolvedores estão tentando simular situações de pouca luz ou muito brilho, onde pode ser difícil para os vários sensores do veículo verem a estrada à frente.
O Waymo World Model também pode capturar imagens de câmeras de veículos do mundo real e transformá-las em um ambiente simulado, proporcionando “o mais alto grau de realismo e factualidade” em testes virtuais, afirma a empresa. Você também pode criar cenas de simulação mais longas, incluindo cenas reproduzidas em velocidade 4x, sem sacrificar a qualidade da imagem ou o processamento do computador.
“Ao simular o ‘impossível’, preparamos proativamente os motoristas Waymo para alguns dos cenários mais raros e complexos”, disse a empresa em um blog.



