Início NOTÍCIAS O capítulo de direção autônoma da Nvidia fala sobre seus planos para...

O capítulo de direção autônoma da Nvidia fala sobre seus planos para Waymo e Tesla. vencer

25
0

A cada seis meses, o chefe automotivo da Nvidia, Xinzhou Wu, convida o CEO Jensen Huang para andar em um veículo equipado com o sistema de direção autônoma sem as mãos da empresa. Mas só quando Wu tem “boa fé” nas capacidades do sistema é que ele pressiona.

Os dois dirigiram recentemente de Woodside, Califórnia, ao centro de São Francisco em um sedã Mercedes CLA equipado com MB.Drive Assisi Pro, um sistema de assistência ao motorista projetado em parte pela Nvidia que é semelhante ao sistema totalmente autônomo da Tesla. O clima estava leve, embora o trânsito estivesse bastante intenso.

“Avise-me quando estiver no modo autônomo”, disse Huang Wu, de acordo com um vídeo da ascensão. Beira“Então posso me importar menos com minha saúde.”

Ao longo do evento de 22 minutos, Mercedes Huang e Wu navegam por uma série de obstáculos cotidianos, como canteiros de obras, carros estacionados em fila dupla e ruas estreitas canalizadas por fileiras de cones laranja. O sistema da Nvidia parece bastante capaz, embora o vídeo seja editado e não apresentado em tempo real. (A porta-voz da Nvidia, Jessica Soares, disse mais tarde que não houve conflitos durante a viagem).

No entanto, não pareceu muito diferente da minha experiência no ano passado andando de espingarda com executivos da Nvidia em um Mercedes com sistema de direção mãos-livres. Fiquei impressionado com a capacidade do sistema de lidar com sinais de trânsito, bloqueios de quatro pistas, carros com parada dupla, curvas à esquerda sem vigilância e todos os pedestres, ciclistas e passageiros que São Francisco pode lançar sobre você. Se a Tesla consegue fazer isso com algum silício e um monte de câmeras, é lógico que a empresa mais valiosa do mundo também conseguiria.

No ChatGPT a importância da IA ​​física

Depois de anos trabalhando nos bastidores, a Nvidia baseia sua liderança em uma posição de destaque em drives autônomos. Ela não apenas fornece chips para empresas como a Tesla, mas também fornece suas próprias linhas de conhecimento de IA para parceiros como Mercedes, Land Rover Jaguar e Lucid. Este ano, antes dos CEs, Huang revelou Alpamayoum portfólio de modelos de IA, planos de simulação e conjuntos de dados que podem dar aos veículos autonomia de nível 4, permitindo-lhes dirigirem-se totalmente sob certas condições. Huang elogiou o anúncio como “a importância do ChatGPT para a IA do corpo”.

No carro com Wu, Huang é menos pomposo e introspectivo – mas não menos otimista quanto ao futuro da tecnologia. “Acho que o desafio, claro, é Alpamayo, por mais incrivelmente inteligente que seja – e ele pode raciocinar sobre isso – não sabemos o que ele não pode fazer”, disse ele. “E esse é o desafio, e é por isso que nossa pilha clássica é tão importante.”

Depois de anos trabalhando nos bastidores, a Nvidia se baseia em sua posição como líder proeminente em unidades autônomas

Huang se orgulha de que a abordagem da Nvidia para a direção autônoma é “única” porque combina IA de ponta a ponta com uma pilha “clássica” tradicional de engenharia humana. Modelos puros de ponta a ponta são difíceis de verificar quanto à segurança, teoriza ele. Por outro lado, uma pilha clássica segue protocolos e processos de engenharia bem estabelecidos que facilitam a verificação de determinados comportamentos que são suficientemente seguros. Ao combinar os dois métodos, o sistema Nvidia pode se beneficiar de uma direção de estilo humano, ao mesmo tempo em que mantém uma estrutura segura dentro das regras de trânsito tradicionais.

A acusação de Huang não apoia inteiramente uma abordagem singular à indústria; outros operadores AV também utilizam redes neurais ponta a ponta, eventualmente com regras de segurança detalhadas para orientar como o veículo deve responder. Mas é certamente verdade que o ensino voltado para o fim, que tende a ser mais humano nas pulsões e menos robótico, é mais prevalente. Waymo depende de um sistema híbrido, enquanto Tesla depende exclusivamente de redes neurais ponta a ponta.

Na entrevista, Wu disse que os modelos ponta a ponta podem responder melhor a coisas como lombadas ou mudanças de faixa sem parecerem muito mecânicos ou robóticos. “É por isso que o ChatGPT realmente existe desta vez”, disse ele. “Somente quando seu carro realmente dirige com confiança… é que geralmente os clientes sentirão que desejam usá-lo.”

Tesla e o alto custo da direção autônoma

Perguntei a Wu como ele achava a abordagem da Nvidia em comparação com o carro totalmente autônomo da Tesla, que percorreu 13,5 bilhões de quilômetros, mas esteve envolvido em vários incidentes de segurança preocupantes, com 23 feridos e pelo menos duas mortes. Em dezembro passado, um executivo da Nvidia me disse que a empresa havia testado dois sistemas um contra o outro. Diz-se que o número do driver de controle do sistema da Nvidia é comparável, às vezes favorecendo um sistema, agora o outro.

Wu se recusou a comentar diretamente sobre o histórico de segurança da Tesla, mas explicou que a Nvidia se diferencia pelo uso de vários sensores, incluindo câmeras, radar, sensores ultrassônicos e – para configurações mais altas – lidar. A Nvidia acredita que a redundância e a diversidade na tecnologia de detecção são críticas para lidar com casos extremos difíceis e alcançar níveis mais elevados de segurança, disse Wu.

“Somente quando seu carro realmente dirige com confiança… é que geralmente os clientes sentirão que desejam usá-lo.”

-Xinzhou Wu

Sensores adicionais significam alguns adicionais. A inclusão do lidar em particular sugere que o sistema mais seguro da Nvidia só estará acessível a proprietários ricos de Mercedes. Mas Wu acredita que a abordagem verticalmente integrada da Nvidia permite fornecer o desempenho de segurança necessário com o menor custo para as partes.

A plataforma de jogos Hyperion da Nvidia foi projetada com múltiplas configurações em mente. A versão básica utiliza um conjunto de sensores mais simples e econômico, contando principalmente com câmeras e radar. Estes sensores tornaram-se dramaticamente mais baratos na última década devido à produção em massa; sensores ultrassônicos agora são muito baratos. Para maior autonomia, a plataforma pode adicionar sensores lidar e, com o custo do lidar diminuindo, Wu disse acreditar que os veículos com preços entre US$ 40.000 e US$ 50.000 poderiam realisticamente incluir a pilha completa de sensores necessária para autonomia avançada.

Dadas as vantagens e desvantagens

Perguntei a Wu sobre incidentes de segurança recentes envolvendo veículos Waymo, como os robotáxis da empresa bloqueando cruzamentos bloqueados em São Francisco. Ele disse que a Nvidia já executa cenários semelhantes por meio de simuladores. Na verdade, a empresa depende fortemente de dados de condução sintéticos para explicar as suas desvantagens em testes no mundo real. A Tesla dirigiria bilhões de quilômetros no mundo real, graças a uma grande frota de carros de clientes. Waymo dirigiu aproximadamente 200 milhões de veículos totalmente autônomos em vias públicas. Como a Nvidia espera alcançá-la?

“A grande história da infraestrutura é na verdade uma simulação”, disse Wu. A Nvidia tem duas abordagens para isso. Uma delas é a reconstrução neural, ou NuRec, na qual os engenheiros da empresa recriam cenários de condução do mundo real usando dados de sensores coletados de veículos em campo. Outro é o aumento, que determina os elementos reparados na cena para explorar outros resultados potenciais. Isso permite que os engenheiros explorem como o sistema autônomo se comporta em circunstâncias ligeiramente diferentes e vejam casos extremos mais raros que estariam presentes no conjunto de dados original.

“Podemos sair mais rápido, mais devagar, em um lugar diferente”, disse ele. “Isso é o que chamamos de indefinição do conjunto de dados.”

A Nvidia adquiriu imagens do Dashcam de seus parceiros para alimentar os dados que usa na simulação. Ele também recria a série de acidentes decorrentes desses incidentes Waymo, como apagões, e ensina seu sistema a responder a cruzamentos sem obstáculos.

E o objetivo final é construir um sistema que utilize o raciocínio para evitar essas armadilhas extremas – atendendo assim, em primeiro lugar, à necessidade do mundo real de uma direção baseada em dados. A equipe de Wu está trabalhando em algo que eles chamam de Modelo de Ação da Linguagem da Visão, que colocará essa teoria em prática. Esses modelos combinam percepção visual, compreensão da linguagem e atividade física em uma arquitetura unificada que se baseia em modelos fundamentais de grande escala já construídos em bancos de dados estatais da Internet. Wu compara isso à educação de motorista.

“Quando ensinamos uma criança a dirigir, ela lê o livro de regras e tem 20 horas de prática ao volante”, disse Wu. “Em geral, eles não são ruins para os pilotos começarem – embora, obviamente, seja necessária experiência para melhorar. Finalmente, queremos um exemplo que funcione pela mesma razão: no futuro, quando receber apenas um livro de regras e 20 horas de treinamento, ele aprenderá a dirigir.”

Acompanhe os temas e autores desta história para ver mais sobre isso em sua própria página para alimentar o protocolo e receber atualizações por e-mail.


Source link

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui