Início NOTÍCIAS Cinco arquitetos da economia da IA ​​explicam de onde vêm as rodas

Cinco arquitetos da economia da IA ​​explicam de onde vêm as rodas

25
0

No início desta semana, cinco pessoas que abordam todos os aspectos da cadeia de fornecimento de IA sentaram-se na Milken Global Conference em Beverly Hills, onde conversaram com este editor sobre tudo, desde escassez de chips a data centers orbitais até a possibilidade de que toda a arquitetura que envolve a tecnologia esteja errada.

No palco com o TechCrunch: Christophe Fouquet, CEO da ASML, empresa holandesa que detém o monopólio das máquinas de litografia ultravioleta, sem as quais não existiriam chips modernos; Francis deSouza, COO do Google Cloud, que supervisiona uma das maiores apostas em infraestrutura da história corporativa; Qasar Younis, cofundador e CEO da Applied Intuition, uma empresa corporativa de IA de US$ 15 bilhões que começou na simulação e daí passou para a defesa; Dimitry Shevelenko, gerente de negócios de Complexidade, pesquisa nativa de IA, acompanhou os executivos; e Eva Bodnia, uma cientista quântica que deixou a academia para projetar a arquitetura fundamental da indústria de IA mais desafiadora em sua startup, Logical Intelligence. (O primeiro cientista-chefe de IA da Meta, Yan LeCun, foi contratado para presidir o conselho de pesquisa técnica da fundação no início deste ano).

Aqui está o que os cinco dizem:

Esses são os verdadeiros gargalos

O boom da IA ​​​​está atingindo limites físicos rígidos e as restrições estão começando a se acumular além do que muitas pessoas sabem. Fouquet foi o primeiro a descrever a “tremenda aceleração da fabricação de chips”, ao mesmo tempo em que expressou sua “forte crença” de que, apesar de todos os esforços, “nos próximos dois, três, talvez cinco anos, o mercado será limitado”, ou seja, os hiperscaladores – Google, Microsoft, Amazon, Meta – não são todos chips que pagam, ponto final.

DeSouza destacou quão grande – e quão rápido cresce – este problema é, lembrando ao público que a receita do Google Cloud foi de US$ 20 bilhões no último trimestre, crescendo 63%, enquanto seu backlog — aluguel comprometido, mas ainda não pago — quase dobrou em um trimestre, de US$ 250 bilhões para US$ 460 bilhões. “É uma questão de demanda”, disse ele calmamente.

Para Younis, a compulsão veio de outro lugar. A Applied Intuition está construindo sistemas autônomos para carros, caminhões, drones, equipamentos de mineração e veículos de defesa, e seu gargalo não é o silício – são os dados que ela pode coletar enviando máquinas para o mundo real e observando eventos. “Você tem que descobrir a partir do mundo real”, diz ele, e nenhuma simulação sintética preenche totalmente a lacuna. “Levará muito tempo até que possamos estabelecer sinteticamente modelos completos no mundo físico.”

Coisa tecnológica

São Francisco, Califórnia
|
13 a 15 de outubro de 2026

A indústria também é um problema real

Se os chips são o primeiro gargalo, é o poder que está por trás deles. DeSouza confirmou que o Google está explorando o espaço do data center como uma resposta séria às restrições energéticas. “Você tem acesso a uma indústria mais produtiva”, observou ele. Claro, em órbita não é fácil. DeSouza observou que o espaço está vazio, eliminando assim a convecção, deixando a radiação como o único caminho para aquecer o ambiente circundante (um processo muito mais lento e mais difícil de projetar do que os sistemas de refrigeração a ar e líquido dos quais os centros dependem hoje). No entanto, a empresa ainda trata isso como uma rota legítima.

Um argumento mais profundo apresentado por Souza, de forma um tanto inconsistente, foi sobre a eficiência através da integração. O Google planeja construir uma biblioteca completa de IA – desde chips TPU personalizados até modelos e agentes – dividindo os flops por watt (mais computação por unidade de energia) que uma empresa que compra peças prontas para uso simplesmente não consegue replicar. “A execução dupla em TPUs é muito mais eficiente do que qualquer outro formato na indústria”, porque os designers que projetam o chip sabem o que está incluído no modelo antes de enviá-lo, disse ele.

Fouquet levantou uma questão semelhante mais tarde no debate. “Nada pode ser inestimável”, disse ele. A indústria encontra-se agora num momento crítico, investindo quantidades extraordinárias de capital, com uma necessidade estratégica urgente. Mas mais computador significa mais rápido e custa mais.

Outro tipo de inteligência

Enquanto outras indústrias escalam a concorrência, a arquitetura e a eficiência resultante em um grande paradigma de modelo de linguagem, Bodnia é muito diferente.

A sua empresa, a Logical Intelligence, trabalha nos chamados modelos baseados em energia (EBMs), um tipo de IA que não prevê o próximo sinal numa sequência, mas tenta compreender os padrões subjacentes dos dados, argumentando que está de alguma forma mais próximo da forma como o cérebro humano funciona. “A linguagem é a interface do usuário entre o meu cérebro e o seu”, diz ele. “A própria razão não adere a nenhuma linguagem.”

Seu maior modelo funciona com 200 milhões de parâmetros – em comparação com centenas de bilhões nos principais LLMs – e afirma funcionar milhares de vezes mais rápido. Em vez disso, ele pensou em atualizar seu conhecimento à medida que as informações mudavam, em vez de mantê-lo do zero.

Para o projeto de chips, robótica e outras áreas onde o sistema físico deve ser entendido em vez de padrões linguísticos, argumenta-se que os EBMs são mais adequados. “Quando você dirige um carro, você não procura padrões em nenhum idioma. Olhe ao seu redor, entenda as regras do mundo ao seu redor e tome uma decisão.” É um tema interessante e que provavelmente atrairá mais atenção nos próximos meses, visto que o campo da IA ​​começou a questionar se a escala por si só é suficiente.

Gerentes, tutores e curadores

Shevelenko passou muito tempo na entrevista explicando como a Complexidade evoluiu da pesquisa para algo que ele agora chama de “artista digital”. Complexity Computer, sua nova oferta, não foi pensada como uma ferramenta para entender o uso do operador, mas como uma equipe que guia o trabalhador pelo conhecimento. “Você acorda todos os dias e tem 100 caras no seu time”, disse ele sobre a oportunidade. “O que você vai fazer para aproveitar ao máximo?”

É um argumento convincente; também levanta questões abertas sobre o poder, como lhes perguntei. Resposta: granularidade. Os administradores corporativos podem definir não apenas quais conexões e ferramentas o administrador pode acessar, mas também se essas permissões são somente leitura ou leitura-gravação, uma distinção que é extremamente importante quando os agentes operam em sistemas corporativos. Quando Comet, o agente da interface do usuário, atua em nome do usuário, propõe um plano e primeiro pede aprovação. Alguns usuários acham o atrito irritante, disse Shevelenko, mas ele disse que acha que é essencial, especialmente depois de ingressar no conselho da Lazard, onde disse que achou inesperadamente simpático aos impulsos conservadores de um CISO que protege uma marca de 180 anos construída inteiramente na confiança do cliente. “A granularidade é a base de bons cuidados de saúde”, diz ele.

Governo, não salvação

Younis ofereceu o que chamou de tabela de observação geopolítica mais séria, segundo a qual a IA física e o governo nacional estão envolvidos de uma forma que a IA puramente digital nunca esteve.

Inicialmente, a internet foi popularizada como uma tecnologia americana e antes o impacto se limitava à camada de aplicação – Ubers e DoorDashes – quando as consequências offline se tornaram visíveis. A física da IA ​​é diferente. Veículos autónomos, drones de defesa, equipamento mineiro, máquinas agrícolas – estes são evidentes no mundo real nas vias públicas e não podem ser ignorados, questões sobre segurança, recolha de dados e, em última análise, quem controla os sistemas que operam dentro das fronteiras da nação. “Quase constantemente todos os países falam: não queremos que esta inteligência seja governada por um país estrangeiro nas nossas fronteiras”. Menos nações, disse a multidão, podem agora consertar robôs do que possuem armas nucleares.

Fouquet proibiu de forma um pouco diferente. O progresso da IA ​​da China é real – o lançamento do DeepSeek no início deste ano causou um certo susto em partes da indústria – mas o progresso está sendo forçado abaixo da camada de modelagem. Sem acesso à litografia EUV, os fabricantes de chips chineses não podem fabricar semicondutores avançados, e os modelos construídos em hardware mais antigo funcionam em desvantagem, independentemente da qualidade do software. “Hoje, nos Estados Unidos, você tem os dados, você tem acesso à computação, você tem os chips, você tem o talento. A China está fazendo um trabalho muito bom no topo da pilha, mas faltam alguns abaixo”, disse Fouquet.

problema de geração

No final do nosso painel, alguém na plateia fez uma pergunta obviamente inadequada: será que este futuro irá reduzir a capacidade de geração de pensamento crítico?

As respostas foram encorajadoras, como você poderia acreditar, de pessoas que iniciaram suas carreiras nesta tecnologia. DeSouza apontou imediatamente a escala do problema como ferramentas mais poderosas para finalmente abordar a humanidade. Pense nas doenças neurológicas cujos mecanismos biológicos ainda não compreendemos, nos conservantes de remoção de gases e numa infraestrutura de rede que está atrasada há décadas. “Isso nos levará ao nível da criação”, disse ele.

Shevelenko destacou uma questão mais pragmática: o emprego inicial pode estar desaparecendo, mas a capacidade de fazer algo de forma independente nunca existiu. “(Para) todos que possuem Complexidade Informática… seu ponto forte é a curiosidade e o trabalho.

Younis traçou uma distinção nítida entre trabalho e trabalho físico. Ele salienta que o agricultor americano médio tem 58 anos e a escassez de mão-de-obra na mineração, no transporte rodoviário de longo curso e na agricultura é longa e crescente – não porque os salários sejam demasiado baixos, mas porque as pessoas não querem esses empregos. Nestes domínios, a física não está disponível para os operadores de IA. O vácuo já existe e só pode ser analisado mais profundamente a partir daqui.

Quando você compra através dos links de nossos artigos, podemos ganhar uma pequena comissão. Isto não afeta a nossa independência editorial.

Source link

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui