A enorme procura de computadores para executar modelos de IA apenas acelerou, mas existem dois grandes obstáculos que qualquer pessoa no mundo dos negócios deve ultrapassar: obter os chips certos e colocá-los em centros de dados onde possam começar a gerar receitas.
A General Accounting, uma nova introdução à neocloud – uma empresa que alimenta o ecossistema de IA, especificamente na Páscoa com modelos que funcionam e respondem aos usuários em vez de treinados – responde a perguntas que destacam para onde o ecossistema de IA está indo. Essas respostas ajudaram a levar a uma rodada inicial de US$ 15 milhões com uma avaliação pós-semente de US$ 60 milhões liderada pela FUSE VC com a participação da Carya Venture Partners e Village Global Ventures.
Primeiro, qual é o chip certo? A demanda por GPUs disparou, mas a sabedoria convencional é que eles não são os melhores chips adequados para executar modelos de IA, uma vez treinados. A fase da IA em que o modelo está gerando respostas ativamente tem requisitos computacionais diferentes dos de treinamento, e um novo tipo de chip é projetado especificamente para isso. A transação Groq de US$ 20 bilhões da Nvidia em dezembro e o IPO de US$ 57 bilhões da Brain na semana passada mostram.
Com a capacidade limitada em ambas as empresas, o CEO dos cofundadores da General Accounting, Finn Puklowski, e o CTO Jason Goodison encontraram outra opção. Eles recorrem a chips especiais fabricados pela SambaNova, fabricante de chips apoiada pela Intel e focada nos resultados que ficaram um pouco aquém da conferência do Vale do Silício.
Isso pode mudar quando a SambaNova lançar novos chips este ano. A arquitetura é mais flexível e usa mais memória para armazenar contexto entre cálculos subsequentes, e SambaNova afirma que não funcionará apenas com GPUs, mas também com outros chips especializados construídos por empresas como Groq ou Cerebras. Puklowski disse que os novos chips irão gerar de 600 a 700 sinais por segundo, contra cerca de 250 sinais por segundo para GPUs.
A General Accounting tem US$ 300 milhões em chips SN50 da empresa em preparação e diz que a neocloud será a primeira a implantá-los.
Esses chips também ajudam a resolver o segundo grande problema que representam para a Computação Geral: eles são refrigerados a ar, e não a água, e consomem menos energia, para que possam ser instalados em instalações de data center existentes sem investir em nova infraestrutura.
Puklowski está buscando coinvestimento – acordos em que a Controladoria Geral instala seu próprio hardware nas instalações de outra pessoa – não apenas com fornecedores de data centers, mas também com mineradores de criptomoedas que buscam refinanciar sua infraestrutura, já que o custo de produção de bitcoin muitas vezes excede seu preço.
A General Accounting lançou sua oferta de nuvem na semana passada, alegando que já é o MiniMax 2.7 de execução mais rápida, um poderoso LLM de código aberto.
Joe Hasselmann é um investidor de risco que participou do boom resultante com Groq em 2021. Este ano, um novo fundo, Evercrest Capital Partners, concentra-se no espaço de IA e investiu sua primeira computação geral. Hassleman vê a parceria da SambaNova com a General Computing como um relacionamento paralelo com o Coreweave da Nvidia – e o emparelhamento da Groq com a oferta de nuvem da primeira.
“Precisamos de um mix saudável de clientes que coloquem chips em seus ambientes e que tenham o maior crescimento para eles”, disse Hassleman. “Quanto General Computing” aposta na SambaNova, SambaNova aposta na General Computing.”
A questão é que tipo de arquitetura de computador ocupará o lugar de maior destaque na IA no futuro. As consequências da nuvem são apostas complexas num mundo de múltiplos modelos e agentes, dos quais nenhum fornecedor domina e a velocidade e o custo das consequências tornam-se as principais variáveis competitivas. Considere os US$ 113 milhões da Série B arrecadados para o OpenRouter esta semana, considerando a capacidade do grupo de fornecer aos clientes acesso a vários modelos para otimizar o gasto de sinal.
A velocidade é importante em cálculo, preço e habilidade. Puklowski quer transformar tarefas de horas para agentes de codificação em tarefas de cinco ou dez minutos e tornar mais econômicos os agentes de áudio para agentes de serviço, que exigem uma sequência mais rápida para se comunicar de forma eficaz.
“Se você estiver usando o ChatGPT e ele fornecer 50 caracteres por segundo, ainda será muito mais rápido do que podemos ler”, disse Puklowski ao TechCrunch.
Quando você compra através dos links de nossos artigos, podemos ganhar uma pequena comissão. Isto não afeta a nossa independência editorial.



