Início NOTÍCIAS O novo modelo de tradução ultrarrápido da Mistral dá aos grandes laboratórios...

O novo modelo de tradução ultrarrápido da Mistral dá aos grandes laboratórios de IA uma corrida pelo dinheiro

119
0

IA Mistral lançou uma nova família de modelos de IA que afirma abrirá o caminho para conversas contínuas entre pessoas que falam idiomas diferentes.

Na quarta-feira, o laboratório de IA com sede em Paris lançou dois novos modelos de fala para texto: Voxtral Mini V2 e Realtime Voxtral. O primeiro é projetado para transcrever arquivos de áudio em grandes lotes, o segundo para transcrição quase em tempo real, em 200 milissegundos; ambos podem ser traduzidos entre 13 idiomas. O Realtime Voxtral está disponível gratuitamente sob uma licença de código aberto.

Com quatro bilhões de parâmetros, os modelos são pequenos o suficiente para serem executados localmente em um telefone ou laptop, uma inovação na conversão de fala em texto, afirma Mistral, o que significa que conversas privadas não precisam ser enviadas para a nuvem. Segundo Mistral, os novos modelos são mais baratos de operar e menos sujeitos a erros do que as alternativas concorrentes.

A Mistral Realtime-Voxtral estabeleceu – embora o modelo produza texto, não fala – um passo marcante em direção a uma conversa fluente através da barreira linguística, o problema Lago e Google pagar na competição também. O modelo mais recente pode ser feito pelo Google transferência para o segundo atraso.

“O que estamos construindo é um sistema que pode ser interpretado como uma estrutura. Este modelo está basicamente lançando as bases para isso”, disse Peter Stock, vice-presidente de operações científicas da Mistral, em entrevista à WIRED. “Acho que esse problema será resolvido em 2026.”

Fundada em 2023 por estudantes da Meta e do Google DeepMind, a Mistral é uma das poucas empresas europeias baseadas em modelos de desenvolvimento de IA capaz de se aproximar dos líderes de mercado americanos – OpenAI, Anthropic e Google – em termos de capacidade.

Sem acesso ao mesmo nível de financiamento e computação, Mistral pretende desenvolver um modelo imaginativo e preciso da melhor forma possível de construir uma base de dados. O objetivo é traduzir pequenas melhorias em todos os aspectos do desenvolvimento do modelo em ganhos de desempenho tangíveis. “Francamente, isso torna muitas GPUs lentas”, afirma Stock.

Um ótimo exemplo da linguagem principal do Mistral (LLM) não corresponde aos modelos concorrentes desenvolvidos por concorrentes dos EUA para matérias-primas. Mas a empresa reduziu o mercado, estabelecendo um compromisso entre preço e desempenho. “Mistral oferece uma alternativa mais económica, onde os modelos não são tão bons, mas bons o suficiente, e podem ser partilhados abertamente”, afirma Annabelle Gawer, diretora do Centro para a Economia Digital da Universidade de Surrey. “Pode não ser um carro de Fórmula 1, mas é um carro familiar muito eficaz”.

Entretanto, enquanto os homólogos americanos investem artificialmente centenas de milhares de milhões de dólares na inteligência geral, Mistral queria trabalhar numa série de exemplos especializados – embora menos modestos –, como a conversão de fala em texto.

“A própria Mistral não se posiciona como um player de nicho, mas certamente é especializada na criação de modelos”, diz Gawer. “Como um jogador com recursos, você quer ter uma tecnologia geral muito poderosa. Você não quer desperdiçar seus recursos adequados aos idiomas e características de determinados partidos ou geografias. Você deixa esse tipo de negócio menos útil na mesa, o que cria espaço para jogadores intermediários.”

À medida que a relação entre os Estados Unidos e os seus aliados europeus mostrava sinais de decadência, Mistral inclinou-se cada vez mais para as suas raízes europeias. “Há uma tendência na Europa em que as empresas e os governos em particular estão a olhar com muito cuidado para a dependência de empresas de software e IA dos EUA”, afirma Dan Bieler, analista principal da empresa de consultoria de TI PAC.

Neste contexto, a Mistral posicionou-se como um par de mãos seguras: uma alternativa nativa europeia, multilingue e de código aberto aos modelos proprietários disponíveis nos EUA. “A questão sempre foi: como construir uma posição defensável num mercado que é esmagadoramente dominado por players americanos?” Raphaëlle D’Ornano, fundadora da consultoria técnica D’Ornano + Co. “O acesso da Mistral é tão longe quanto eles querem, cumprindo todas as regulamentações existentes na UE.”

Embora a lacuna de desempenho permaneça entre os pesos pesados ​​americanos, à medida que as empresas lutam com a necessidade de encontrar um retorno sobre o investimento em IA e de ter em conta o contexto geopolítico, os modelos mais pequenos estão a voltar-se para a indústria – e os requisitos específicos da localização terão o seu dia, prevê Bieler.

“Os LLMs são os gigantes dominantes do debate, mas não creio que existirão para sempre”, diz Bieler. “Modelos menores e mais focados regionalmente, uma tarefa de desenvolvimento muito maior”.

Source link