Depois de cerca de uma década em desenvolvimento, os novos assistentes de voz da Amazon e do Google finalmente chegaram e, embora muita coisa tenha mudado desde que foram lançados, o novo chefe, por assim dizer, se sente igual ao antigo chefe, um pouco difícil de ouvir.
Esta semana, a Amazon lançou o Alexa +, o sucessor da empresa com chatbot do antigo Alexa normal. Dessa forma, todos com alto-falantes Echo compatíveis podem mudar para o novo assistente de voz da Amazon, que agora vem com um modelo de linguagem grande (LLM) semelhante ao que usa ChatGPT da OpenAI. Já se passou um longo caminho desde que o acesso antecipado durou cerca de um ano, o que você pensaria que ajudaria a melhorar os resultados finais, mas até agora as reações têm sido… desanimadoras.
Comentários no Reddit abundam as reclamações sobre tempos de resposta lentos; precisão abaixo da médiae desapontamento com um usuário comum. Em outras palavras, as mesmas reclamações que atacaram abertamente os deputados diante da grande peneira geradora de IA. Embora eu não tenha tido a chance de finalmente experimentar o Alexa +, os técnicos parecem estar no mesmo nível de nós Beira Eu dei uma volta e não era tão grande.
Por mais desanimador que seja, Alexa + e seu anticlímax não são a exceção – parece ser a regra. O Google também desenvolveu recentemente um novo assistente de voz com IA e o evento também está sob ataque. Estou usando o Gemini for Home (assistente de voz de última geração do Google) há alguns meses e posso atestar a falta de entusiasmo coletivo.
Embora Gemini for Home possa ter uma voz e uma maneira de falar mais sonoras, o resultado é quase o mesmo e às vezes pior do que antes. Um problema notável é que o Gemini for Home demora um pouco mais para processar comandos do que a versão anterior. Em geral, tudo bem se fosse mais preciso e melhor fazer o que você quer, mas, na minha experiência, nem sempre é esse o caso. Assim como Alexa +, o Gemini for Home às vezes fica confuso, pensa ou simplesmente não entende o que você deseja – todos os principais problemas das versões anteriores de assistentes de voz.
Eles são alguns vantagens, como dizer ao Gemini para ser capaz de fazer muito pelo Home em um comando, mas estaria mentindo se dissesse que essas vantagens mudaram materialmente a experiência de casa inteligente/assistente de voz que o Google acaba de anunciar.
O que estou tentando dizer agora é que os assistentes de voz próximos à geração sentem alguma coisa. Digo “já” porque sempre há espaço para melhorias – talvez um avanço tecnológico traga uma maneira totalmente nova de emparelhar assistentes de voz e LLMs, finalmente fazendo com que pareçam uma atualização fundamental. Quem sabe? Se eu disser que estou optimista quanto a esta esperança, posso estar a mentir. Uma coisa que afeta minha confiança é o único assistente de voz importante que não mencionei até agora: o Siri.
Se há algo claro sobre a IA da Siri é que fazer todas as coisas da Apple tem sido mais difícil do que a empresa esperava. Embora o novo Siri tenha sido anunciado em 2024, a Apple ainda não desenvolveu todos os recursos de seu assistente de voz, devido a preocupações com o atraso no desempenho e na prontidão para implantar o serviço em grande escala. Finalmente, a Apple poderá em breve se juntar às equipes Alexa+ e Gemini – o poder desta fonte – mas por enquanto é importante notar que toda essa coisa de assistente de voz é muito mais difícil do que parece. Mesmo que aconteça pela primeira vez, é significativo Gêmeos Isso ajudará a impulsionar o novo assistente de voz graças a um acordo firmado entre Google e Apple em janeiro.
E até que alguém decifre o código, ficamos com assistentes de voz com tecnologia LLM que se parecem muito com assistentes de voz não LLM, e isso me diz algo. não é o que Google, Amazon e Apple estão fazendo. É melhor vocês beberem chá quente com mel, pessoal, porque vocês podem chorar sem parar em seus alto-falantes inteligentes em um futuro próximo.



