Início ESTATÍSTICAS The Atlantic cria um banco de dados de música pesquisável para treinar...

The Atlantic cria um banco de dados de música pesquisável para treinar inteligência artificial

14
0

atlântico O jornalista Alex Resner descobriu recentemente quatro conjuntos de dados A música é usada para treinar modelos de IA e criá-los Totalmente pesquisável para o público. Duas das coleções são absolutamente enormes, com 12 milhões e 9 milhões de faixas respectivamente. Os outros dois são muito menores, mas ainda representam grandes quantidades de dados de treinamento, com mais de 100 mil músicas cada.

Segundo Reisner os trajes foram baixados milhares de vezes e embora seja impossível saber exatamente quem os utiliza Google e Estabilizar Ambos confirmaram isso em artigos de pesquisa. Algumas fontes, por ex. arquivos de música gratuitos O conjunto de dados é gratuito para uso pessoal, mas é necessária uma licença de aplicação comercial.

Embora esses conjuntos de dados estejam teoricamente disponíveis gratuitamente na Internet, usá-los como dados de treinamento não é tão simples quanto baixar um arquivo ZIP e inseri-lo em um modelo de IA. Como explica Reisner:

Os três conjuntos de dados que encontrei são distribuídos como listas vinculadas de músicas no YouTube ou Spotify. Os desenvolvedores de IA baixam o áudio real usando ferramentas que automatizam o trabalho, algumas das quais permitem que os desenvolvedores ignorem logins, anúncios e mecanismos que podem render dinheiro aos criadores ou assinantes. Essas ferramentas violam os termos de serviço dessas plataformas.

Source link

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui