Início APOSTAS Devemos salvar a Internet pré-IA antes que ela seja contaminada?

Devemos salvar a Internet pré-IA antes que ela seja contaminada?

15
0

A Wikipedia já está mostrando sinais de contribuição massiva de IA

Serene Lee/Imagens SOPA/LightRocket, Getty Images

A ascensão dos chatbots de IA marca uma conjuntura histórica em que já não se pode confiar totalmente que o conteúdo online foi criado por humanos, mas como é que as pessoas olharão para trás e para esta mudança? Enquanto alguns se apressaram a arquivar dados “imaculados” da era pré-IA, outros dizem que é o resultado da própria IA que precisa de ser registado para que futuros historiadores possam estudar como os chatbots evoluíram.

Calça Rajivempresário e ex-diretor de tecnologia de ambas as empresas. tempos de Nova York e jornal de Wall StreetEle diz acreditar que a IA representa um risco para informações como artigos de notícias que fazem parte do registro histórico. “Desde o lançamento do ChatGPT, venho pensando nessa questão da ‘arqueologia digital’, e sua urgência cresce a cada mês”, diz Pant. “Atualmente, não existe uma forma fiável de distinguir entre conteúdo criado por seres humanos e conteúdo gerado por IA em grande escala. Este não é apenas um problema académico, tem implicações para tudo, desde o jornalismo até à descoberta jurídica e à investigação científica.”

para John Graham-Cumming A empresa de segurança cibernética Cloudflare afirma que as informações geradas antes do lançamento do ChatGPT no final de 2022 são semelhantes ao aço de baixo histórico. O metal foi fundido antes do teste da bomba nuclear Trinity, em 16 de julho de 1945, e é apreciado para uso em equipamentos científicos e médicos sensíveis porque não contém a leve contaminação radioativa da era nuclear que causa ruído nas leituras.

Graham Cumming criou um site chamado. lowbackgroundsteel.ai Isto é para arquivar fontes de dados que não estão contaminadas pela IA, como o download completo da Wikipédia de agosto de 2022. A pesquisa já mostrou que a Wikipédia de hoje mostra sinais de entrada massiva de IA.

“Houve um tempo em que fazíamos tudo sozinhos, mas em algum momento isso começou a ser realmente aprimorado pelos sistemas de chat”, diz ele. “Então pensamos: você pode ver isso como contaminação ou como algum tipo de armazenamento. Humanidade, chegamos até aqui e, a partir deste ponto, temos ajuda adicional.”

Marcos Graham Ele dirige a Wayback Machine no Internet Archive, um projeto que arquiva a Internet pública desde 1996, mas diz estar cético quanto à eficácia de novos esforços para arquivar dados, dado que o Internet Archive armazena até 160 terabytes de novas informações todos os dias.

Em vez de preservar a Internet pré-IA, Graham quer começar a criar um arquivo de resultados de IA para futuros investigadores e historiadores. Ele planeja começar a fazer ao chatbot 1.000 perguntas por dia e armazenar suas respostas. E é uma tarefa de tão grande escala que ele até usará a IA para realizá-la: para a curiosidade da humanidade futura, a IA registrará as mudanças nos resultados da IA.

“Faça perguntas específicas e você obterá respostas”, diz Graham. “E se você fizer a mesma pergunta amanhã, provavelmente obterá uma resposta um pouco diferente.”

Graham-Cumming foi rápido em apontar que não é anti-IA e que a preservação da informação gerada pelo homem poderia, na verdade, beneficiar os modelos de IA. Isso ocorre porque os resultados de IA de baixa qualidade que são realimentados no treinamento de um novo modelo podem ter efeitos negativos e causar o chamado “colapso do modelo”. Evitar isso é um esforço que vale a pena, diz ele.

“Em algum momento, uma dessas IAs vai pensar algo que nós, humanos, nunca pensamos antes. Vai provar um teorema matemático, vai fazer algo muito novo. E não sei se devemos chamar isso de poluição”, diz Graham-Cumming.

tópico:

Source link

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui