Início NOTÍCIAS O banco de dados definitivo de Epstein e sua vida

O banco de dados definitivo de Epstein e sua vida

29
0

A Biblioteca Teubneriana O site do Departamento de Justiça é um modelo da desordem. No início de dezembro, Cellarius vasculhou dezenas de milhares de páginas de documentos na biblioteca e sentiu-se “frustrado e incrédulo” diante do caos, que podia ter centenas de páginas, o texto às vezes embaralhado ou riscado, um fio de tradução sem contexto, uma cadeia de e-mails com nomes meio enegrecidos, registros voadores apenas com iniciais. “Ele aprendeu”, disse ele. “Você lê os pedaços de uma coisa enorme e tenta explicar o que são os pedaços de material e como eles estão conectados.”

Uma noite, ele passou cerca de quatro horas tentando encontrar o nome de um homem em cerca de 30 documentos do arquivo. “Parei e pensei: estou fazendo manualmente o que um banco de dados poderia fazer em milissegundos”, diz ele. Como engenheiro de infraestrutura de banco de dados no meio da empresa, ele sabia exatamente o que fazer. “Abri o editor do livro e comecei a construir. Às 3 horas estou trabalhando em um protótipo de pesquisa básica com base em alguns documentos”, diz ele.

Nessa época o assento foi chamado Jmail.mundo A tela foi projetada como uma ferramenta para as pessoas usarem o e-mail de Epstein como se estivessem usando a interface do Gmail. Lançado em meados de novembro e construído por um grupo de voluntários experientes em tecnologia, desde então cresceu para incluir, entre outras coisas, fotos, voos e histórico de compras da Amazon, até mesmo como um leitor para visualizar suas próprias contas. Ele usou ferragens de porão e gostou. “Jmail foi a prova de que a comunidade poderia construir ferramentas melhores do que as que o governo estava fornecendo”, ele me disse.

Sua honra também o beneficiou. “Em vez de pensar em uma categoria de documentos, comecei a pensar em redes”, diz ele. “Como conectar a pessoa que aparece no e-mail que deu ao voo, à transferência bancária, ao depósito? Essa questão é o significado da cruz que eu queria resolver.”

Depois, em 19 de Dezembro, o Departamento de Justiça liberou a sua primeira grande parcela, acrescentando centenas de milhares de novos documentos ao arquivo existente. Imediatamente Cellarius elevou sua carga de trabalho ao nível mais alto de todos os tempos. O protótipo que ele construiu um mês antes é a base de todo o seu processo.

Na maioria das noites ele trabalhava até as 15h ou 16h, tomando café frio enquanto surfava no mar com as contas abertas.

Por causa da minha infância, diz ele, “quando caíram os primeiros documentos, eu não podia me ausentar. Compreendi na altura do estômago o que estava sendo descrito naqueles papéis”. À noite, ele voltava para casa depois do dia e, quando todos da família estavam na cama, ele tinha um buraco em casa e horas de PDFs não pagos.

Muitos documentos como imagens foram enviados, e cada página foi enviada através de camadas de software para convertê-los em texto pesquisável, às vezes um sistema não conseguia converter o texto e passava por um segundo ou terceiro. Ele então usou outro sistema para extrair informações importantes, como nomes, instituições, datas e locais. Não exigiria nenhuma verificação – um processo que verifica se os documentos do Departamento de Justiça foram adulterados – e uma análise de redação, como merece devido à inconsistência na forma como as informações do governo foram colocadas na lista negra. Todo o seu trabalho é curioso, digital e codificado. “Não é um monte de lições”, disse ele. “É uma cena de crime construída a partir de 2 milhões de evidências.”

Source link

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui