Ética no Big Data: Vantagens e Riscos da Coleta de Dados em Grande Escala

Sabe aquela sensação de que alguém está observando tudo que você faz online? Mais cedo ou mais tarde, quem usa a internet passa por um momento desses. É aquele anúncio com um produto em que você mal tinha pensado; é o autocomplete do Google conhecendo você bem demais; é quando você vai numa loja e ela começa a aparecer nos seus anúncios online.

Ou é simplesmente uma impressão vaga de que alguém — ou alguma coisa — está seguindo você online.

Olhos virtuais

Essa sensação não é paranoia. Você realmente está sendo observado. Não por pessoas, mas por robôs — por centenas e milhares de micro-programas feitos com um só propósito: coletar, armazenar e analisar tudo o que você faz online.

Esses programas estão por toda a parte, e parecem bastante inofensivos à primeira vista. Muitas vezes, você mesmo “concordou” em ser seguido. É o que você faz ao dizer que aceita enviar dados para diagnósticos do software, quando consente com o uso de cookies em um site (“sei lá o que são cookies”) ou diz que leu e aceita os termos de uso de um aplicativo — que, obviamente, você não leu. Nem eu.

O que é Big Data?

Vivemos em um mundo de dados, algo que é evidente sobretudo na internet. Tudo o que fazemos online é registrado de alguma forma. E, com 5.6 bilhões de pessoas conectadas à internet e trilhões de interações ocorrendo todos os dias, formam-se montanhas de dados sobre todos os aspectos das nossas vidas.

Esses dados em enorme escala, coletados, processados e analisados por softwares cada vez mais avançados, formam aquilo a que chamamos Big Data.

Big Data é um fenômeno recente na história da humanidade, e oferece possibilidades incríveis de previsão de tendências e possibilidades, assim como a compreensão de causa e efeito em praticamente todos os ramos do conhecimento — de política a medicina.

data

No entanto, esse modelo de conhecimento depende da coleta de dados pessoais. Dados seus e de todo o mundo. 

Nome, telefone, localização, nomes dos pais, fotos, trabalho, restaurantes frequentados, preferências sexuais, hábitos de consumo, interesses, paixões, crushes, celebridades favoritas… essas são apenas algumas das inúmeras facetas de nossas vidas que provavelmente hesitaremos em revelar a um estranho. E, no entanto, revelamos tudo online.

Cresce a preocupação

Cada vez mais, as pessoas estão se dando conta da falta de privacidade da internet — e dos perigos que isso traz.

É o que indica, por exemplo, uma pesquisa de 2022 que mostra que 77% dos brasileiros já desinstalaram aplicativos por preocupações de privacidade. Ou outra segundo a qual mais de 60% dos estadunidenses não acredita ser possível evitar a coleta em massa de seus dados.

Essa preocupação é bem fundamentada, e é uma parte essencial da ética do Big Data.

A ética do Big Data

Todo novo processo tecnológico gera questões de uma natureza ética — questões que visam entender qual a melhor forma de prosseguir, quais os direitos das partes envolvidas, quais os riscos, quais os benefícios.

Algumas perguntas surgem naturalmente:

  • É possível coletar dados pessoais de forma a respeitar a privacidade dos indivíduos?
  • Deve-se coletar dados somente com o consentimento das pessoas envolvidas?
  • Como limitar o uso que pode ser feito desses dados?
  • Como impedir que atores maliciosos se aproveitem das capacidades sendo criadas?

Essas e outras questões têm vindo mais à tona nos últimos anos. Isso porque os riscos que o Big Data representa são reais, e já estão tendo um impacto significativo sobre indivíduos assim como sobre nossa sociedade como um todo.

Riscos do Big Data

Cada vez mais, empresas, marqueteiros e governos estão usando a coleta de dados em massa para entender e, em muitos casos, se aproveitar do comportamento de indivíduos. Algoritmos avançados são capazes de criar perfis das pessoas com base em seu comportamento online. Esses perfis incluem:

  • gênero
  • faixa etária
  • interesses
  • localização geográfica
  • momentos de maior atividade online
  • possíveis horários de trabalho

aposta ao vivo futebolEsses dados, por sua vez, podem ser usados para criar modelos de comportamento. Certas lojas empregam até mesmo algoritmos que mostram ao usuário diferentes preços de produtos com base no perfil criado para ele. Se o usuário estiver mais cansado, por exemplo, é mais provável que ele faça determinadas compras, mas não outras — e o algoritmo pode saber quando ele está mais cansado com base nos horários de maior atividade online dele.

Mas isso é só a ponta do icebergue. O Big Data levanta inúmeros outros problemas.

 

Privacidade

O direito à privacidade é um elemento fundamental da nossa liberdade como indivíduos. Tanto é que a Constituição Federal, no art. 5º, inciso X, deixa bem claro: “são invioláveis a intimidade, a vida privada, a honra e a imagem das pessoas”.

O Big Data cria um grande dilema de privacidade, dado que é difícil controlar quem terá acesso aos perfis de comportamento de usuários. Mesmo que estes sejam gerados automaticamente, mantidos longe dos olhos de pessoas reais e protegidos com criptografia, o risco de um vazamento ainda significa que não há proteção real para esses dados, uma vez que foram coletados.

Foi esse o caso do Twitter, que recentemente sofreu o vazamento de dados de mais de 200 milhões de contas de usuários.

Posse

Posse

Quem realmente tem a posse dos dados coletados? Se uma empresa, digamos, faz uso de dados em massa, ela está agindo como se fosse proprietária desses dados. Mas proprietários não são as pessoas que originaram os dados? E se são, então como a empresa tem direito a usar essa informação para fins comerciais?

Consentimento

Essas perguntas nos levam à questão do consentimento — isto é, de que o usuário deve anuir com o uso de seus dados pessoais.

Aqui, surgem várias questões adicionais. Se alguém clica a caixa dizendo “Li e concordo com os Termos e Condições”, é possível considerar isso como verdadeiro consentimento? (Mais de 90% das pessoas não leem os termos e condições.) E se a pessoa ignora para que fins seus dados podem acabar sendo usados?

Viés dos algoritmos

Para ser bom, um algoritmo depende daquilo em que se baseia. Se um algoritmo de Big Data se baseia em dados enviesados, os resultados serão enviesados.

Isso é o que já aconteceu, por exemplo, em algoritmos de predição de tendências criminosas nos EUA. Os algoritmos mostraram resultados racistas — porque os dados em que se baseavam eram gerados no contexto de um racismo mais ou menos sistêmico na sociedade americana.

Poder desigual

Tanto mais agora, com a capacidade crescente dos algoritmos de Big Data que cada vez mais se fazem sentir em inúmeras indústrias, surge uma questão de poder: a sociedade passa a ser dividida também entre quem tem acesso ao Big Data e quem não, criando condições para a exploração de uns por outros.

Imprevisibilidade

A aceleração em certos campos como a inteligência artificial traz preocupações de que o Big Data possa vir a ser usado para fins dos quais ainda nem desconfiamos — os famosos “desconhecidos desconhecidos”, coisas que nem sabemos que não sabemos. 

A reação

Em parte como reação à falta de escrúpulos das grandes corporações, várias medidas têm sido tomadas para minimizar os riscos no processamento de dados pessoais. Entre elas, muitas empresas têm adotado práticas de proteção de dados mais rigorosas — é o caso da criptografia ponta a ponta utilizada, por exemplo, pelo WhatsApp.

No entanto, essas medidas por si só são marginais e insuficientes. Há poucas garantias de que mega-empresas como Meta, Apple e Alphabet (dona do Google) terão uma atitude pura e desinteressada em relação aos nossos dados.

Novos desafios legais

Diversas legislações têm sido desenvolvidas para lidar com os desafios do Big Data. Tal foi o caso, no Brasil, do Marco Civil da Internet de 2014, o qual estabelece os direitos e deveres que acompanham o uso da internet. 

Mais recentemente, em 2018, passou a vigorar a GDPR (Regulamento Geral de Proteção de Dados) na Europa e, no Brasil, a LGPD (Lei Geral de Proteção de Dados Pessoais). Essas leis estabelecem direitos como, entre outros:

  • o direito de ser informado do tratamento de seus dados
  • o direito de acesso aos seus dados
  • o direito de retificar ou solicitar exclusão dos seus dados

Essas e outras medidas legislativas têm ajudado a reduzir os desusos da coleta de dados em massa, mas ainda há muito trabalho pela frente.

O que o futuro trará?

É impossível prever todas as ramificações da onipresença do Big Data nas nossas vidas. Mas podemos e devemos fazer tudo que estiver ao nosso alcance para minimizar o impacto nocivo à nossa privacidade e à sociedade como um todo.

Acima de tudo, é importante que cada usuário da internet procure se educar e aprender como cuidar de seus dados pessoais, como se proteger e quais seus direitos face às empresas que coletam seus dados.

O futuro do Big Data pode trazer benefícios consideráveis à humanidade, mas cabe a nós garantir que os benefícios sejam maiores do que os riscos.