#Dobras 25 // Um ano do escândalo Cambridge Analytica: retrospectiva e o que mudou
29 de março de 2019
Por Lori Regattieri*
Há um ano atrás a repórter Carole Cadwalladr publicou no Observer, a primeira de uma série de reportagens conhecida como “Cambridge Analytica Files”. Como sabemos, a empresa de análise de dados operou nas campanhas do Brexit e Trump. Diferente de empresas comuns de marketing político, a CA chegava com uma promessa para os seus contratantes: podemos analisar e minerar dados de eleitores e consumidores utilizando bancos de dados heterogêneos para que você possa executar uma comunicação estratégica. Quem já trabalhou com marketing político sabe que esse ambiente é cheio de desconfiança, os marketeiros políticos sempre foram reconhecidamente os “gênios” das campanhas eleitorais. Não dessa vez. Os grupos focais, a expertise dos redatores de mensagens, a mobilização política e as super ideias dos marqueteiros ficaram no segundo plano. No centro da campanha política estavam modelos matemáticos para elaboração de propagandas. São técnicas de modelagem de dados, mineração massiva de informação, cruzamento de banco de dados e categorias psicológicas. Uma combinação de tecnologias foi utilizada para compreender o comportamento das pessoas online e testar mensagens de estímulo aos eleitores dos mais diferentes perfis. O objetivo final de quem comprou os serviços e produtos da CA era a conversão do voto do eleitor ou a assimilação da mensagem política.
Só que há um grande porém aqui: como a CA conseguia esses dados que analisava? Outra figura central nessa história é o whistleblower Christopher Wylie, o ex-cientista de dados da CA que revelou como a empresa havia explorado dados do Facebook coletados de milhões de pessoas em todo o mundo para identificar e direcionar os usuários com mensagens políticas e desinformação. E tudo, é claro, sem o conhecimento ou consentimento dos usuários do Facebook.
A CA era em parte de propriedade da família de Robert Mercer. A família do bilionário gerencia fundos de investimento e são conhecidos por apoiar causas conservadoras. Christopher Wylie afirma que conheceu Steve Bannon, ex-conselheiro de Donald Trump e Rebekah Mercer, filha de Robert Mercer. Uma curiosidade é que Robert Mercer era um programador da IBM e enriqueceu com os algoritmos. Temos assim um cenário de oportunidades de negócios para todos os envolvidos, Mercer entrava como financiador, Bannon entrava como o idealizador. Bannon já mantinha o site de extrema direita Breitbart News, reconhecidamente responsável pela propagação de notícias falsas e conspirações. Assim. o ambiente para a futura e bem sucedida campanha política de Trump ia se desenhando com todos os atores: investidores, estrategistas e tecnólogos.
Tudo isso começou ainda em abril de 2010, quando o Facebook lança uma plataforma para aplicativos de terceiros chamada Open-Graph. Esta atualização permitiu que desenvolvedores externos entrassem em contato com usuários do Facebook e solicitassem permissão para acessar uma grande parte de seus dados pessoais – e, crucialmente, acessassem os dados pessoais de seus amigos do Facebook também. Veja só, isso não foi uma falha no sistema do Facebook. A plataforma Open Graph foi desenhada exatamente para isso, em tradução livre “grafos abertos”: quando um usuário do Facebook aceita os termos e utiliza aplicativos de terceiros, eles acessam o nome, sexo, local, aniversário, educação, preferências políticas, status de relacionamento, religião, status do bate-papo on-line e muito mais. Toda ideia nesse API é a abertura para a rede do usuário. Imagine que o usuário possuí atributos, como se fossem propriedades, certo? Qualquer usuário “carrega” essas conexões que contém essas propriedades, essa API abria o acesso para aplicativos de terceiros explorarem essas propriedades. A API permitia que os desenvolvedores pesquisassem no Facebook informações sobre usuários e objetos. Extremamente fácil de implementar, os dados do usuário eram armazenados em URLs de fácil acesso, como por exemplo http://graph.facebook.com/samuelaxon/music ou http://graph.facebook.com/samuelaxon/movies e etc. Além disso, abria caminho para a rede de amigos de um usuário. Com algumas permissões a mais, esses aplicativos externos podem até acessar suas mensagens privadas. Vamos nos lembrar que o Facebook vende produtos, e do ponto de vista da empresa, essas eram apenas transações comerciais. Isso vai ser importante para entender o papel mediador do Facebook e como a empresa vem sendo inquirida pelo Parlamento Britânico e o Senado dos Estados Unidos.
Estamos em 2013, e o pesquisador da Universidade de Cambridge Aleksandr Kogan criou um aplicativo chamado “this is your digital life”. Essa é a sua vida digital. O objetivo do aplicativo era muito simples, as pessoas eram pagas cerca de U$ 1 ou U$2 para responder a um quiz psicológico. Ele ainda utilizou uma empresa chamada Global Science Research para poder contratar as pessoas para responder o teste no ambiente da Amazon Mechanical Turk. Foram cerca de 300 mil pessoas concordando com os termos do quiz, fornecendo informações pessoais e de maneira muito valiosa, liberando também o acesso do aplicativo aos dados dos seus amigos. Na época, Kogan disse ao Facebook e aos usuários que as informações seriam anonimizadas. Sabemos que isso não ocorreu.
Nesse período, Aleksandr Kogan conhece Alexander Nix (CEO da Cambridge Analytica) e vislumbra uma oportunidade de negócios. Kogan trabalhava no Centro de Psicometria de Cambridge, junto de outros psicólogos, David Stillwell e Thore Graepel e Michal Kosinski. As pesquisas nesse laboratório focam nas diferenças individuais em comportamento, preferências e desempenho. Especificamente, interessavam os mecanismos que vinculam traços psicológicos (como personalidade) a uma ampla gama de resultados organizacionais e sociais, incluindo desempenho no trabalho, adequação pessoa-trabalho, preferências do consumidor e ideologia, bem como a expressão e reconhecimento de traços psicológicos. Podemos incluir ainda características de resíduos comportamentais, linguagem e características faciais. As pesquisas são conduzidas usando uma variedade de métodos computacionais, incluindo aprendizado de máquina, mineração de dados e estudos observacionais envolvendo milhões de participantes. Assim, no início de 2014, o executivo-chefe da Cambridge Analytica, Alexander Nix, assinou um acordo com o pesquisador Aleksandr Kogan, para um empreendimento comercial privado. Entretanto, boa parte dos trabalhos do Centro de Psicometria eram liderados por Michal Kosinski.
As pesquisas e metodologias de Michal Kosinski inspiraram as aplicações do modelo de negócios da CA, mesmo que o pesquisador não tenha tido nenhuma conexão com os serviços que o seu colega de trabalho vendeu para a CA. Sabe-se que Kosinski e Kogan passaram por um processo de disputa sobre propriedade intelectual. Em uma das matérias do Cambridge Analytica Files, menciona-se que Kosinski reporta ao diretor do Centro de Psicometria da Universidade de Cambridge que Kogan estava trabalhando no projeto “durante seu horário de expediente, usando computadores e servidores da universidade, e o trabalho de seus estagiários e pós-docs”. Na mesma fonte, sabemos que inicialmente o plano de trabalho da Strategic Communication Laboratories (SCL) era configurar um contrato formal entre todos os pesquisadores, Aleksandr Kogan, David Stillwel e Michal Kosinski. Entretanto, Stillwel e Kosinski exigiram um pagamento de U$500 mil para continuar com o trabalho de metodologia de modelagem de dados. Com essa demanda, a SCL se desfaz da parceria com Stillwel e Kosinski, e o empreendimento continua apenas com Kogan.
No Google Scholar de Michal Kosinski, constam dezenas de artigos com foco na utilização de dados digitais para exploração de manifestações da personalidade do usuário e comportamento em redes sociais on-line, o mais conhecido é o o myPersonality project. No artigo “Who can wait for the future? A personality perspective” de 2014, entre outros autores temos Aleksandr Kogan. Neste estudo os autores tomam uma perspectiva de personalidade para entender quem tem mais ou menos probabilidade de agir impulsivamente, da sigla em inglês “delay discount” (DD). O “desconto por atraso” pode ser definido como o processo cognitivo que permite ao indivíduo comparar valores entre o consumo imediato e o atrasado de uma determinada mercadoria. Tal conceito desempenha um papel importante em estudos relacionados ao autocontrole e impulsividade na tomada de decisão [1]. O modelo dominante usado na pesquisa de personalidade é o modelo dos cinco fatores, o chamado ‘Big Five’ é composto pelos seguintes traços: (a) abertura para experimentar (artística versus conservadora), (b) conscienciosidade, (autocontrolado vs. descontraído), (c) extroversão (saída vs. reservado), (d) agradabilidade (compaixão versus antagonismo em pensamentos e sentimentos), e (e) neuroticismo (emocionalmente instável vs. estável). É evidente a importância das pesquisas em psicometria e neurociência nas operações da Cambridge Analytica. A empresa buscou explorar como os dados podem canalizar a partir de dados digitais online os traços de neurose e impulsividade dos usuários nas redes sociais. Em uma entrevista, Kosinski compara a campanha de Trump com a de Obama, tratando as metodologias utilizadas pelas equipes de ciência de dados de ambas as campanhas como se tivessem o mesmo efeito. O que não é verdade, pois a campanha de Obama não utilizou de dados privados dos usuários do Facebook para testes de psicometria e direcionamento de mensagens perfiladas. Temos um cenário de grave exposição dos parâmetros científicos e da produção de saber sobre o comportamento humano, nesse emaranhando de relações entre laboratórios e empresas, os limites éticos quanto ao comprometimento de nossas pesquisas estão sendo testados.
Já em 2014, o próprio Facebook resolveu experimentar com dados e modelos matemáticos de testes de comportamento. A empresa publicou um estudo utilizando dados de cerca de 700.000 usuários, a pesquisa tinha o objetivo de descobrir como estimular sensações de felicidade e tristeza de acordo com o que o Facebook mostrava no Feed dos usuários. Pesquisadores das mais diversas áreas reagiram mundialmente aos agravos dessa pesquisa, a opinião compartilhada na comunidade científica era que os limites éticos profissionais foram ultrapassados pelos pesquisadores do Facebook. Como de costume, a empresa tentou apagar o fogo com sua equipe de relações públicas, informaram que a pesquisa datava originalmente de 2012, quando a política de uso de dados continha uma cláusula de consentimento da utilização de dados para esse tipo de pesquisa. Pouco tempo depois, a Forbes informou que essa cláusula só teria sido adicionada meses depois do do estudo ter ocorrido. Com essa nova revelação, a empresa enfrenta dificuldades de relacionamento com os clientes por todos os lados. Temos os desenvolvedores de aplicativos de terceiros e o mercado de propaganda pressionando por melhores produtos de um lado, por outro temos os usuários cada vez mais preocupados com privacidade na medida em que estão mais conscientes sobre como a própria empresa e terceiros têm acesso quase irrestrito aos dados pessoais.
Em 2015, a plataforma Open Graph é completamente suspensa. Entretanto, aplicativos de terceiros que tiveram permissões ativas entre 2010 e 2015 não foram limitados retroativamente. Logo, isso significa que a Cambridge Analytica – entre outras empresas – conseguiu armazenar os dados de todos aqueles testes a qual submeteu usuários em 2013.
Em 2015, descobrimos por uma matéria do Guardian que a campanha presidencial do republicano Ted Cruz utilizou dados psicológicos de milhões de usuários do Facebook. Importante destacar que a essa altura ainda não sabíamos a extensão do problema, esse ainda não era o grande furo da repórter do Guardian Carole Cadwalladr. Depois de um pedido de informação do Guardian, o Facebook descobriu que Aleksandr Kogan (aquele mesmo da Global Science Research e pesquisador do Centro de Psicometria de Cambridge) vendeu o conjunto de dados dos usuários que adquiriu através do aplicativo “This is your digital life” para uma empresa ainda desconhecida, a Strategic Communications Laboratories, que mais tarde se tornou Cambridge Analytica. Vale destacar que a CA participou de 44 campanhas políticas até o pedido de falência ocorrido em 2018.
O que o Facebook sabia até aqui ou o que o Facebook permitia ao público saber até aqui? Nesse momento, a empresa até verificou que a CA havia coletado dados dos usuários e seus amigos, mas não reconhecia publicamente o fato. Na época, o Facebook pressionou judicialmente a CA com o objetivo que a empresa de análise e operações de inteligência destruísse todos os dados coletados “indevidamente”. A CA entrega então um documento certificando ao Facebook que eles haviam apagado todos os dados. E é assim, como em um mundo feito de boa vontade, que a CA continuou operando dentro do Facebook. O que sabemos um ano depois através de uma matéria do Guardian, é que funcionários do Facebook estavam cientes das preocupações sobre a utilização de técnicas de coleta de dados impróprias pela Cambridge Analytica, meses antes da primeira reportagem do Guardian em dezembro de 2015. Essas informações apareceram em um processo judicial apresentado pelo procurador-geral de Washington DC e foram subsequentemente confirmadas pelo Facebook.
Em 2016, temos o grande momento da utilização dos serviços da CA, o uso de técnicas de modulação de mensagens para atingir o eleitorado dos chamados “swing states” é parte crucial da estratégia político-comunicacional que construiu a vitória de Donald Trump (R). Antes mesmo das eleições, investimentos massivos em publicidade, no desenvolvimento de técnicas apuradas de perfilamento, segmentação da audiência, assim os destinatários dos vídeos anti-Hillary tinham uma mensagem perfeita para seus anseios. A CA garantia acuracidade na entrega das mensagens e na segmentação da audiência, um cenário de marketing político viral nunca antes imaginado. Servidores trabalhando 24 horas e 7 dias por semana com acesso aos bancos de dados eleitorais, mas com a possibilidade cruzar com dados sensíveis coletados do Facebook. A partir do trabalho de cruzamento de dados, investimento em mineração e operacionalização de testes A/B para aplicação de uma comunicação política “inteligente”. Inspirados na pesquisa de Kosinski do Centro de Psicometria de Cambridge (atualmente professor na Escola de Negócios de Stanford), o algoritmo no coração das operações de inteligência explorou postagens, curtidas, informações confidenciais sobre orientação sexual, raça, gênero, mas vai além, vasculhando indícios dos rastros desse usuários que revela traumas, opiniões polêmicas, desejos escondidos, traços de personalidade indicando manias, vícios e vulnerabilidades. O que interessava aqui era evidentemente como todas essas variáveis poderiam ser úteis para identificar as preferências políticas e a conversão de votos para Trump.
No dia 17 de março de 2018, na primeira reportagem da série Cambridge Analytica Files, Carole Cadwalladr e Emma Graham-Harrison, reportam para o Guardian e o The New York Times que o Cambridge Analytica ainda possuía dados que coletaram de forma inadequada de cerca de 50 milhões de usuários do Facebook. Na premiada matéria, o whistleblower descreve como a empresa ligada ao ex-consultor de Trump, Steve Bannon, compilou dados de usuários para atingir os eleitores americanos. Christopher Wylie revelou como a Cambridge Analytica usou informações pessoais tomadas sem autorização no início de 2014 para construir um sistema que pudesse traçar o perfil de eleitores dos EUA, a fim de direcioná-los para anúncios políticos personalizados.
O escândalo de dados da Cambridge Analytica teve forte impacto midiático e político-institucional. Uma semana depois, o comissário britânico de informações obteve um mandado para entrar nos escritórios da Cambridge Analytica e confiscar seus servidores. Manchetes em todo o mundo. O preço das ações do Facebook caiu mais de US $ 50 bilhões. Em 2018, Mark Zuckerberg testemunhou em Wasghington, D.C. Desde então, o Facebook ainda tenta lidar com as consequências da utilização de dados sensíveis dos usuários por empresas de aplicativos de terceiros. As democracias ocidentais ainda não sabem lidar com as tecnologias operando com mineração de dados exercendo impacto significativo nos processos eleitorais. Os atores chave desse escândalo de privacidade seguem fazendo promessas vazias e os Estados tentam pressionar com audiências que garantem poucos efeitos práticos nas políticas de dados e privacidade das empresas.
Em abril, ficamos sabendo da (quase) totalidade do problema, o Facebook admitiu que não foram 50 milhões de usuários que tiveram seus perfis explorados, mas eram na verdade 87 milhões. Mark Zuckerberg foi levado para depor no congresso dos EUA. E em outubro, o Gabinete do Comissário de Informação multou o Facebook em sua pena máxima – £ 500.000 (contra o qual o Facebook segue apelando). De acordo com nova matéria do Guardian, é consenso entre especialistas em privacidade que o plano de mitigação que o Facebook apresentou para melhorar sua política de privacidade tem pouco a ver com proteção de dados dos usuários e tudo a ver com a proteção da participação no mercado.
Christopher Wylie, o informante da Cambridge Analytica, também testemunhou perante o comitê judiciário do Senado, Washington DC, em maio de 2018. O informante seguiu alegando que se preocupava com os dados que sua pesquisa utilizava na CA e não foi responsabilizado.Wylie hoje trabalha como cientista de dados na H&M.
Em 18 de maio de 2018, a CA registrou pedido de falência na Corte de Falências do Distrito Sul de Nova York, que foi assinado em nome do conselho de administração da Cambridge Analytica por Rebekah e Jennifer Mercer (filhas do bilionário Robert Mercer), encerrando assim suas operações tanto nos EUA quanto no Reino Unido. Depois da falência legal, a empresa se desmembrou em outras duas: a CA Political, responsável pela parte política, e a CA Comercial, responsável pela parte comercial. Não foi possível encontrar informações apuradas sobre a CA Political ou sobre CA Comercial. Segundo a BBC, antigos empregados da Cambridge Analytica fundaram nova empresa de consultoria, a AUSPEX. Não muito diferente da CA, a AUSPEX define-se como uma consultoria de comunicação orientada por dados que se concentra em campanhas políticas, sociais e de desenvolvimento que geram resultados positivos.
Steve Bannon foi desligado do cargo de consultor sênior do presidente Donald Trump em agosto de 2017. Bannon segue prestando consultorias para partidos populistas de extrema-direita pelo mundo. Como um dos idealizadores da campanha de Donald Trump que utilizou dos serviços da CA, ele também não foi responsabilizado.
Em junho de 2018, Aleksandr Kogan, o pesquisador responsável pelo aplicativo que ajudou a Cambridge Analytica a coletar informações pessoais de usuários do Facebook, testemunhou perante o Congresso dos Estados unidos. Da série Cambridge Analytica Files, foi reportado que Kogan realizava consultoria para firma de Moscou Lukoil e mantinha vínculos com a Universidade de São. Petersburgo. Kogan está processando o Facebook por difamação, pois a empresa alega que a violação de privacidade é de responsabilidade de Aleksandr Kogan.
O conselheiro especial, Robert S. Mueller III, realizou uma extensa investigação sobre os esforços russos para influenciar o resultado da corrida presidencial de 2016. No dia 22 de março de 2019, Mueller entregou o relatório sobre a investigação Trump-Rússia ao Procurador Geral dos Estados Unidos. A ex-funcionária da empresa de dados Cambridge Analytica foi questionada pela investigação do conselho especial sobre a conspiração com a Rússia. Caso o relatório de Mueller seja tornado público, não só poderemos saber a fundo como funcionou uma rede de cientistas de dados, psicólogos, estrategistas de comunicação política e empresários que alterou drasticamente o modo como vivemos a democracia e os processos eleitorais, como também poderemos explorar as metodologias utilizadas para modelar e maximizar a influência em rede.
Um ano depois, o escândalo da Cambridge Analytica expõe um fracasso institucional. O Parlamento Britânico concluiu em um relatório de fevereiro de 2019 que empresas como o Facebook se comportam como “gangsters digitais”, uma investigação de 18 meses do comitê especial Cultura digital e Mídia sobre desinformação e notícias falsas acusou o Facebook de obstruir propositalmente suas investigações e falhar em suas propostas de sanar quaisquer tentativas de terceiros para manipular processos eleitorais. Lembrando que a história desse escândalo começa com a API Open Graph, sigla para Interface de Programação para Aplicativos. Negócios e tecnologias seguem se misturando encontrando poucos entraves regulatórios institucionais. Empresas seguem criando APIs e outras empresas seguem criando aplicativos para acessar essa porta de entrada para dados privados e anônimos. Isso não significa estipular protocolos que cessem o desenvolvimento de tecnologias, aliás, pelo contrário. As tecnologias de código aberto sempre foram e seguem sendo um lugar de investimento quando o assunto são os avanços em inteligência artificial e aprendizado da máquina. Diferentemente de Kosinski, não concluo posicionando os algoritmos enquanto dispositivos indefesos, mas assimilando a urgência de pensar e tratar os algoritmos como agentes operando em sistemas complexos que demandam responsabilização, atenção e cuidado. Bruno Latour há algum tempo disse que devemos aprender a amar nossos monstros, pois devemos cuidar das nossas tecnologias do mesmo modo que cuidamos das nossas crianças. Já Clive Hamilton nos indica o caminho do meio de um engajamento prudente. Nem uma imprudência da soberba maestria, tampouco a ingenuidade. “Podemos rejeitar o desejo dos modernos de purificar e abraçar nossos envolvimentos, mas também podemos distinguir entre bons e maus híbridos.”
*Ao longo do texto, termos em destaque indicam links de referências das reportagens divulgadas sobre o tema, que colaboram para a compreensão do escândalo de uso de dados pessoais pela empresa Cambridge Analytica.
Referência:
[1] Matta, A; Gonçalves, F.; Bizarro, L. Delay discounting: concepts and measures. Psychol. Neurosci. vol.5 no.2 Rio de Janeiro July/Dec. 2012. Disponível em: http://www.scielo.br/scielo.php?script=sci_arttext&pid=S1983-32882012000200003