Neste ano, a Amazon abriu sua mercearia Amazon Go, em Seattle, nos EUA. O cliente transita pela loja, põe os produtos em sua sacola e vai embora. Um aplicativo baixado previamente no celular registra as compras e os pagamentos sem qualquer interferência humana. Não há atendentes nem caixas. Seu concorrente chinês, Alibaba, já tem 46 lojas semelhantes em 13 cidades da China e planeja inaugurar mais duas mil unidades nos próximos cinco anos.

Não se trata de um fato isolado. A participação de pesquisadores chineses nos principais congressos mundiais de inteligência artificial (IA) cresceu de 10% em 2012 para 23% em 2017, enquanto a dos americanos no mesmo período caiu de 41% para 34%. No topo das 12 empresas mais valorizadas do mundo, duas são chinesas, Tencent e Alibaba. Segundo a consultoria McKinsey, um em cada três “unicórnios” (startups com valor de mercado acima de US$ 1 bilhão) são chineses.

A tendência é a China assumir a liderança na pesquisa e na aplicação comercial de IA, consequência de vários fatores, dentre eles a ausência de proteção aos dados de seus cidadãos (acesso irrestrito pelo governo e pelo setor privado). Essa significativa vantagem, especialmente no domínio da personalização, é abordada no livro de Ajay Agrawal, Joshua Gans & Avi Goldfarb, Prediction Machines: The Simple Economics of Artificial Intelligence, recém-lançado (Harvard Business Review Press,  2018).

A restrição ao compartilhamento dos dados, seja pelas agências reguladoras seja pelas empresas privadas, compromete o avanço das tecnologias inteligentes e gera concentração de mercado; dois efeitos negativos no modelo econômico emergente.

O debate é oportuno: no mês passado, a Câmara de Deputados aprovou por unanimidade o marco regulatório sobre privacidade, em discussão desde 2012, e agora em votação no Senado. O modelo brasileiro assemelha-se ao Regulamento Geral de Proteção de Dados europeu (GDPR), que prevê o consentimento prévio do titular dos dados para sua coleta e tratamento.

O GDPR criou uma categoria especial para os “dados sensíveis” — origem racial, etnia, crenças religiosas e políticas, informações sobre saúde e vida sexual, dados genéticos e biométricos, dentre outros —, em princípio proibidos de serem processados, justamente os dados pessoais estratégicos para os algoritmos de IA.

O presidente francês, Emmanuel Macron, em entrevista à revista Wired, se comprometeu a abrir os dados do governo e incentivar o setor privado a torná-los públicos e transparentes, mas reconheceu o potencial das questões éticas e políticas envolvidas de “desmantelar totalmente a nossa coesão nacional e a maneira como vivemos juntos”.

Ele dá as boas-vindas ao Google e ao Facebook, dentre outras gigantes de tecnologia, contanto que se adequem às regras de privacidade da França. Contudo, quais são essas regras? Trata- se da abertura dos dados como defende o presidente, ou da proteção a privacidade segundo o GDPR, em vigência desde 25 de maio para toda a Europa?

Considerado o mais completo arcabouço de proteção à privacidade e aos dados pessoais, algumas de suas cláusulas não só conflitam com a ideia de Macron como limitam o progresso da IA: as aplicações bem-sucedidas desde 2006-2010 são baseadas no processo de aprendizado profundo (“deep learning”) em que as máquinas aprendem com os dados, a partir de instruções determinadas por algoritmos.

Quando digitamos uma consulta ao Google, são os algoritmos de IA que selecionam a resposta personalizada e os anúncios apropriados ao perfil do usuário, bem como traduzem um texto de outro idioma, assim como filtram os emails não solicitados (spam).

O sucesso da Netflix depende de seus algoritmos de IA: o sistema de recomendação de filmes, além de fidelizar os clientes, expande a demanda para filmes da “cauda longa” que custam menos do que os blockbusters. A Netflix pode ter cem mil títulos em estoque, mas se os clientes não souberem como encontrar suas preferências, o padrão será escolher os hits que não são cobertos pelo valor da assinatura.

A IA está igualmente no modelo de recomendação de livros da Amazon, neste caso privilegiando os best-sellers para facilitar a logística. A seleção de músicas do Spotify é também processada por IA, assim como o Waze, as respostas dos assistentes pessoais (Siri, Google Now), a seleção do que será publicado no feed de notícias do Facebook, o reconhecimento de fotos nas redes sociais.

A inteligência artificial está nos diagnósticos médicos, nos videogames, nos sistemas de vigilância e segurança, e mais em um conjunto de benesses que, efetivamente, têm o potencial de facilitar a vida do século XXI.

O marketing e a propaganda usam IA para identificar os hábitos e as preferências dos consumidores e produzir campanhas e vendas mais assertivas e segmentadas. Os algoritmos de IA estão presentes na análise de crédito para empréstimos bancários, bem como nas decisões de investimento, na seleção e recrutamento de RH e na gestão dos funcionários, via controles sofisticados denominados pela The Economist de taylorismo digital.

A indústria 4.0 é, em parte, automação e customização a partir de internet das coisas, big data e segurança dos sistemas de informação, inteligência artificial. Calcula-se que desde 2010, a IA cresceu a uma taxa anual de aproximadamente 60%.

Os algoritmos de IA, que também compõem música, dirigem carros, escrevem artigos, pintam quadros, são conjuntos de instruções matemáticas para identificar padrões que permitam estabelecer conexões. São métodos de previsão segundo correlações fundadas em uma base imensa de dados. Cada vez que acessamos o Google, por exemplo, geramos dois efeitos: a resposta à pesquisa e o treinamento dos algoritmos (quanto maior a base de dados, melhor a performance dos algoritmos). Por isso, restringir o acesso aos dados compromete o pleno funcionamento e, consequentemente, o avanço desses sistemas.

As grandes empresas de tecnologia — Facebook, Amazon, Apple, Netflix e Google —, são a parte mais visível da economia de dados, mas não a única. A queda de receita na função “voz” pressiona as empresas de telecomunicações na busca por produtos alternativos e, aparentemente, a inovação disruptiva está no uso dos dados de seus usuários, particularmente da telefonia móvel.

A operadora espanhola Telefonica, em 2012, criou uma empresa separada — Telefonica Digital Insights — para comercializar dados anônimos e agregados de localização de assinantes para varejistas e outros.

As instituições financeiras, talvez o setor com mais acesso a dados privados, ainda não exploram plenamente os dados de seus clientes. “Embora, em teoria, os bancos devam se sentir muito à vontade trabalhando com muitos dados, porque eles coletam e operam uma grande e detalhada variedade de dados financeiros de seus clientes há muitas décadas, eles ainda não fizeram muito com os dados que possuem. Neste contexto, eles são ricos em dados, mas pobres em insights”, afirmam Viktor Mayer-Schönberger e Thomas Ramge, autores do livro Reinventing Capitalism in the Age of Big Data, lançado neste ano.

Leia mais:  Parceria para Governo Aberto busca melhorar ações governamentais

Uma divisão do cartão de crédito Mastercard — Mastercar Advisors — agrega e analisa cerca de 65 bilhões de transações de 1,5 bilhões de titulares de cartão em 210 países, procurando identificar tendências de negócios e consumo para, em seguida, comercializar a informação a terceiros. Há cerca de três anos, um executivo da matriz do Mastercard abriu uma palestra em São Paulo declarando: “Não somos mais uma empresa financeira, somos uma empresa de dados”.

Calcula-se que a cada dois anos dobre a produção de dados no mundo. Os dados vêm dos “rastros” deixados de toda e qualquer interação digital, alguns voluntários como as publicações nas redes sociais — Facebook, Twitter e Instagram —, e outros involuntários, como na compra com cartão de crédito, na movimentação bancária on-line, no acesso aos programas de fidelidade, no vale-transporte, nas comunicações por telefonia móvel, e inúmeras outras ações presentes em nossa rotina.

O uso pode ser primário, derivado de dados coletados nas fontes primárias, dados coletados na origem, ou secundário (reuso), que são os dados adquiridos por terceiros. Há, ainda, a combinação e correlação de dados originados em distintas fontes, que geram novos dados privados.

“O entusiasmo pela internet das coisas — incorporando chips, sensores e módulos de comunicação aos objetos do cotidiano — é, em parte, relacionado à rede, mas também sobre digitalizar à informação de tudo que nos rodeia”, advertem Schonberger e Kenneth Cukier, no livro Big Data: a Revolution that Will Transform How We Live, Work, and Think. Ou seja, transformar em dados digitais.

Pedro Domingos, autor de O Algoritmo Mestre, pondera que com o crescimento exponencial dos dados os programadores não darão mais conta. A Amazon, por exemplo, não pode codificar as preferências de todos os seus clientes em um programa de computador, assim como o Facebook não sabe como escrever um programa que determinará as melhores atualizações do feed de notícias de seus usuários. O Walmart vende milhões de produtos e tem bilhões de opções para processar todos os dias.

Segundo Domingos, o que essas empresas fazem é deixar os algoritmos de aprendizado interagirem com a grande base de dados que acumulam para discernir o que os clientes querem. “O big data colocou o aprendizado de máquinas no centro do futuro da economia global. Hoje, parece não haver uma área de esforço humano intocado por ele, incluindo candidatos aparentemente improváveis como música, esportes e degustação de vinhos”, afirma Domingos.

Schonberger e Ramge cunharam a expressão capitalismo de dados, ressaltando a transição em curso do capitalismo financeiro para o capitalismo de dados. Para os autores, os dados estão substituindo o preço como elemento estrutural da relação produtor e consumidor, e a moeda como meio de pagamento.

Os dados são o que os economistas chamam de “bem não rival”; os mesmos dados podem ser utilizados por múltiplos agentes, o que se constitui numa vantagem sobre a moeda.

Hoje, já pagamos vários serviços com dados (Google, Facebook, Waze e outros). Em breve, essa prerrogativa deve se estender às anuidades dos cartões de crédito, às taxas bancárias e aos custos da telefonia, setores que concentram grandes volumes de dados. Não é suficiente, no entanto, a disponibilidade dos dados brutos. É necessário extrair as informações por meio de um processo de correspondência que seja inteligente o suficiente para levar em conta as múltiplas dimensões de preferências e seu peso relativo, viabilizado pelas tecnologias de inteligência artificial.

As restrições ao livre compartilhamento de dados, além de comprometer a evolução das tecnologias inteligentes, gera concentração de mercado. Google centraliza cerca de quatro de cinco solicitações de pesquisa originadas em desktop e nove de dez solicitações originadas de dispositivos móveis — e seu similar Baidu têm 60% do mercado chinês de busca. Amazon tem mais de 40% das receitas de varejo on-line nos Estados Unidos. Facebook tem 2 bilhões de usuários no mundo, e a chinesa Tencent, proprietária do aplicativo WeChat, serviço de pagamento on-line e troca de mensagens instantânea, é a primeira empresa chinesa a superar os US$ 500 bilhões em valor de mercado. Alibaba tem cerca de 51,3% de participação de mercado na China; seu principal concorrente, Jingdong, tem 32,9%.

Os nichos menores reproduzem padrão similar: o GoDaddy, maior registrador de nomes de domínio da internet, é quatro vezes maior do que seu concorrente, o WordPress, que domina os registros de blog. O Netflix governa streaming de filmes, o Instagram tem mais de 500 milhões de usuários ativos por dia, contra 173 milhões de seu principal concorrente, Snapchat. Facebook e Google detêm mais de 60% do mercado de anúncios online (Fonte: McKinsey).

Essa concentração extraordinária deriva de três efeitos: escala, que reduz os custos operacionais; rede, ou “externalidade da rede”, que expande a adesão (quanto maior o número de usuários maior as novas adesões); e feedback contínuo, que aprimora o produto gerando ganhos de eficiência.

Estabelece-se um círculo virtuoso: mais clientes significa mais dados, mais dados significa melhores previsões, melhores previsões significa mais clientes. Não resolve apenas abrir os algoritmos, que são instruções matemáticas que podem até ser deduzidas por terceiros; a matéria-prima fundamental são os dados, por isso a importância de compartilhá-los.

A vantagem comparativa das gigantes de tecnologia está na posse e controle dos dados (aparentemente, o “blockchain” é a única ameaça ao poder das grandes empresas de tecnologia ao permitir que serviços on-line deixem de ser controlados por uma “autoridade central”; existem já aplicativos alternativos a Amazon — OpenBazaar —, ao Facebook — Steemit — e outros baseados nessa arquitetura descentralizada).

Cada um de nós é, simultaneamente, um gerador e um consumidor de dados. Queremos ter produtos e serviços personalizados, almejamos que nossas necessidades sejam compreendidas e nossos interesses sejam previstos. O paradoxo é que, ao mesmo tempo, queremos preservar o controle sobre os dados pessoais. O dilema dos governos, e da sociedade, é como balancear a proteção à privacidade dos dados com o desenvolvimento das tecnologias inteligentes e evitar a concentração de mercado. O desafio é encontrar o ponto de equilíbrio dessa equação. Talvez a resposta esteja na transparência do uso dos dados, e não na privacidade deles.

Pesquisadora em inteligência artificial do Instituto de Estudos Avançados da Universidade de São Paulo (IEA/USP).