IA, pesquisa e direitos autorais: mineração de textos e dados em perspectiva

  • Categoria do post:JOTA

Os direitos autorais não são avessos às novas tecnologias. Sua história está intrinsecamente ligada ao desenvolvimento tecnológico. A cada etapa, são necessárias revisões, ajustes e adequações na organização e estrutura jurídica existentes, idealmente antecedidas de debates amplos e informados.

O mesmo ocorre com as tecnologias de inteligência artificial. E esta discussão, como está posta, afeta a pesquisa contemporânea como um todo, indistintamente, que é o foco desta breve análise.

Assine a newsletter Últimas Notícias do JOTA e receba as principais notícias jurídicas e políticas no seu email

Neste contexto, entendemos que uma regulamentação das relações entre IA e os direitos autorais deve, a priori, buscar construir um ambiente normativo que promova, ao mesmo tempo:

a proteção pessoal e remuneração dos autores e artistas;
um ambiente positivo e de liberdade para as atividades e exercício das pesquisas, e;
o desenvolvimento nacional com o uso das inovações tecnológicas, no caso, por meio dos sistemas de IA. 

O arcabouço legal na América Latina, de maneira geral, não é adequado para lidar com questões localizadas na interseção entre IA e direitos autorais, bem como técnicas fundamentais para o treinamento de sistemas de IA ou para a pesquisa, como é o caso da Mineração de Textos e Dados (TDM). Entretanto, países como o Brasil, Chile e Uruguai têm discutido mudanças legislativas que visam mudar tal cenário. 

O Brasil começou a dar os primeiros passos para a regulamentação da IA por volta de 2018 e em 2019 surgiram novas propostas legislativas. No entanto, nenhuma delas havia abordado questões de direitos autorais até 2020. Em 2022, uma Comissão Especial (CJUSBIA) foi criada para consolidar três grandes projetos de lei sobre IA, resultando no Projeto de Lei 2338/2023 (PL da IA). 

Central à esta interseção entre IA, direitos autorais e pesquisa, temos a TDM, cujo uso como técnica essencial da pesquisa contemporânea precede e ultrapassa as tensões recentes ao redor do tema. Embora o projeto inicial concentrasse principalmente na permissão de TDM, as últimas revisões de 2024 passaram a tratar de outras questões relevantes aos direitos autorais e que agora estão no centro dos debates internacionais, como é o caso da transparência, mecanismos de opt-out e remuneração.

A fim de abordar as questões relacionadas aos direitos autorais levantadas na versão mais recente do PL da IA e contribuir para o debate público no Brasil, o Instituto Brasileiro de Direitos Autorais (IBDAutoral) preparou, com base na versão do PL 2338/2023 de 4 de Julho de 2024, a “Complementação de voto do Relator”, um estudo intitulado “Inteligência Artificial e Direitos Autorais: contribuições ao debate regulatório no Brasil”.

A pesquisa no PL 2338/23

Sobre os direitos autorais em geral, são especialmente relevantes os seguintes aspectos:

transparência e informação sobre o uso de obras protegidas no treinamento dos sistemas de IA (art. 60);
direito à pesquisa e limitação aos direitos autorais para fins de mineração de textos e dados (art. 61);
possibilidade de opt-out (art. 62);
remuneração dos titulares de direitos autorais (art. 64), e;
a proteção da imagem e voz (art. 66).

Ainda que as discussões sobre TDM estejam comumente relacionadas ao treinamento de sistemas de IA, com este não se confundem. O exercício, as atividades e os benefícios das pesquisas intensivas em dados são anteriores e em muito ultrapassam o desenvolvimento e oferecimento público dos sistemas de IA.

Além do mais, a proteção ao exercício e atividades de pesquisa e acesso aos seus resultados e benefícios estão previstos em diversas disposições dos Tratados de Direitos Humanos, inclusive os regionais, e são albergados pela Constituição Federal de 1988 e legislação infraconstitucional.

Considerando o tema proposto, cabe ressaltar que são várias as disposições no PL 2338/23 que tratam da pesquisa, e assim o fazem sob ângulos distintos. Estas dizem respeito a:

(não) incidência das regras ali contidas a determinadas atividades (art. 1º, §1º, c);
princípios, fundamentos e fomento ao desenvolvimento de IA (art. 2º, X; art. 57, II e III);
acesso a dados para pesquisa (art. 48, IX);
tratamento diferenciado aos padrões e formatos abertos e livres (art. 1º, §2º) e, como já dito acima;
mineração de dados e textos e direitos autorais (art. 4º, XIII; art. 61).

Claramente, busca-se proteger o direito de pesquisar, e não só para o desenvolvimento de sistemas de IA. Por isso, no caso da pesquisa em particular, é de extrema relevância distinguir, e regular diferentemente, entre:

pesquisa em geral, sem qualquer relação direta com os sistemas de IA;
pesquisa com IA, que apenas usa sistemas de IA como instrumentos para alcançar seus objetivos;
pesquisa sobre IA, que estão relacionadas ao contínuo desenvolvimento do campo da Ciência da Computação e outros; e
pesquisa em sistemas de IA, que são essenciais para endereçar questões problemáticas que são inerentes ao desenvolvimento, treinamento e uso desses sistemas. 

Isso porque as especificidades de cada uma destas situações trazem à luz a necessidade de uma regulação própria, adequada às suas particularidades, sob risco de, ao tratar coisas diferentes da mesma forma, aprofundar ou criar injustiças, ampliar a resistência aos seus comandos e comprometer sua efetividade e seus objetivos mais nobres.

Um dos resultados negativos no tratamento idêntico a situações diversas é, por exemplo, o requisito de “acesso legal” (art. 61, I), que muito provavelmente irá esvaziar, dificultar ou mesmo impedir a pesquisa computadorizada intensiva em dados que requeira a utilização de técnicas de mineração de textos e dados, mesmo quando o objetivo não seja desenvolver sistemas de IA, generativa ou não.

A importância de revisitar o art. 61

Assim, como está, a pesquisa intensiva em dados, mesmo quando não vinculada ao desenvolvimento de sistemas de IA, será prejudicada pelas condições restritivas para a utilização das técnicas de TDM.

Pesquisas climáticas e ambientais, em saúde e medicina, econômicas e financeiras, no combate às fake news, todas as áreas sofrerão o impacto das excessivas restrições, que embora pareçam almejar as atividades de desenvolvimento de IAs, principalmente as generativas, acabam por afetar todas as pesquisas que utilizam grande volumes de dados em diversas áreas essenciais. 

E isso pode e deve ser corrigido na próxima versão do PL, porque seu impacto se dará em inúmeras áreas, inclusive na própria pesquisa sobre IA, seus efeitos, riscos e danos sociais. Recomendamos, por isso, a revisão do artigo 61 da atual versão do PL, de forma que reflita adequadamente o necessário escopo de garantia e preservação das atividades de pesquisa.

A regulamentação das tecnologias, especialmente daquelas a respeito das quais não temos ainda como apreender plenamente a dimensão dos seus impactos, jamais será fácil, completa ou isenta de falhas. Por isso mesmo, a iniciativa e aqueles que trabalham na sua elaboração merecem todo o reconhecimento.

No entanto, seu aprimoramento e aperfeiçoamento é não só possível como necessário, até para atingir as finalidades de, ao regular as IAs, proteger os autores e artistas, assegurar o espaço de investigação e pesquisa e promover a inovação responsável.