segunda-feira, 3 de novembro de 2025

O problema das descrições proféticas pela IA

O artigo How will AI affect patent disclosures? de Lisa Ouellette publicado na Nature em janeiro de 2025 discute os impactos do uso de ferramentas de inteligência artificial (IA) na redação de documentos de patentes, com foco nos requisitos de divulgação técnica. A lei de patentes exige que os inventores descrevam suas invenções de forma clara e completa, permitindo que um especialista na área possa reproduzi-las. No entanto, com o aumento do uso de IA generativa para redigir patentes, surgem novos desafios: A IA pode reduzir custos e democratizar o acesso ao sistema de patentes, mas também pode agravar problemas de divulgação inadequada. Estudos mostram que examinadores de patentes já dedicam pouca atenção à qualidade da divulgação, focando mais em novidade e não obviedade.

Ferramentas de IA testadas no artigo foram capazes de gerar especificações de patentes plausíveis, mesmo para tecnologias hipotéticas não implementadas, o que pode levar à concessão de patentes com informações enganosas ou incorretas. Para isso, desenvolvemos relatórios descritivos breves e reivindicações de patente para quatro tecnologias relacionadas à dinâmica de fluidos: duas tecnologias existentes que deveriam estar incluídas nos dados de treinamento das ferramentas de IA existentes, e duas tecnologias hipotéticas que ainda não foram implementadas na prática. Para cada uma dessas quatro tecnologias, inserimos um breve resumo técnico, uma reivindicação de patente e instruções de acompanhamento em três das ferramentas de IA mais promissoras — duas ferramentas específicas para patentes (Edge e Vaero) e o ChatGPT-4o e obtivemos rascunhos de especificações de patente. As ferramentas de IA parecem propensas a inundar a literatura de patentes com informações errôneas ou enganosas, tornando as patentes menos úteis como fonte de informações técnicas (e diluindo a qualidade dos dados de treinamento de IA futuros). Além disso, as ferramentas de IA poderiam amplificar os problemas existentes com patentes concedidas com base em divulgações puramente especulativas, antes que alguém tenha realizado o trabalho de implementar uma invenção na prática. Essas patentes mal descritas serão então legalmente presumidas como capazes de viabilizar a invenção, e poderiam, portanto, ser usadas para rejeitar pedidos de patente posteriores de verdadeiros inventores.

O físico Alan Sokal, professor de física na Universidade de Nova York, em 1996, enviou um artigo intencionalmente absurdo e sem sentido para a revista acadêmica de estudos culturais Social Text, que era conhecida por publicar textos sobre pós-modernismo, teoria crítica e ciência social. O artigo, intitulado “Transgressing the Boundaries: Towards a Transformative Hermeneutics of Quantum Gravity”, misturava jargões de física e filosofia, usando citações e conceitos de maneira deliberadamente errada ou sem coerência, mas de um jeito que soasse “intelectualmente sofisticado”. A surpresa veio quando a revista publicou o artigo sem perceber que ele era um pastiche sem sentido, mostrando que, segundo Sokal, algumas revistas acadêmicas de humanidades aceitavam textos sem rigor científico, desde que estivessem alinhados ideologicamente com certas tendências teóricas. Depois, Sokal revelou o hoax em um artigo no Lingua Franca, explicando que seu objetivo era criticar a falta de rigor intelectual em certas publicações de estudos culturais e pós-modernismo.

As pesquisadoras russas Anna Abalkina e Svetlana Kleiner investigaram uma grande rede de produção fraudulenta de artigos científicos, conhecida como fábrica de papers, que aparentemente operava a partir da Ucrânia. Esse esquema vendia artigos falsos ou de baixa qualidade e autorias a pesquisadores interessados em inflar artificialmente suas publicações. O alerta inicial veio em 2022, quando Abalkina foi contatada sobre domínios de e-mails suspeitos, principalmente o Tanu.pro, usado por autores de artigos com indícios de má conduta. Junto com Kleiner, elas rastrearam a rede e identificaram 1.517 estudos publicados entre 2017 e 2025, envolvendo mais de 4.500 pesquisadores de cerca de 460 universidades em 46 países, com concentração na Ucrânia, Cazaquistão e Rússia. Os artigos apresentavam anomalias como excesso de autores, citações irrelevantes, dados fabricados, manipulação na revisão por pares e uso de IA para encobrir plágio. A editora Springer Nature recebeu 8.432 submissões ligadas à rede, das quais 79 foram publicadas; 48 já foram retratadas e 31 estão em investigação. https://revistapesquisa.fapesp.br/fraude-com/

O problema de artigos fake gerados por IA tem atingido tambem a comunidade científica como mostra Artificial Intelligence Can Generate Fraudulent but Authentic-Looking Scientific Medical Articles: Pandora's Box Has Been Opened mesmo pesquisadores experientes encontraram grande dificuldade em distinguir esse artigo gerado por IA de um artigo verdadeiro. Estudo da Northwestern University mostra que revisores humanos foram testados com uma mistura de resumos reais e gerados por ChatGPT; conseguiram detectar apenas ~68% dos resumos gerados como falsos. Estudo Fake publications in biomedical science: red-flagging method indicates mass production mostra que a taxa de artigos com bandeira vermelha aumentou durante a última década, atingindo cerca de 14,9% em 2020 e 16,3% em 2023. Os países com a maior proporção de publicações lidas foram China, Índia, Irã, Rússia e Turquia, com a China e a Índia sendo os maiores contribuintes absolutos globalmente. A aplicação da regra de Bayes resultou em uma estimativa de 5,8% de falsificações reais na literatura biomédica. Dadas 1,86 milhão de publicações biomédicas listadas no Scimago em 2023, estimamos o número real de falsificações verdadeiras em 107.800 artigos por ano, crescendo de forma constante. 

Patentes mal redigidas ou baseadas em divulgações “proféticas” (não testadas) podem ser usadas indevidamente para rejeitar pedidos futuros de inventores reais, prejudicando a inovação. Os examinadores de patentes dos EUA têm apenas cerca de 20 horas no total para dedicar a cada pedido de patente, e tendem a gastar esse tempo pesquisando patentes anteriores para determinar se a invenção descrita no pedido de patente é nova e não óbvia. Por exemplo, um estudo das respostas iniciais do USPTO a pedidos de patente em 2018 revela que, na maioria das classes tecnológicas, cerca de 50 a 60% tiveram algumas reivindicações rejeitadas por falta de novidade, e 70 a 80% tiveram algumas reivindicações rejeitadas por serem óbvias, enquanto apenas cerca de 5% dos pedidos receberam alguma objeção relacionada à descrição da invenção 

Recomendações para melhorias:

Reforçar a fiscalização: Melhorar a formação dos examinadores e incluir mais especialistas científicos no processo de análise

Revisar os padrões legais: Exigir que os inventores implementem pelo menos uma versão da invenção antes do registro, ou elevar o padrão de divulgação para invenções não testadas.

Usar a IA a favor: Desenvolver ferramentas de IA que ajudem os examinadores a identificar trechos que necessitam de verificação detalhada.


Conclui-se que, sem supervisão humana qualificada, a IA pode inundar o sistema de patentes com informações de baixa qualidade, reduzindo seu valor como fonte de conhecimento técnico e desincentivando a inovação real.

Nenhum comentário:

Postar um comentário