Want to make creations as awesome as this one?

Transcript

Projeto final do Bootcamp análise de dados para mulheres

Alessandra

Adriana

Ranielle

de Ensino Superior

Mapeamento das Patentes depositadas pelas

Brasília, 1 de novembro de 2023

INSTITUições FEDERAIS

o projeto pode fornecer insights importantes para o desenvolvimento de políticas públicas para as ifes

Contexto

A concessão da patente é um ato administrativo declarativo, sendo necessário o requerimento da patente e o seu trâmite junto à administração pública (Instito Nacional da Propriedade Industrial - INPI).Constitui incentivo ao inventor e a concorrência a buscar alternativas tecnológicas.Não há informacoes públicas disponíveis sobre a participacao das IFES no depósito das patentes.O projeto consiste no levantamento e análise das patentes depositadas pelas Instituições Federais de Ensino nos anos de 2020 a 2023.

Patente é um título de propriedade temporária sobre uma invenção ou modelo de utilidade, outorgado pelo Estado aos inventores ou autores.

Identificação das instituições e empresas parceiras nessas patentes.

4. Principais parcerias

Mapeamento das principais áreas tecnológicas dessas patentes.

3. Áreas tecnológicas

Análise das quantidade das patentes depositadas pela instituições nos anos de 2020 a 2023 (julho).

2. Patentes depositadas

Criação de um algoritmos para extração do dados da RPI e tratamento dos dados.

1. Extração e tratamento dos dados

Objetivo e procedimentos

Para o alcance do objetivo do projeto, foram delimitados os seguintes procedimentos:
O objetivo era baixar os arquivos zip do site do INPI, extrair e raspar os dados XML, consolidá-los em um único dataframe e tratar os dados.

Extração e tratamento dos dados

Realizamos a limpeza e formatação dos dados, removendo valores nulos, ajustando tipos de dados e tratando eventuais inconsistências.

Tratamento dos dados

Empregamos a biblioteca xml.etree, permitindo a análise detalhada dos elementos XML desejados, localização de tags e atributos relevantes e extração precisa das informações

Raspagem dos dados em XML

Codificamos em Python, utilizando bibliotecas como requests, os e zipfile para baixar, organizar e extrair os arquivos zip contendo dados da Revista do INPI em XML.

Automatizar download e extração dos dados XML

Fonte: Revista de Propriedade Industrial. Disponível em : http://revistas.inpi.gov.br/rpi/

Identificar fonte e disponibilidade dos dados

Gerar as primeiras análises e gráficos do projeto em Python

Análise dos dados

(15,3%)

3.791

Base de dados de patentes depositadas pelas IFES,publicadas no mesmo período (como titular ou co-titular)

Universo dos dados

Base inicial de patentes depositadas e publicadas na RPI de 2020 a 2023(julho)

24.714

94%

6%

Natureza dos depósitos das IFES

Invenções novas

Patentes de Invenção

Melhorias em objetos de patentes já existentes.

Modelos de Utilidade

Enim senectus tempor vivamus elementum gravida aptent quisque malesuada.

Evolução das patentes depositadas

IFES depositantes

Parcerias

Áreas Tecnológicas

https://bootcamp-app-mapeamentopatentes.streamlit.app/
Organizar as informações geradas do projeto em um painel interativo, prgramado em Python

Streamlit Dashboard

Painel Streamlit com resumo dos resultados do projeto

Base de dados das patentes depositadas

Análise inicial dos dados de patentes depositadas

Algoritmo de extração de dados da RPI

Resultados e entregas

Desafios, limitações e legado do projeto

  • Ampliar o escopo do projeto (cód. 3.1 e IFES)
  • Aprimoramento do dashboard
  • Aprofundamento das análises
  • Tamanho da equipe
  • Tempo
  • Volume de dados
  • Base de dados com inconsistências

Legado

Limitações

Desafios

  • Raspagem dos dados em XML
  • Tratamento da base de dados
  • Python
  • GitHub
  • Streamlit
Alessandra Aparecida da Silva Menezes
Adriana Cristina Souza Leite
Ranielle Noleto Paz Araujo

Obrigada!