Skip to content

Dados Abertos e Inteligência Analítica: como integrar ao mundo dos negócios?

Os dados estão se tornando cada vez mais importantes para a sociedade moderna e não há tempo melhor do que hoje para liberar o potencial que eles têm para a inovação. Essa crescente importância dos dados traz à imagem o conceito de “open data” (dados abertos), tema central deste artigo.

A iniciativa de análise de dados públicos e abertos dentro de uma ferramenta open source é algo que começou a ser muito discutido ultimamente e basicamente origina-se da necessidade de estruturação e disponibilização dos dados públicos para fornecer informações com valor analítico para o público geral. A ideia é que os dados devem estar disponíveis para que todos usem e publiquem, sem restrições de direitos autorais e patentes ou outros mecanismos de controle.

Nesse sentido, a inteligência analítica, conhecida como Analytics, agrega com o intuito de fornecer o tratamento necessário a esses dados, a fim de disponibiliza-los como informações de qualidade ao cidadão, permitindo maior flexibilidade e facilidade de análise, uma das maiores deficiências existentes nos sistemas públicos atuais.

Entrevistamos Alexandro Romeira, cofundador e responsável pelas áreas de negócios da empresa D2i, para compartilhar conosco um pouco de seu conhecimento e nos ajudar a esclarecer melhor alguns pontos a respeito desse assunto. Confira abaixo e fique por dentro!

1 - Primeiramente, o que torna os dados abertos e de que tipo de dados estamos falando?

Segundo um dos estudiosos do tema, David Eaves, os dados para serem abertos devem seguir três "leis" e oito princípios. As "leis" são:

  1. Se o dado não pode ser encontrado e indexado na Web, ele não existe (a deepweb não pode ser considerada open data);
  2. Se não estiver aberto e disponível em formato compreensível por máquina, ele não pode ser reaproveitado;
  3. Se algum dispositivo legal não permitir sua replicação, ele não é útil.

E seus princípios:

  1. Completos: todos os dados públicos são disponibilizados.
  2. Primários: os dados são publicados na forma coletada na fonte, com a mais fina granularidade possível, e não de forma agregada ou transformada;
  3. Atuais: os dados são disponibilizados o quão rapidamente seja necessário para preservar o seu valor;
  4. Acessíveis: os dados são disponibilizados para o público mais amplo possível e para os propósitos mais variados possíveis;
  5. Processáveis por máquina: os dados são razoavelmente estruturados para possibilitar o seu processamento automatizado;
  6. Com acesso não discriminatório: os dados estão disponíveis a todos, sem que seja necessária identificação ou registro;
  7. Em formatos não proprietários: os dados estão disponíveis em um formato sobre o qual nenhum ente tenha controle exclusivo;
  8. Livres de licenças: os dados não estão sujeitos a regulações de direitos autorais, marcas, patentes ou segredo industrial.

É importante considerar que muitos dos princípios são destinados a dados públicos, por isso é necessário entender que todo dado que é público deve ser aberto, mas nem todo dado é público. Restrições razoáveis de privacidade, segurança e controle de acesso podem ser permitidas na forma regulada por estatutos.

2 - Em relação ao conceito “open data”, especificamente, o que é e como podemos nos aproveitar desse movimento na atualidade?

O conceito de dados abertos (open data) tem por definição o seguinte contexto: “Dados abertos são dados que podem ser livremente usados, reutilizados e redistribuídos por qualquer pessoa - sujeitos, no máximo, à exigência de atribuição da fonte e compartilhamento pelas mesmas regras.”.

Esse movimento tem se fortalecido a cada momento, não só por governos como também por iniciativas privadas e, recentemente, no segmento financeiro com o movimento "open banking". Deixar os dados abertos, além de servir como subsídio para pesquisadores e sociedade, também mostra transparência para as operações, deixando os envolvidos com uma boa impressão no mercado. Isso é muito legal!

3 - Quais são os dados públicos brasileiros e seus desafios quando relacionados à Analytics (inteligência analítica)?

Os dados públicos brasileiros são uma fonte riquíssima de informações, passando desde dados cadastrais completos das empresas (CNPJ), informações de emprego e renda (RAIS e CAGED), dados de atendimentos de saúde, com tipos de doenças, dados completos de censos demográficos e entre outras muitas informações.

Para utilização dos dados públicos brasileiros, nossos desafios são insanos. Seguindo a edição da Lei nº 12.527/2011, foi efetivamente incorporado ao ordenamento brasileiro o tema da política de dados abertos governamentais, como reflexo inclusive dos compromissos assumidos externamente pelo Brasil com outros sete países (África do Sul, Estados Unidos, Filipinas, Indonésia, México, Noruega e Reino Unido) que participaram da parceria para Governo Aberto (Open Government Partnership), união esta que hoje congloba quase 80 países. É importante ressaltar que isso não segue as regras e leis comentadas anteriormente. Os dados são em sua maioria desatualizados, complexos, restritos e limitados, o que torna o uso em sistemas de Analytics uma grande caça ao tesouro.

Por sorte, muitos pesquisadores e empresas têm agregado essas informações de formas adequadas, trazendo o potencial desse valor para nossos modelos analíticos. O importante é não desistir. A Pesquisa e a curiosidade fazem parte desse processo, então vamos pegar nossas ferramentas e ir a campo.

4 - Como podemos tirar vantagens estratégicas integrando essas informações ao mundo dos negócios?

Atualmente, todos podem se beneficiar desse movimento de várias formas, principalmente com o acesso a fontes de dados confiáveis, permitindo agregar essas informações aos dados das empresas, melhorando os modelos analíticos e preditivos, como machine learning e outras técnicas. Para isso, destacam-se algumas vantagens: dados abertos e públicos agregam valores importantes às suas análises, fundamentam a tomada de decisão, fomentam a Inteligência Competitiva (Análise de ambiente e mercado), reduzem o tempo para lançamento de novos produtos e permitem agregar valores externos, melhorando os modelos de Machine Learning e Analytics.

O dado é o novo petróleo e como tal ele precisa ser extraído, refinado e destinado para desenvolvimento de produtos específicos. Penso nos dados abertos como uma fonte inesgotável desse petróleo. É importante minerar e extrair todo o seu valor.

5 - Qual a relevância dos dados abertos em função dos sistemas IA? Como podemos trabalhar com isso em casos reais e quais as perspectivas disso para o futuro?

A relevância dos dados abertos para os sistemas de IA são enormes, eles agregam um volume de dados e possibilidades aos nossos modelos. As ferramentas de Inteligência Artificial se beneficiam muito dessas informações, já que correlacionam informações, até antes indisponíveis, melhorando nossos modelos analíticos.

Um exemplo prático é usar dados de RAIS / CAGED com CNAE (CNPJ) para verificar regiões com potencial de crescimento e crise, permitindo políticas públicas mais assertivas para preservar os empregos de uma região. Da mesma forma, os mesmos dados permitem que empresas busquem novas regiões para instalar suas operações de forma a conhecer o perfil de mão de obra, cargas tributárias, centros de especialização etc. Ou seja, os benefícios são enormes.

Para o futuro, acredito que teremos dados melhores, tanto em quantidade como em qualidade, já que os sistemas de Big Data estão cada vez mais reais e acessíveis, possibilitando aos cientistas de dados desenvolverem modelos mais rentáveis. Por último, a sociedade poderá se manifestar como utilizadores dessas informações, pressionando governos, empresas e bancos a serem mais transparentes.

Além disso, temos uma questão que não pode ser descartada: a adoção da LGPD (Lei Geral de Proteção de Dados), com previsão para vigorar a partir de agosto de 2020. Esse movimento não pode ser detido, já que os dados pessoais não estarão presentes nessas informações, porém é possível que muitos deixem de disponibilizar essas informações com uma base legal, por desconhecimento ou "preguiça". O dado é nosso, vamos nos promover!

Live University – Ebusiness

Se você deseja aprimorar seus conhecimentos na área de TI e acompanhar as tendências, você está no lugar certo! Conheça os cursos de Ebusiness, a escola de Tecnologia da Informação da Live University. Aqui você encontra workshops, eventos, MBA, pós-graduação e muito mais. Clique aqui e comece já a sair da teoria e aplicar na prática!

Comments

Fale com a gente no WhatsApp