Use este identificador para citar ou linkar para este item: http://repositorio.ifam.edu.br/jspui/handle/4321/1355
Tipo: Trabalho de Conclusão de Curso
Título: Data Cleaner Service - Web Service para apoiar na limpeza de dados
Autor(es): Picanço, Gabriel Rodrigues
Primeiro Orientador: Carminé, Rogério Luiz Araújo
metadata.dc.contributor.referee1: Carminé, Rogério Luiz Araújo
metadata.dc.contributor.referee2: Azevedo, Renildo Viana
metadata.dc.contributor.referee3: Santos, Valclides Kid Fernandes dos
Resumo: É notório o grande aumento na quantidade de dados e de informação nos últimos anos. Dados errados geram informações erradas, que podem impactar significativamente na gestão das organizações e na vida das pessoas. As organizações precisam obter informação confiável e em tempo oportuno para a tomada de decisão efetiva nos negócios e, para isso, é importante investir em soluções que assegurem a qualidade de dados. As técnicas de limpeza de dados (em inglês, Data Cleaning) possibilitam identificar e corrigir valores não conformes baseados em regras e ações definidas. Essas técnicas são muito usadas nas atividades de preparação de dados nos processos de BI (Business Intelligence) e Data Science para contribuir com a qualidade dos resultados. Existem diversas ferramentas no mercado para limpeza de dados (p.ex., Excel, OpenRefine e Data Wrangler), que possuem características e funções específicas, e normalmente possibilitam a criação de scripts de programação para realizar as tarefas de limpeza. Esses scripts podem requerer bastante tempo e esforço para serem elaborados, e ser de difícil reutilização em ferramentas diferentes. Foi desenvolvida uma solução baseada em um serviço web (Data Cleaner Service) capaz de se integrar a ferramentas (p.ex., Aplicações Web) e realizar a limpeza de dados por meio da reutilização de scripts (p.ex., Python). Para demonstração da solução, foram desenvolvidas aplicações utilizando scripts com a ferramenta PANDAS, um componente e uma aplicação Web que consome o serviço. Com essa solução, espera-se contribuir positivamente na realização de tarefas de limpeza de dados em diversas áreas (p.ex., finanças, vendas e saúde), reduzindo esforço e tempo nessas atividades, promovendo a troca de experiência entre usuários e desenvolvedores, e impactando na geração de informação efetiva para tomada de decisão.
Abstract: The large increase in the amount of data and information recently is notorious. Wrong data generates wrong information, which can significantly impact the management of organizations and people's lives. Organizations need to obtain reliable and timely information for effective business decision-making and, for that, it is important to invest in solutions that ensure data quality. Data Cleaning techniques make it possible to identify and correct non-compliant values based on defined rules and actions. These techniques are widely used in data preparation activities in BI (Business Intelligence) and Data Science processes to contribute to the quality of results. There are several tools on the market for data cleaning (e.g., Excel, OpenRefine and Data Wrangler), which have specific characteristics and functions, and normally allow the creation of programming scripts to carry out cleaning tasks. These scripts can take a lot of time and effort to write, and can be difficult to reuse across different tools. A solution based on a web service (Data Cleaner Service) capable of integrating with tools (e.g., Web Applications) and cleaning data through the reuse of scripts (e.g., Python) was developed. To demonstrate the solution, applications were developed using scripts with the PANDAS tool and a Web application that consumes the service. With this solution, it is expected to make a positive contribution in carrying out data cleaning tasks in several areas (e.g., finance, sales and health), reducing effort and time in these activities, promoting the exchange of experience between users and developers, and impacting the generation of effective information for decision-making.
Palavras-chave: Desenvolvimento de sistemas
. Serviço web
Padronização de dados
Python
CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
Idioma: por
País: Brasil
Sigla da Instituição: Instituto Federal do Amazonas
IFAM
Tecnologia em Análise e Desenvolvimento de Sistemas
Instituto Federal do Amazonas
IFAM
Tecnologia em Análise e Desenvolvimento de Sistemas
Instituto Federal do Amazonas
IFAM
Tecnologia em Análise e Desenvolvimento de Sistemas
metadata.dc.publisher.department: Campus Manaus Centro
Citação: PICANÇO, Gabriel Rodrigues. Data Cleaner Service - Web Service para apoiar na limpeza de dados. 52 f. 2023. Monografia (Tecnologia em Análise e Desenvolvimento de Sistemas) – Instituto Federal de Educação, Ciência e Tecnologia do Amazonas, Campus Manaus Centro, Manaus, 2023..
Tipo de Acesso: Acesso Aberto
URI: http://repositorio.ifam.edu.br/jspui/handle/4321/1355
Data do documento: 19-Jun-2023
Aparece nas coleções:Monografia_Tecnologia

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Data Cleaner Service - Web Service para apoiar na limpeza de dados_Picanço_2023.pdfMonografia_Tecnologia em Análise e Desenvolvimento de Sistemas_IFAM-Campus Manaus Centro2,41 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.