News

Estimativa da pegada de carbono industrial a partir de transações bancárias

Preocupações com a mudança climática, relacionadas ao aumento das emissões de gases de efeito estufa, levaram 187 países a assinar o Acordo de Paris em 2015.

Sumário

 

O artigo original "Explainable automatic industrial carbon footprint estimation from bank transaction classification using natural language processing" foi publicado pelo Institute of Electrical and Electronics Engineers, em 22 de dezembro de 2022.

Autores:

Jaime González González. IT Group, atlanTTic, TES Universidade de Vigo, Espanha.

Silvia García Méndez. IT Group, atlanTTic, TES Universidade de Vigo, Espanha.

Francisco De Arriba Pérez. IT Group, atlanTTic, TES Universidade de Vigo, Espanha.

Francisco J. González Castaño. IT Group, atlanTTic, TES Universidade de Vigo, Espanha.

Óscar Barba Seara. Coinscrap Finance S.L., Pontevedra, Espanha

A preocupação com o efeito dos gases de efeito estufa motivou o desenvolvimento de protocolos de certificação para quantificar a pegada de carbono industrial. Estes protocolos são manuais, exigem muito trabalho e são caros. Tudo isso levou a uma mudança para abordagens automáticas baseadas em dados para estimar a pegada de carbono, incluindo soluções de aprendizado de máquina.

Introdução à Estimativa da Pegada de Carbono

A preocupação com as mudanças climáticas, relacionadas ao aumento das emissões de gases de efeito estufa, levou 187 países a assinarem o Acordo de Paris em 2015. Este acordo deixou claro a necessidade de políticas e regulamentações sobre as emissões de gases de efeito estufa, como o dióxido de carbono (CO2). A chamada pegada de carbono pode ser definida como a quantidade de gases de efeito estufa liberada na atmosfera ao longo do ciclo de vida de um produto ou atividade humana.

As motivações para o cálculo da pegada de carbono são diversas, sendo o cumprimento da legislação ambiental e a certificação da sustentabilidade industrial (ISO 14064) duas das razões mais relevantes. Outro incentivo importante é o autocontrole para evitar impostos ambientais e atrair financiamento de investidores com mentalidade ecológica.

Além disso, os indivíduos, especialmente os jovens, têm uma preocupação urgente com os efeitos das mudanças climáticas. Por isso, várias aplicações de rastreamento permitem que os usuários finais estimem e reduzam sua pegada de carbono.

Contribuição

As soluções para estimativa da pegada de carbono podem ser divididas em abordagens manuais e automáticas. Neste artigo, propomos uma solução automática para estimativa da pegada de carbono industrial baseada em um modelo supervisionado de classificação de transações bancárias. O conjunto de treinamento foi rotulado como classes COICOP .

Partindo de um modelo de categorização que combina Aprendizado de Máquina com técnicas de Processamento de Linguagem Natural, a principal contribuição deste estudo reside na proposta de explicabilidade automática das decisões de estimativa da pegada de carbono.

Metodologia de Estimativa da Pegada de Carbono

Pré-processamento

As características usadas como dados de entrada para a tarefa de classificação foram elaboradas a partir de dados textuais de transações bancárias. Para isso, o texto foi processado usando as seguintes técnicas de Natural Language Processing:

·   Eliminação de números.

·   Reconstrução de termos.

·   Eliminação de símbolos e sinais diacríticos.

·   Eliminação de palavras comuns e códigos.

·   Lematização do texto.

Módulo de Classificação 

Uma vez que as descrições das transações bancárias processadas contêm em sua maioria termos semanticamente significativos, que utiliza classificação Depois de classificadas as transações, o sistema proposto obtém automaticamente sua pegada de carbono estimada a partir das fórmulas dos setores aos quais se prevê que pertençam e do valor da transação bancária.

Avaliação experimental e discussão

Conjunto de dados experimentais 

O conjunto de dados consiste em 25.853 transações bancárias emitidas por bancos espanhóis e coletadas pela Coinscrap Finance S.L. Observa-se que o tamanho deste conjunto de dados é comparável ao do nosso estudo anterior sobre classificação de transações bancárias. A amostra foi reduzida usando a biblioteca FuzzyWuzzy Python para manter apenas aquelas entradas suficientemente representativas e distinguíveis.

Foram descartadas as amostras cujas descrições apresentavam uma similaridade superior a 90%. O processo de amostragem resultou em 2.619 arquétipos de transações, com uma média de comprimento de 10 palavras/73 caracteres. As transações são divididas em três categorias principais: automóvel e transporte, despesas corporativas e produtos básicos, além de várias subcategorias.

Conclusões da estimativa da pegada de carbono

Neste estudo, propõe-se uma solução inovadora e explicável para a estimativa automática da pegada de carbono industrial a partir de transações bancárias, abordando a falta de metodologias transparentes de explicação de decisões para este problema.

A explicação é especialmente importante para confiar nos resultados dos processos automáticos, substituindo alternativas mais custosas, como análises de consultoria. De fato, embora a explicabilidade automática não tenha sido abordada neste contexto, o estudo do estado da arte também revelou que não existem trabalhos anteriores ou soluções comerciais para a estimativa automática da pegada de carbono industrial a partir de transações bancárias. A fonte de dados original inclui mais de 25.000 transações bancárias. Elas foram anotadas para classificação utilizando categorias COICOP.

Para futuros trabalhos, os autores planejam expandir esta pesquisa para outras línguas, enriquecer as explicações com informações empresariais complementares e estudar o efeito das metodologias hierárquicas na categorização , aproveitando as relações entre as classes alvo.

Também está previsto avançar para uma abordagem semi-supervisionada combinando a solução atual com um esquema de regras, como os propostos por outros autores. Outra possível linha de pesquisa é a comparação da abordagem agnóstica do modelo para explicabilidade com metodologias específicas do modelo.

Inscreva-se em nossa newsletter e receba nossas últimas notícias diretamente na sua caixa de entrada.