1_v8nCl4VaLIPZVLwZYW_aDA

Classificação de Documentos Digitalizados

Tecnologia

Classificação de Documentos Digitalizados

Por José Paulo Marchezi, Cientista de Dados na Dom Rock

Base de dados

Resultados

Para exemplificar, a Figura 1 mostra 8 classes de documentos: boletos, concessionárias, cupom fiscal, guias de recolhimento, notas fiscais de transporte, NF de serviços, NF de produtos e recibos de transporte por aplicativos. Cada imagem possui suas peculiaridades, mas ainda assim tem alguns pontos semelhantes, como, por exemplo, código de barras. Durante o treinamento da rede neural os pontos que são comuns dentro de cada classe são valorizados, de modo que quando utilizamos a rede para classificar um documento novo, os coeficientes da saída da rede neural possuem certa configuração que depois são comparados com a configuração média dos coeficientes já presentes na rede neural.


Figura 1. Exemplo dos diferentes tipos de documentos utilizados no treinamento da rede neural.

A Figura 2 apresenta as regiões valorizadas durante o processo de treinamento e também quando é feita a classificação de um novo documento com a rede. Podemos considerar que as regiões com cores em tom vermelho são as regiões que possuem as principais características únicas de cada documento, de acordo com a rede neural utilizada.


 



Figura3. Acurácia no modelo (lado esquerdo) e a perda durante o treinamento (lado direito).

A Figura 3 mostra a matriz de confusão para todas as classes desse banco de dados. Esse tipo de representação compara a classe real, no eixo vertical, e a classe predita pela rede, no eixo horizontal, a escala de cores mostra o quão assertiva foi a classificação dentro de todos os documentos reservados para o teste, ou seja, quanto mais azul, maior o número de acertos. Podemos observar que algumas classes, como notas fiscais de produtos e transportes, apresentam 98% de acertos.


Figura 4. Matriz de confusão.

Considerações finais

A utilização de redes neurais na classificação de imagens é uma tecnologia que já vem sendo utilizada há um bom tempo e está bem difundida no mercado e pode ser aplicada na classificação automática de documentos. Os resultados apresentados são satisfatórios, e podem ser aplicados para qualquer tipo de formulários e documentos comuns dentro da maioria das empresas. Esse método pode ainda ser aprimorado utilizando uma combinação de modelos. Uma alternativa é utilizar a classificação por imagem e com informação textual juntas. Isso pode aumentar a assertividade da classificação sem aumentar os custos computacionais.

Deixe aqui seu comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Close Bitnami banner
Bitnami