Você já parou para pensar como funciona o processo cognitivo de uma criança? De que forma ela vai compondo o seu repertório e aprendendo coisas novas todos os dias? Quem acompanha de perto, até se surpreende com a rapidez com que isso tudo acontece. O fato é que uma criança aprende a partir das referências de pessoas e acontecimentos ao seu redor, de uma maneira quase que natural. E o que isso tem a ver com visão computacional? Tudo! Como? O processo de desenvolvimento desta ciência estrutura e cria maneiras para que uma máquina possa “ver” foi inspirado na cognição humana.
O que é visão computacional?
Visão computacional é a replicação da visão humana por meio do desenvolvimento de softwares e hardwares avançados. Tudo começa com algoritmos computacionais desenvolvidos de forma a simular o comportamento humano no processo de aprendizagem da máquina. É a partir do fornecimento de inúmeras referências que o computador vai sendo ensinado a reconhecer, compreender e classificar imagens.
Ao mesmo tempo, é preciso considerar que o processamento da visão pelo cérebro humano é uma atividade extremante complexa – ainda que a executemos de maneira natural e automática. Envolve os olhos, a retina, o córtex e todo o repertório que a pessoa vai acumulando desde antes de nascer! Traduzir tudo isso para uma máquina é o desafio que recebe o nome de Visão Computacional. Um campo interdisciplinar que demanda habilidades de modelagem, matemática, estatística, uma combinação de software e hardware, para que computadores obtenham um entendimento de alto nível a partir de imagens ou vídeos digitais.
A visão computacional estuda como processar uma cena em três dimensões a partir de imagens em duas dimensões, considerando as propriedades e estruturas presentes na cena. Vai além do simples reconhecimento da imagem pelo computador, com a identificação de pixels e padrões, buscando reconhecer contexto e sensações a partir de um conjunto de dados.
O potencial por trás do desenvolvimento da visão computacional é enorme, com expectativas de que ultrapasse a habilidade humana. Projeções indicam que a tecnologia será capaz de ver através de paredes, no escuro e a longas distâncias, com capacidade crescente de processar enormes volume de dados.
A visão computacional vem sendo usada nos negócios e na vida para conduzir diferentes tipos de tarefas. Na saúde, é capaz de reconhecer doenças a partir de raios-x; no varejo, pode acompanhar a movimentação dos clientes na loja e melhorar o posicionamento dos produtos; na indústria, é capaz de aumentar a eficiência operacional dos processos produtivos.
Dentro da indústria de alimentos, por exemplo, a UniSoma desenvolveu uma solução, utilizando visão computacional, para calcular o peso das carcaças de aves a partir da captação da imagem, em uma fase do processamento avícola que, até então, não seria possível realizar a pesagem.
Na solução da UniSoma, uma câmera de vídeo captura imagens em movimento de até três aves por segundo. Os modelos matemáticos e os algoritmos preditivos estimam então o peso de cada uma delas a partir da análise da área do dorso.
A informação do peso, que antes só seria conhecida no final do processo, agora acontece com uma hora de antecedência. Consequentemente, possibilita antecipar o planejamento de destinações de cada ave e auxilia no cumprimento do plano de produção diário. “A pesagem antes do resfriamento permite ao programador que classifica os frangos tomar decisões matematicamente estruturadas para os planejamentos do dia”, destaca Eduardo Milanez, especialista da UniSoma. Uma hora pode, à primeira vista, parecer um tempo irrisório, mas o potencial de economia é significativo dentro de um fluxo de produção avícola.
O grande diferencial da UniSoma está no algoritmo de predição que é capaz de revelar o peso da ave com uma precisão de 95%, dada a proporção relativamente constante que existe entre tamanho e peso dos animais. “O sistema captura a imagem de cada carcaça, extrai suas dimensões e, com base numa equação de regressão, estima o peso, fornecendo um histograma da distribuição dos pesos das aves a cada instante”, explica Milanez.
Casos como este, onde a visão computacional atua como fonte de dados para os algoritmos preditivos e prescritivos (advanced analytics) estão cada vez mais presentes. A ciência da computação tem permitido o desenvolvimento de sistemas capazes de reconhecer padrões e imitar o funcionamento do cérebro humano e de redes neurais com cada vez mais acuracidade. Ainda há muito a ser feito, mas os avanços estão por toda a parte.
Quer saber como sua empresa pode se beneficiar dessas tecnologias? Entre em contato com a Unisoma para conhecer todas as nossas aplicações.