A Visão Artificial 3D utiliza um único Pixel para alta Velocidade e Eficiência de Custos
Os automóveis com condução autónoma dependem de sensores avançados e de um poder de computação significativo. No entanto, uma equipa de investigação liderada pela Universidade de Tsinghua, na China, desenvolveu um sistema de localização que reduz os requisitos de computação a um único pixel.
Inicialmente, os sistemas de visão por computador necessários para os veículos autónomos e a segurança inteligente pareciam simples: ligar uma câmara a um processador, adicionar alguns algoritmos e já está. Os seres humanos gerem sem esforço o processamento de imagens complexas com os seus sistemas biológicos, por isso, qual será o desafio?
Desafios na Emulação da Visão Humana e da Resposta Reflexiva
Acontece que isto é extremamente difícil. Embora o olho humano seja opticamente mais simples (embora ainda complexo), o processamento subjacente é incrivelmente complexo. Além disso, os humanos utilizam esta informação e respondem de forma reflexiva, o que torna quase impossível a sua emulação.
A equipa de investigação de Tsinghua fez um grande avanço ao criar um método de rastreio 3D para objectos em movimento rápido a velocidades excepcionais, ao mesmo tempo que reduz as exigências de computação. A inovação reside no facto de se conseguir isto não com uma imagem completa, mas utilizando apenas um único pixel.
Rastreio Eficiente de Objectos sem Reconstrução de Imagem
“O nosso método não requer a reconstrução da imagem do objeto para determinar a sua posição, reduzindo significativamente o armazenamento de dados e os custos computacionais”, explicou o líder da investigação, Zihan Geng.
“Especificamente, o cálculo de uma coordenada 3D necessita apenas de seis bytes de armazenamento e 2,4 microssegundos de tempo de computação. Ao reduzir as despesas de computação e aumentar a eficiência, pode diminuir o custo do equipamento para rastreio de alta velocidade, tornando a tecnologia mais acessível e abrindo novas aplicações”.
A equipa afirma que a sua técnica pode localizar objectos 200 vezes mais depressa do que os métodos convencionais baseados em vídeo, utilizando apenas um detetor, sem informação prévia e com um poder de computação mínimo.
Isto é conseguido através da projeção de padrões geométricos de luz sobre o objeto e da medição da intensidade num único pixel. Através de cálculos matemáticos complexos, a posição e a trajetória do objeto são determinadas.
Utilização de um Laser e de Dados de um Único Pixel para o Seguimento de Objectos
Inicialmente, a equipa utilizou simulações, mas rapidamente passou a utilizar um laser e um dispositivo digital de micro-espelhos (DMD) para iluminar uma esfera metálica que se movia ao longo de um fio curvo em espiral. O sistema efectuou cálculos com base nos dados de apenas um pixel.
Atualmente, este método segue um único objeto, sendo o próximo objetivo seguir vários objectos em simultâneo.
“Esta tecnologia pode melhorar a perceção em carros autónomos, melhorar os sistemas de vigilância de segurança e proporcionar uma monitorização e um controlo de qualidade mais eficientes em inspecções industriais”, afirmou Geng. “Além disso, esta técnica de localização a alta velocidade pode ser aplicada na investigação científica, como o estudo das trajectórias de voo dos insectos.”
Leia o Artigo Original New Atlas
Leia mais Tecnologia de Aceleradores de Partículas do CERN Trata agora Tumores Cerebrais