Uma maneira muito mais fácil de ensinar novas habilidades a robôs

Reprogramação de robôs
Com os pedidos de comércio eletrônico chegando, um robô de armazém escolhe copos de uma prateleira. Além de colocá-los em caixas para envio. Cada coisinha está zumbindo até que o armazém processa uma modificação. Assim como o robô, agora tem que segurar copos mais altos e estreitos que são mantidos de cabeça para baixo.
A reprogramação desse robô envolve rotular manualmente centenas de fotos que mostram como lidar com esses copos novinhos em folha e, em seguida, treinar o sistema novamente.
No entanto, uma nova estratégia estabelecida por cientistas do MIT precisaria de apenas um punhado de apresentações humanas para reprogramar o robô. Essa técnica de aprendizado de máquina permite que um robô pegue. Bem como colocar objetos nunca antes vistos que estão em posturas arbitrárias que nunca encontrou. Dentro de 10 a 15 minutos, o robô estaria pronto para fazer um novo trabalho de pegar e colocar.
Reconstrução de formas 3D com rede semântica
O método utiliza uma rede semântica especialmente criada para reconstruir as formas de itens 3D. Com apenas algumas apresentações, o sistema usa o que a rede semântica realmente aprendeu sobre geometria 3D. Para pegar itens novinhos em folha que se assemelham aos das demonstrações.
Em simulações, bem como usando um braço robótico genuíno. Os pesquisadores revelam que seu sistema pode controlar efetivamente xícaras, tigelas e garrafas nunca antes vistas. Organizado em presentes aleatórios, usando apenas 10 apresentações para mostrar a robótica.
” Nosso pagamento significativo é a capacidade básica de oferecer de forma muito mais eficaz novas habilidades para robôs que precisam funcionar em ambientes ainda mais desestruturados. Onde pode haver muita irregularidade. O conceito de generalização pelo edifício é uma habilidade interessante porque esse problema é tipicamente muito mais difícil”. Reivindica Anthony Simeonov, um estudante universitário em projeto elétrico, bem como ciência da computação (EECS). Bem como o co-autor principal do artigo.
Simeonov escreveu o artigo com o co-escritor principal Yilun Du, um estudante universitário da EECS; Andrea Tagliasacchi, cientista de pesquisa de pessoal do Google Mind; Joshua B. Tenenbaum, Paul E. Newton Professor de Progresso Ocupacional de Pesquisa Científica Cognitiva e Computação na Divisão da Mente e também Ciências Cognitivas, bem como um membro do Laboratório de Pesquisa em Tecnologia da Computação e Sistemas Especialistas (CSAIL); Alberto Rodriguez, da Turma de 1957 Professor Afiliado da Divisão de Engenharia Mecânica; bem como os autores seniores Pulkit Agrawal, professor do CSAIL, e Vincent Sitzmann, professor auxiliar de entrada no EECS. O estudo de pesquisa existirá na Conferência Internacional de Robótica e também Automação.
Agarrando a geometria
Um robô pode ser treinado para pegar um item de detalhes. No entanto, se esse item estiver deitado de lado (talvez tenha tombado), o robótico vê isso como um cenário totalmente novo. Essa é uma das razões pelas quais é tão difícil para os sistemas de aprendizado de máquina generalizarem para novos alinhamentos de itens.
Para superar esse obstáculo, os cientistas desenvolveram um novo tipo de modelo de rede semântica. Um Campo Descritor Neural (NDF), que descobre a geometria 3D de um curso de itens. O modelo calcula a representação geométrica de um produto de detalhes utilizando uma nuvem de pontos 3D. Que é uma coleção de pontos de dados ou funciona dentro de três dimensões. Os fatores de dados podem ser obtidos de uma câmera de profundidade que oferece detalhes sobre o intervalo entre as coisas. E uma perspectiva. Embora a rede tenha sido aprendida como simulação em um grande conjunto de dados de formas 3D sintéticas, ela pode ser colocada diretamente em coisas do mundo real.
A equipe projetou o NDF com uma propriedade conhecida como equivariância. Com este imóvel residencial ou comercial, se a versão for mostrada uma imagem de um copo na vertical. E depois mostrou uma foto da mesma caneca, de lado. Entende-se que a 2ª caneca coincide com o item, apenas girado.
“Essa equivariância é o que nos permite gerenciar de maneira muito mais eficaz os casos em que o objeto que você observa permanece em algum posicionamento aproximado”, afirma Simeonov.
NDF veio para jogar
À medida que o NDF aprende a reconstruir formas de objetos comparáveis. Ele também descobre como vincular partes associadas desses objetos. Como exemplo, descobre-se que os acordos com canecas são comparáveis, mesmo que alguns copos sejam mais altos ou maiores que outros. Ou tenha negócios menores ou mais longos.
” Se você quisesse fazer isso com outra abordagem, teria que rotular manualmente todos os componentes. Em vez disso, nossa estratégia descobre imediatamente essas partes da reconstrução da forma”, afirma Du.
Os pesquisadores usam esse modelo NDF treinado para ensinar a um robô uma nova habilidade com apenas algumas instâncias físicas. Eles movem a mão do robô para a parte de uma coisa que eles querem segurar. Como a borda de uma tigela ou a tampa de um copo, e também as áreas das pontas dos dedos.
Porque o NDF realmente aprendeu muito sobre geometria 3D e como reconstruir formas. Ele pode inferir a estrutura de uma forma totalmente nova. O que permite que o sistema transfira as apresentações para coisas novas em presentes arbitrários, explica Du.
Escolhendo um vencedor
Eles avaliaram seu projeto em simulações e também em um braço robótico genuíno. Fazendo uso de copos, tigelas e também garrafas como itens. Sua técnica teve uma taxa de sucesso de 85% em tarefas de pegar e colocar. Com itens novinhos em folha, em alinhamentos novinhos em folha. Enquanto a melhor linha de base foi capaz de atingir um preço de sucesso de 45%. Sucesso significa pegar um novo item e posicioná-lo em um local de destino, como pendurar copos em um rack.
Numerosas linhas de base fazem uso de detalhes de fotos 2D em oposição à geometria 3D. O que torna mais difícil para essas técnicas incorporar a equivariância. Esta é uma razão pela qual o método NDF foi realizado muito melhor.
Embora os pesquisadores tenham gostado de seu desempenho, sua abordagem funciona apenas para o grupo de objetos específico no qual é treinado. Um robô instruído a pegar canecas não terá a capacidade de pegar caixas ou fones de ouvido. Porque esses objetos têm funções geométricas que são muito diferentes do que a rede foi treinada.
” No futuro, dimensioná-lo aproximadamente várias categorias. Ou abandonar totalmente o conceito da categoria seria o ideal”, afirma Simeonov.
Eles também pretendem adaptar o sistema para objetos não rígidos. Assim como, a longo prazo, habilitar o sistema a executar trabalhos de pick-and-place quando a área alvo se ajustar.
Este trabalho é apoiado, em parte, pela Agência de Projetos de Pesquisa Avançada de Proteção. A Agência de Ciência e Inovação de Proteção de Cingapura. Assim como a National Science Foundation.
Leia o artigo original no Science Daily .
Relacionado “ Expandir a colaboração humano-robô na fabricação treinando a IA para detectar a intenção humana”
Fonte da história:
Materiais fornecidos pelo Instituto de Tecnologia Moderna de Massachusetts. Originalmente escrito por Adam Zewe. Nota: O conteúdo da Web pode ser modificado para estilo e tamanho.
Relacionado Por que meu gato de estimação me acorda tão cedo e também o que posso fazer a respeito?