Hugging Face Afirma que seu Novo Modelo de Robótica Funciona com Eficiência em um MacBook

Créditos da imagem: Pixabay
Construir projetos avançados de robótica em casa está se tornando cada vez mais simples. Esta semana, a Hugging Face, uma plataforma de desenvolvimento de IA, apresentou o SmolVLA, um modelo de robótica de código aberto.
De acordo com a empresa, o SmolVLA — treinado em conjuntos de dados fornecidos pela comunidade com licenças compatíveis — supera modelos de robótica muito maiores, tanto em cenários simulados quanto reais.
Em uma publicação no blog, a Hugging Face afirma que “o SmolVLA foi projetado para tornar os modelos de visão-linguagem-ação (VLA) mais acessíveis e impulsionar o progresso na robótica de uso geral”. A empresa o descreve não apenas como um modelo compacto, porém poderoso, mas também como uma estrutura para treinamento e avaliação de sistemas robóticos generalistas.
Construindo um Ecossistema de Robótica Acessível
O SmolVLA faz parte da crescente iniciativa da Hugging Face para construir um ecossistema de robótica de baixo custo. No ano passado, a empresa lançou o LeRobot, um conjunto de modelos, conjuntos de dados e ferramentas específicos para robótica. Mais recentemente, a empresa adquiriu a startup francesa Pollen Robotics e lançou diversas plataformas de robótica acessíveis, incluindo robôs humanoides.
A Hugging Face treinou o SmolVLA, modelo de 450 milhões de parâmetros, com dados robóticos da comunidade LeRobot. Parâmetros, também conhecidos como “pesos”, são os elementos internos de um modelo que influenciam seu funcionamento.
A Hugging Face afirma que o SmolVLA roda em uma única GPU de consumidor — ou até mesmo em um MacBook — e permite que os usuários o testem e implantem em hardware de baixo custo, incluindo as plataformas robóticas da própria empresa.
Respostas mais rápidas do robô por meio de processamento assíncrono
Em um recurso notável, o SmolVLA inclui uma “pilha de inferência assíncrona” que, de acordo com a Hugging Face, permite que o modelo lide com as ações de um robô separadamente de sua entrada sensorial — o que ele vê e ouve. Esse design, explica a empresa em uma publicação no blog, permite que os robôs reajam mais rapidamente em ambientes dinâmicos e em rápida mudança.
É importante ressaltar que a Hugging Face não é a única concorrente no emergente espaço da robótica aberta.
A Nvidia oferece seu próprio conjunto de ferramentas de robótica aberta, enquanto a startup K-Scale Labs está desenvolvendo componentes para o que descreve como “humanoides de código aberto”. Outros players notáveis na área incluem a Dyna Robotics, a Physical Intelligence (apoiada por Jeff Bezos) e a RLWRLD.
Leia o Artigo Original TechCrunch
Leia mais Novo Sistema Melhora o Reconhecimento de Expressões Faciais por Máquinas