Hugging Face Afirma que seu Novo Modelo de Robótica Funciona com Eficiência em um MacBook

Hugging Face Afirma que seu Novo Modelo de Robótica Funciona com Eficiência em um MacBook

Créditos da imagem: Pixabay

Construir projetos avançados de robótica em casa está se tornando cada vez mais simples. Esta semana, a Hugging Face, uma plataforma de desenvolvimento de IA, apresentou o SmolVLA, um modelo de robótica de código aberto.

De acordo com a empresa, o SmolVLA — treinado em conjuntos de dados fornecidos pela comunidade com licenças compatíveis — supera modelos de robótica muito maiores, tanto em cenários simulados quanto reais.

Em uma publicação no blog, a Hugging Face afirma que “o SmolVLA foi projetado para tornar os modelos de visão-linguagem-ação (VLA) mais acessíveis e impulsionar o progresso na robótica de uso geral”. A empresa o descreve não apenas como um modelo compacto, porém poderoso, mas também como uma estrutura para treinamento e avaliação de sistemas robóticos generalistas.

Construindo um Ecossistema de Robótica Acessível

O SmolVLA faz parte da crescente iniciativa da Hugging Face para construir um ecossistema de robótica de baixo custo. No ano passado, a empresa lançou o LeRobot, um conjunto de modelos, conjuntos de dados e ferramentas específicos para robótica. Mais recentemente, a empresa adquiriu a startup francesa Pollen Robotics e lançou diversas plataformas de robótica acessíveis, incluindo robôs humanoides.

A Hugging Face treinou o SmolVLA, modelo de 450 milhões de parâmetros, com dados robóticos da comunidade LeRobot. Parâmetros, também conhecidos como “pesos”, são os elementos internos de um modelo que influenciam seu funcionamento.

A Hugging Face afirma que o SmolVLA roda em uma única GPU de consumidor — ou até mesmo em um MacBook — e permite que os usuários o testem e implantem em hardware de baixo custo, incluindo as plataformas robóticas da própria empresa.

Respostas mais rápidas do robô por meio de processamento assíncrono

Em um recurso notável, o SmolVLA inclui uma “pilha de inferência assíncrona” que, de acordo com a Hugging Face, permite que o modelo lide com as ações de um robô separadamente de sua entrada sensorial — o que ele vê e ouve. Esse design, explica a empresa em uma publicação no blog, permite que os robôs reajam mais rapidamente em ambientes dinâmicos e em rápida mudança.

É importante ressaltar que a Hugging Face não é a única concorrente no emergente espaço da robótica aberta.

A Nvidia oferece seu próprio conjunto de ferramentas de robótica aberta, enquanto a startup K-Scale Labs está desenvolvendo componentes para o que descreve como “humanoides de código aberto”. Outros players notáveis ​​na área incluem a Dyna Robotics, a Physical Intelligence (apoiada por Jeff Bezos) e a RLWRLD.


Leia o Artigo Original TechCrunch

Leia mais Novo Sistema Melhora o Reconhecimento de Expressões Faciais por Máquinas

Share this post