OpenAI Apresenta Novas Ferramentas para Empresas Desenvolverem Agentes de IA

Crédito: Depositphotos
Na terça-feira, a OpenAI revelou novas ferramentas destinadas a ajudar desenvolvedores e empresas a criar agentes de IA — sistemas automatizados capazes de executar tarefas de forma independente — usando os modelos e estruturas de IA da empresa.
Essas ferramentas fazem parte da nova API Responses da OpenAI, que permite que as empresas desenvolvam agentes de IA personalizados que podem conduzir pesquisas na web, escanear arquivos internos e navegar em sites, semelhante ao produto Operator da OpenAI. A API Responses substitui a API Assistants, que a OpenAI planeja eliminar gradualmente até meados de 2026.
Os Obstáculos da Autonomia da IA
Apesar do crescente entusiasmo em torno dos agentes de IA, a indústria tem lutado para definir ou demonstrar claramente seu valor prático. Um exemplo recente é a plataforma Manus da startup chinesa Butterfly Effect, que se tornou viral, mas não atendeu às expectativas de muitos usuários, destacando os desafios de fornecer IA verdadeiramente autônoma.
A OpenAI visa superar esses obstáculos. “É muito fácil demonstrar seu agente”, disse Olivier Godemont, chefe de produto de API da OpenAI, em uma entrevista ao TechCrunch. “Escalar um agente é bem difícil, e fazer com que as pessoas o usem com frequência é muito difícil.”
No início deste ano, a OpenAI introduziu dois agentes de IA no ChatGPT: Operator, que navega em sites, e Deep Research, que compila relatórios de pesquisa. Embora essas ferramentas apresentassem recursos de agente, elas não tinham autonomia total.
Com a Responses API, a OpenAI agora oferece às empresas acesso aos principais componentes por trás de seus agentes de IA, permitindo que os desenvolvedores criem seus próprios aplicativos que podem superar as soluções atuais em autonomia e usabilidade.
Com a Responses API, os desenvolvedores podem acessar os mesmos modelos de IA que alimentam a ferramenta ChatGPT Search da OpenAI: GPT-4o search e GPT-4o mini search. Esses modelos podem navegar na web em busca de respostas, citando fontes à medida que geram respostas.
A OpenAI afirma que esses modelos são altamente precisos. Em seu benchmark SimpleQA, que avalia respostas a perguntas baseadas em fatos, a pesquisa GPT-4o pontua 90%, enquanto a mini pesquisa GPT-4o pontua 88% — superando o GPT-4.5 lançado recentemente, que pontua apenas 63%.
Limitações da Pesquisa com Tecnologia de IA
As ferramentas de pesquisa com tecnologia de IA geralmente superam os modelos tradicionais de IA em precisão, pois podem pesquisar informações diretamente. No entanto, elas ainda enfrentam certos desafios, incluindo alucinações e dificuldades com consultas curtas de navegação como “Lakers pontuam hoje”. Os relatórios também sugerem que as citações do ChatGPT nem sempre são confiáveis.
A API de respostas também apresenta um utilitário de pesquisa de arquivos que recupera rapidamente informações dos bancos de dados de uma empresa. O OpenAI garante que esses arquivos não serão usados para treinamento de modelos. Além disso, os desenvolvedores podem integrar o modelo Computer-Using Agent (CUA) do OpenAI, que alimenta a ferramenta Operator. Este modelo gera ações de mouse e teclado, permitindo a automação de tarefas como entrada de dados e gerenciamento de fluxo de trabalho.
Modelo CUA
As empresas podem escolher executar o modelo CUA localmente em seus sistemas, pois ele está sendo lançado em uma prévia de pesquisa. No entanto, a versão do consumidor disponível no Operator é limitada a ações baseadas na web.
Apesar desses avanços, a API Responses não elimina todos os obstáculos técnicos em agentes de IA. A pesquisa GPT-4o ainda fornece respostas incorretas 10% das vezes, e a OpenAI reconhece que seu modelo CUA ainda não é totalmente confiável para automatizar tarefas do sistema operacional, pois pode cometer erros não intencionais.
Para dar suporte aos desenvolvedores, a OpenAI também está lançando o Agents SDK, um kit de ferramentas de código aberto que ajuda a integrar modelos de IA com sistemas internos, implementar salvaguardas e monitorar o comportamento do agente para depuração e otimização. O SDK se baseia na estrutura Swarm da OpenAI, lançada no ano passado para orquestração de vários agentes.
O líder de produto de API da OpenAI, Olivier Godemont, acredita que este ano será crucial para transformar agentes de IA de demonstrações em ferramentas práticas. O CEO Sam Altman previu de forma semelhante que 2025 será o ano em que os agentes de IA entrarão na força de trabalho. Se essa visão se materializará, ainda não se sabe, mas os últimos lançamentos da OpenAI sinalizam uma mudança para tornar os agentes de IA mais funcionais e impactantes.
Leia o Artigo Original TechCrunch
Leia mais Um Ano Depois, a OpenAI ainda não lançou a sua Ferramenta de Clonagem de Voz
Deixe um comentário