ChatGPT Aprimora seus Recursos de Geração de Imagens

Créditos da imagem: Silas Stein / picture alliance / Getty Images
Durante uma transmissão ao vivo na terça-feira, o CEO da OpenAI, Sam Altman, anunciou a primeira grande atualização dos recursos de geração de imagens do ChatGPT em mais de um ano.
Modelo GPT-4o
Agora, o ChatGPT pode usar o modelo GPT-4o para criar e editar imagens diretamente. Embora o GPT-4o tenha alimentado o chatbot da OpenAI por muito tempo, ele anteriormente lidava apenas com tarefas baseadas em texto.
Altman afirmou que o recurso de geração de imagens do GPT-4o agora está disponível no ChatGPT e no Sora, a ferramenta de vídeo de IA da OpenAI, para assinantes do plano Pro de US$ 200 por mês da empresa. O recurso será expandido em breve para usuários do ChatGPT Plus e de nível gratuito, bem como desenvolvedores que usam a API da OpenAI.
Precisão de Imagem Aprimorada e Recursos de Edição
http://DALL-E 3GPT-4o leva um pouco mais de tempo para gerar imagens do que o DALL-E 3, o modelo que ele substitui, mas a OpenAI afirma que produz visuais mais detalhados e precisos. Ele também pode editar imagens existentes, incluindo aquelas com pessoas, alterando elementos ou “pintando” detalhes como objetos de primeiro e segundo plano.
Para desenvolver esse recurso, a OpenAI disse ao Wall Street Journal que treinou o GPT-4o usando dados disponíveis publicamente e conteúdo proprietário de parcerias com empresas como a Shutterstock.
As empresas de IA generativa geralmente tratam seus dados de treinamento como um ativo competitivo essencial, mantendo os detalhes bem guardados. Além disso, preocupações com disputas de propriedade intelectual servem como outro motivo para as empresas limitarem as divulgações.
“Respeitamos os direitos dos artistas em como geramos resultados e temos políticas em vigor para impedir a criação de imagens que reproduzam de perto o trabalho de artistas vivos”, disse o COO da OpenAI, Brad Lightcap, ao Wall Street Journal.
Controle do Criador e Medidas de Privacidade de Dados
A OpenAI fornece um formulário de opt-out que permite que os criadores solicitem a remoção de suas obras de seus conjuntos de dados de treinamento. A empresa também declara que atende às solicitações para bloquear seus bots de web-scraping de coletar dados de treinamento, incluindo imagens, de sites.
O recurso de geração de imagem atualizado no ChatGPT vem logo após o Google introduzir a saída de imagem nativa experimental em seu modelo Gemini 2.0 Flash. O recurso rapidamente ganhou atenção nas mídias sociais, embora nem tudo fosse positivo. A ferramenta de imagem do Gemini 2.0 Flash tinha proteções mínimas, permitindo que os usuários removessem marcas d’água e gerassem imagens com caracteres protegidos por direitos autorais.
Este artigo foi atualizado às 12h PT para incluir a declaração da OpenAI ao Wall Street Journal sobre os dados de treinamento do GPT-4o.
Leia o Artigo Original TechCrunch
Leia mais ChatGPT Duplicou o Número de Utilizadores Semanais em Menos de Seis Meses Devido a Actualizações
Deixe um comentário