Durante sua grande transmissão ao vivo do GPT-5 na quinta-feira, o Openai mostrou algumas paradas que fizeram o modelo parecer bastante impressionante-mas se você olhar de perto, alguns gráficos estavam um pouco fora.
Em um, mostrando ironicamente o quão bem o GPT-5 em “Evalas de decepção entre os modelos”, a escala está em todo o lugar. Para “codificação decepção”, por exemplo, o gráfico mostrado no palco diz que o GPT-5 com o pensamento aparentemente recebe uma taxa de engano de 50,0 %, mas isso é comparado à menor pontuação de 47,4 % do OpenAI, que de alguma forma possui uma barra maior. O OpenAI parece ter números precisos para este gráfico em sua postagem no blog GPT-5, no entanto, onde a taxa de engano do GPT-5 é rotulada como 16,5 %.
Com este gráfico, o OpenAI mostrou no palco que uma das pontuações do GPT-5 é mais baixo do que O3, mas é mostrado com um bar maior. Nesse mesmo gráfico, as pontuações do O3 e do GPT-4O são diferentes, mas mostradas com barras de tamanho igual. Foi ruim o suficiente que o CEO Sam Altman tenha comentado, chamando -o de “mega parafuso de gráfico”, embora ele tenha notado que uma versão correta está no post do Openai.
Um funcionário de marketing do Openai também pediu desculpas, dizendo: “Consertamos o gráfico no blog, desculpando o crime não intencional do gráfico”.
O Openai não respondeu imediatamente a um pedido de comentário. E embora não esteja claro se o OpenAI usou o GPT-5 para realmente fazer as paradas, ainda não é uma ótima aparência para a empresa em seu grande dia de lançamento-especialmente quando está divulgando os “avanços significativos na redução de alucinações” com seu novo modelo.
Fonte: As informações são do The Verge, site especializado em tecnologia
É uma publicação focada em tecnologia e seu impacto cultural.
Acompanhe os Bastidores da Política no WhatsApp
Receba, em primeira mão, as análises e bastidores do Blog do Esmael direto no seu WhatsApp.
Entrar no Canal do WhatsApp