HealthBench: Novo padrão da OpenAI para avaliar IA na saúde

Publicado por

Isabella Caminoto

13 de maio de 2025 14:16

A OpenAI lançou o HealthBench, um benchmark criado com 262 médicos para avaliar o desempenho de sistemas de inteligência artificial (IA) em conversas sobre saúde – e estabelecer um novo padrão para medir a segurança e a eficácia da IA em contextos médicos.

Detalhes do HealthBench

O benchmark testa modelos em diversos temas (como encaminhamentos de emergência e saúde global) e comportamentos (precisão, qualidade da comunicação, etc.).
Modelos recentes apresentaram desempenho muito melhor no benchmark, com o o3 da OpenAI marcando 60% em comparação com os 16% do GPT-3.5 Turbo.
Os resultados também revelaram que modelos menores agora são muito mais capazes, com o GPT-4.1 Nano superando opções mais antigas e sendo 25 vezes mais barato.
A OpenAI tornou de código aberto tanto as avaliações quanto o conjunto de dados de teste de 5.000 conversas de saúde realistas e de múltiplas turnos entre modelos e usuários.

Por que isso é importante

Há uma quantidade esmagadora de evidências de que a IA pode proporcionar melhorias significativas em todos os aspectos em ambientes de saúde, e ter benchmarks validados por médicos é um passo importante tanto para medir o desempenho de cada modelo em contextos médicos quanto para decidir quando e como implantá-los.

Leia também:

IA prevê resultados de câncer a partir de fotos; veja como

Este post foi modificado pela última vez em 13 de maio de 2025 14:18

Isabella Caminoto

Advogada e mestranda em Direito Internacional, tenho a democracia e a liberdade como bandeiras irrenunciáveis. Sou apaixonada pelos animais e acredito que o bem-estar do nosso planeta deveria ser o destaque diário da pauta da nossa sociedade.

Próximo Apple anuncia pacote de novos recursos de acessibilidade ainda para 2025 »

Anterior « Google enfrenta ações judiciais multibilionárias na Europa

Publicado por

Isabella Caminoto

Tags: HealthBenchinteligência artificialOpenAIsaúde

13 de maio de 2025 14:16

Posts recentes

Inteligência Artificial

OMS reúne 37 países para definir regras globais sobre inteligência artificial na saúde

A Organização Mundial da Saúde reuniu ministros, autoridades governamentais e especialistas de 37 países em…

15 de julho de 2026

Inteligência Artificial

IA promete eficiência na saúde, mas Harvard alerta para risco de desumanização do cuidado

A inteligência artificial (IA) já começa a transformar hospitais, consultórios e sistemas de saúde, assumindo…

10 de julho de 2026

Inteligência Artificial

GPT-5.6: OpenAI apresenta sua IA mais poderosa, mas restringe acesso a poucos parceiros

A OpenAI apresentou oficialmente o GPT-5.6, sua mais nova geração de modelos de inteligência artificial…

29 de junho de 2026

Inteligência Artificial

OpenAI entra na guerra dos chips e desafia Nvidia e Google na corrida pela infraestrutura da IA; conheça o Jalapeño

A OpenAI deu um passo que pode redefinir o equilíbrio de poder no setor de…

25 de junho de 2026

Inteligência Artificial

OpenAI ajuda a desvendar doenças raras infantis e dá nova esperança a casos sem diagnóstico

Um dos maiores desafios da medicina moderna está nos chamados "casos sem resposta": pacientes que…

23 de junho de 2026

Inteligência Artificial

Argentina quer criar empresas comandadas por IA — e acende debate global sobre responsabilidade e poder

A Argentina deu um passo inédito na corrida global pela inteligência artificial (IA). O governo…

22 de junho de 2026

HealthBench: Novo padrão da OpenAI para avaliar IA na saúde

Detalhes do HealthBench

Por que isso é importante

Posts relacionados

Posts recentes

OMS reúne 37 países para definir regras globais sobre inteligência artificial na saúde

IA promete eficiência na saúde, mas Harvard alerta para risco de desumanização do cuidado

GPT-5.6: OpenAI apresenta sua IA mais poderosa, mas restringe acesso a poucos parceiros

OpenAI entra na guerra dos chips e desafia Nvidia e Google na corrida pela infraestrutura da IA; conheça o Jalapeño

OpenAI ajuda a desvendar doenças raras infantis e dá nova esperança a casos sem diagnóstico

Argentina quer criar empresas comandadas por IA — e acende debate global sobre responsabilidade e poder