GPT-4o era al di sotto del livello dei professionisti medici nei benchmark di ragionamento medico, mentre GPT-5 (apparentemente Thinking medium) ora li supera di gran lunga. (Si applicano le solite avvertenze sui benchmark)
elvis
elvis12 ago, 20:58
GPT-5 sul Ragionamento Medico Multimodale Su MedXpertQA MM, GPT-5 migliora i punteggi di ragionamento e comprensione del +29,62% e del +36,18% rispetto a GPT-4o. Supera gli esperti umani pre-licenziati del +24,23% nel ragionamento e del +29,40% nella comprensione.
101,34K