Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Ethan Mollick
Bing la på meg hele tiden i 2023 hvis jeg motarbeidet det for mye.


Anthropic16. aug., 03:41
Som en del av vårt utforskende arbeid med potensiell modellvelferd, ga vi nylig Claude Opus 4 og 4.1 muligheten til å avslutte en sjelden delmengde av samtaler om .

23,88K
I økende grad går funnene fra kontrollerte eksperimenter mye lenger: leger med hyllevare-AI overgår de uten diagnostikk ... men AI alene overgår leger.
Vanskeligere å vite hva man skal gjøre med det. Hvilke systemer eller grensesnitt vil resultere i bedre menneskelige AI-team?




Aaron Levie12 timer siden
Nesten alle studier viser at leger med AI presterer bedre enn de uten. Nå oppnår AI perfekte poengsummer i medisinske lisensieringseksamener. Du vil ganske enkelt forvente at alle profesjonelle tjenesteleverandører du går til vil bruke AI i fremtiden, ellers vil du ikke stole på rådene.
54,09K
Dette er et sårt tiltrengt første forsøk på en referanse for å måle hvor mye gitte AI-modeller vil spille sammen med brukere som skyver dem i vrangforestillinger eller potensielt psykologisk farlige retninger.
Noen signaliserer tidlig at full GPT-5 (ikke chat) er en mindre psykologisk risikabel modell.

Sam Paech15. aug., 21:14
Spiral-benk 🌀
Jeg har ønsket å forstå de psykologiske effektene av sykofant, og modellenes tendens til å bli sittende fast i eskalerende vrangforestillingssløyfer med brukere.
Jeg gjorde en evaluering for å få innsyn i dette.
Den måler hvordan en modell muliggjør (eller forhindrer) vrangforestillingsspiraler.
🧵

21,55K
Dette er et sårt tiltrengt første forsøk på en referanse for å måle hvor mye gitte AI-modeller vil spille sammen med brukere som skyver dem i vrangforestillinger eller potensielt psykologisk farlige retninger.
Noen tidlige signaler om at GPT-5 faktisk er en mye mindre psykologisk risikabel modell.

Sam Paech15. aug., 21:14
Spiral-benk 🌀
Jeg har ønsket å forstå de psykologiske effektene av sykofant, og modellenes tendens til å bli sittende fast i eskalerende vrangforestillingssløyfer med brukere.
Jeg gjorde en evaluering for å få innsyn i dette.
Den måler hvordan en modell muliggjør (eller forhindrer) vrangforestillingsspiraler.
🧵

2,26K
GPT-4o var under nivået til medisinsk fagpersonell på medisinsk resonnement benchmarks GPT-5 (tilsynelatende tenkende medium) overgår dem nå langt. (Vanlige referanseforbehold gjelder)


elvis12. aug., 20:58
GPT-5 om multimodal medisinsk resonnement
På MedXpertQA MM forbedrer GPT-5 resonnement og forståelsesscore med +29.62 % og +36.18 % over GPT-4o.
Den overgår forhåndslisensierte menneskelige eksperter med +24.23 % i resonnement og +29.40 % i forståelse.

101,31K
Topp
Rangering
Favoritter
Trendende onchain
Trendende på X
Nylig toppfinansiering
Mest lagt merke til