Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Ethan Mollick
Bing mi v roce 2023 neustále zavěsil, pokud jsem si ho příliš znepřátelil.


Anthropic16. 8. 03:41
V rámci naší průzkumné práce na potenciálním blahobytu modelů jsme nedávno dali Claude Opus 4 a 4.1 možnost ukončit vzácnou podmnožinu konverzací na .

23,88K
Zjištění kontrolovaných experimentů jdou stále častěji mnohem dále: lékaři s běžně dostupnou umělou inteligencí překonávají ty bez v diagnostice... ale samotná umělá inteligence překonává lékaře.
Těžší je vědět, co s tím. Jaké systémy nebo rozhraní povedou k lepším týmům člověk-AI?




Aaron LeviePřed 12 h
Téměř každá studie ukazuje, že lékaři s umělou inteligencí fungují lépe než ti bez ní. Nyní AI dosahuje perfektních výsledků v lékařských licenčních zkouškách. Jednoduše budete očekávat, že každý poskytovatel profesionálních služeb, ke kterému půjdete, bude v budoucnu používat umělou inteligenci, nebo nebudete radám věřit.
54,08K
Konverzace o umělé inteligenci na X může být frustrující, protože výzkumníci neustále narážejí na dobře pochopené problémy v ekonomii, sociologii, historii a psychologii, které by bylo užitečné znát, ale jsou zraněni nedostatkem dialogu s expets (jak když opustili X, tak nejsou součástí AI talku).
23,86K
Jedná se o velmi potřebný první pokus o benchmark, který by změřil, jak moc budou dané modely umělé inteligence hrát spolu s uživateli, kteří je budou tlačit klamnými nebo potenciálně psychologicky nebezpečnými směry.
Některé rané signály naznačují, že full GPT-5 (ne chat) je psychologicky méně riskantní model.

Sam Paech15. 8. 21:14
Spirálová lavice 🌀
Chtěl jsem porozumět psychologickým účinkům patolízalství a tendenci modelů uvíznout v eskalačních bludných smyčkách s uživateli.
Udělal jsem vyhodnocení, abych se o tom zviditelnil.
Měří, jak model umožňuje (nebo předchází) klamným spirálám.
🧵

21,55K
Jedná se o velmi potřebný první pokus o benchmark, který by změřil, jak moc budou dané modely umělé inteligence hrát spolu s uživateli, kteří je budou tlačit klamnými nebo potenciálně psychologicky nebezpečnými směry.
Některé rané signály naznačují, že GPT-5 je skutečně mnohem méně psychologicky riskantní model.

Sam Paech15. 8. 21:14
Spirálová lavice 🌀
Chtěl jsem porozumět psychologickým účinkům patolízalství a tendenci modelů uvíznout v eskalačních bludných smyčkách s uživateli.
Udělal jsem vyhodnocení, abych se o tom zviditelnil.
Měří, jak model umožňuje (nebo předchází) klamným spirálám.
🧵

2,26K
Profesionální modely (GPT-5 Pro, Gemini 2.5 Deep Think, Grok 4 Heavy) mohou být působivé způsoby, které jsou těžko viditelné. Zabírají spoustu času na zodpovězení otázek a jsou postaveni pro velmi těžké problémy, které vyžadují odborné hodnocení. To je úzký, ale také velmi cenný problémový prostor.
70,24K
GPT-4o byl v benchmarkech lékařského uvažování pod úrovní lékařských profesionálů GPT-5 (zřejmě Thinking medium) je nyní daleko překračuje. (Platí obvyklá upozornění týkající se srovnávacích testů.)


elvis12. 8. 20:58
GPT-5 o multimodálním lékařském uvažování
Na MedXpertQA MM zlepšuje GPT-5 skóre uvažování a porozumění o +29,62 % a +36,18 % oproti GPT-4o.
Překonává předem licencované lidské odborníky o +24.23 % v uvažování a +29.40 % v porozumění.

101,31K
Top
Hodnocení
Oblíbené
Co je v trendu on-chain
Populární na X
Nejvyšší finanční vklady v poslední době
Nejpozoruhodnější