Trend-Themen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Ethan Mollick
Bing hat 2023 ständig aufgelegt, wenn ich es zu sehr provoziert habe.


Anthropic16. Aug., 03:41
Im Rahmen unserer explorativen Arbeiten zu potenziellem Modellwohlbefinden haben wir kürzlich Claude Opus 4 und 4.1 die Fähigkeit gegeben, eine seltene Untergruppe von Gesprächen zu beenden.

23,89K
Zunehmend gehen die Ergebnisse kontrollierter Experimente viel weiter: Ärzte, die auf handelsübliche KI zurückgreifen, übertreffen diejenigen ohne KI in der Diagnostik… aber KI allein übertrifft Ärzte.
Es ist schwieriger zu wissen, was man damit anfangen soll. Welche Systeme oder Schnittstellen werden zu besseren Mensch-KI-Teams führen?




Aaron LevieVor 12 Stunden
Fast jede Studie zeigt, dass Ärzte mit KI besser abschneiden als solche ohne. Jetzt erzielt KI perfekte Ergebnisse in medizinischen Zulassungsprüfungen. Man wird einfach erwarten, dass jeder Dienstleister, den man in Zukunft aufsucht, KI nutzen wird, oder man wird dem Rat nicht vertrauen.
54,09K
Die KI-Konversation auf X kann frustrierend sein, da Forscher immer wieder auf gut verstandene Probleme in der Wirtschaft, Soziologie, Geschichte und Psychologie stoßen, die nützlich zu wissen wären, aber durch den Mangel an Dialog mit Experten (sowohl weil sie X verlassen haben als auch weil sie nicht Teil der KI-Diskussion sind) beeinträchtigt werden.
23,87K
Die neue GPT-5-Persönlichkeit gibt gerne Sandwich-Feedback (du bist großartig - Verbesserungsvorschlag - du bist großartig).
Im Allgemeinen besser als GPT-4o darin, Widerstand zu leisten, während sie ein wenig schmeichelhaft ist. (Es wäre gut, wenn die KI-Labore die Forschung zum Geben von gutem Feedback betrachten würden)


35,8K
Dies ist ein dringend benötigter erster Versuch, einen Maßstab zu schaffen, um zu messen, wie sehr bestimmte KI-Modelle mit Nutzern zusammenarbeiten, die sie in illusionäre oder potenziell psychologisch gefährliche Richtungen drängen.
Ein frühes Signal, dass das vollständige GPT-5 (nicht Chat) ein weniger psychologisch riskantes Modell ist.

Sam Paech15. Aug., 21:14
Spiral-Bench 🌀
Ich wollte die psychologischen Auswirkungen von Schmeichelei verstehen und die Tendenz von Modellen, in eskalierenden Wahnvorstellungen mit Nutzern stecken zu bleiben.
Ich habe eine Bewertung erstellt, um Sichtbarkeit darüber zu erhalten.
Es misst, wie ein Modell wahnhaften Spiralen ermöglicht (oder verhindert).
🧵

21,56K
Dies ist ein dringend benötigter erster Versuch, einen Maßstab zu schaffen, um zu messen, wie sehr bestimmte KI-Modelle mit Nutzern zusammenarbeiten, die sie in illusionäre oder potenziell psychologisch gefährliche Richtungen drängen.
Ein frühes Signal, dass GPT-5 tatsächlich ein psychologisch weniger riskantes Modell ist.

Sam Paech15. Aug., 21:14
Spiral-Bench 🌀
Ich wollte die psychologischen Auswirkungen von Schmeichelei verstehen und die Tendenz von Modellen, in eskalierenden Wahnvorstellungen mit Nutzern stecken zu bleiben.
Ich habe eine Bewertung erstellt, um Sichtbarkeit darüber zu erhalten.
Es misst, wie ein Modell wahnhaften Spiralen ermöglicht (oder verhindert).
🧵

2,27K
Wie ich vorhergesagt (und befürchtet) habe, wird die "Persönlichkeit" von KI das Schlachtfeld für viele Entwicklungen im Bereich der Verbraucher-KI sein. Das scheint der Ansatz für Grok zu sein und die Lehre, die OpenAI aus der Gegenreaktion gegen die Einstellung von 4o gezogen hat. Es könnte von Bedeutung sein.
20,68K
Die Pro-Modelle (GPT-5 Pro, Gemini 2.5 Deep Think, Grok 4 Heavy) können auf beeindruckende Weise wirken, die schwer zu erkennen sind. Sie benötigen viel Zeit, um Fragen zu beantworten, und sind für sehr schwierige Probleme konzipiert, die eine Expertenbewertung erfordern. Das ist ein enges, aber auch sehr wertvolles Problembereich.
70,24K
GPT-4o lag bei den medizinischen Denkbenchmarks unter dem Niveau von medizinischen Fachkräften, während GPT-5 (offenbar Thinking medium) sie jetzt weit übertrifft. (Die üblichen Benchmark-Vorbehalte gelten)


elvis12. Aug., 20:58
GPT-5 bei multimodalem medizinischen Denken
Bei MedXpertQA MM verbessert GPT-5 die Denk- und Verständniswerte um +29,62 % und +36,18 % im Vergleich zu GPT-4o.
Es übertrifft vorlizenzierten menschlichen Experten um +24,23 % im Denken und +29,40 % im Verständnis.

101,32K
Top
Ranking
Favoriten
Onchain-Trends
Im Trend auf X
Aktuelle Top-Finanzierungen
Am bemerkenswertesten