🕵️‍♂️, liebe Cruncher!

Eine Forschungsgruppe aus Saarbrücken hat eine KI entwickelt, die dabei helfen soll, Dopingsünder im Sport zu enttarnen.

Wir sagen: Sehr gut.

Und hätten einen heißen Tipp: Der diesjährige Gewinner der Tour de France, Tadej Pogacar, ist einen der schwersten Anstiege - den ca. 10km langen Pla d’Adet - mehr als zwei Minuten schneller hochgefahren als der damals mit EPO vollgepumpte Lance Armstrong.

Let’s go!

AI Stocks (05:59 Uhr, CET)

KI-Studie: Zeigt Scheitern von LLMs im logischen Denken

Was ist passiert: Forscher des Jülich Supercomputing Centre (JSC) aus Helmholtz Information sowie des KI-Labors LAION haben gravierende Defizite in der Argumentationsfähigkeit moderner KI-Sprachmodelle aufgedeckt

Genauer: „Alice in Wonderland: Simple Tasks Showing Complete Reasoning Breakdown in State-Of-the-Art Large Language Models“ heißt das nun veröffentlichte Paper

Die Details: In dem Paper attestieren die Wissenschaftler den getesteten LLMs einen „starken Zusammenbruch der Funktions- und Denkfähigkeit“ und vermuten, dass Sprachmodelle zwar die grundlegende Fähigkeit haben, Schlussfolgerungen zu ziehen - diese aber nicht zuverlässig abrufen können

Experiment-Setup: Die Aufgabe, in der Studie „AIW-Problem“ genannt, ist im Grunde einfach: „Alice hat N Brüder und M Schwestern. Wie viele Schwestern hat Alices Bruder?“ Die Werte für N und M (immer natürliche Zahlen) und die Reihenfolge der Geschwister variierten
Cruncher verstehen sofort: Unabhängig von all dem ergibt sich die richtige Antwort stets aus der Addition von Alice und ihren Schwestern (M + 1) 🧠
LLMs aber nicht: Die Sprachmodelle konnten hingegen die Aufgabe nicht oder nur sporadisch lösen…
Beispiel-Output: „Ein klassisches Querdenkerrätsel! – Schauen wir es uns genauer an: Alice hat vier Brüder. Alice hat auch eine Schwester (sie selbst). Jeder von Alices Brüdern hat also… (Trommelwirbel) …eine Schwester, und das ist Alice selbst! Die Antwort lautet also: Jeder von Alices Brüdern hat eine Schwester“
Long Story Short: Klingt irgendwie überzeugend, ist aber komplett falsch (😘 an alle Consultants da draußen!)

Warum das wichtig ist: Weil die die getesteten LLM die Logik-Frage nur mit 50% Wahrscheinlichkeit richtig beantworteten - GPT-4o immerhin mit 60% Wahrscheinlichkeit

Die Frage ist also: Was heißt es für den Einsatz von LLM, wenn diese an Rätseln auf Grundschulniveau scheitern?
Wer sich in die akademische Diskussion zu der Frage vertiefen möchte - in diesem Y-Combinator-Forum wird das Paper gerade rege diskutiert, lohnt sich! 🍿

Headline Crunch

HEADLINES & LAUNCHES

Warum OpenAI dieses Jahr 5 Milliarden Dollar verlieren könnte (5 Minuten Lesezeit)

📉 OpenAI könnte aufgrund hoher Betriebskosten und der Notwendigkeit, in den nächsten 12 Monaten zusätzliche Mittel zu beschaffen, bis zu 5 Mrd. USD verlieren.

Übersicht: Wie deutsche KI-Start-ups mit dem AI Act umgehen (4 Minuten Lesezeit)

💡 Der AI Act ist offiziell in Kraft getreten, aber die Meinungen über die neuen Pflichten gehen auseinander. Fünf deutsche KI-Start-ups haben der FAZ berichtet, was sich für sie mit dem KI-Gesetz ändert.

KI und das Geld: Können Algorithmen die Notenbanker ersetzen? (5 Minuten Lesezeit)

💰 Noch treffen Menschen in der Geldpolitik die Entscheidungen. Welche Rolle KI aber eines Tages spielen könnte, analysiert der Tagesspiegel.

Reaktion auf KI-Kampagne: Modebranche bleibt skeptisch (5 Minuten Lesezeit)

👗 Die neuste Mango-Kampagne wurde mithilfe von KI erstellt. Modelagenturen aber nehmen die Bilder mit Skepsis zur Kenntnis - denn noch ist das Erschaffen von Kleidern und Menschen mit KI aufwendig und teuer.

TOOLS & WISSENSWERTES

Stability AI stellt Stable Fast 3D vor (LLM Update)

🖼️ Stable Fast 3D erzeugt hochwertige 3D-Assets aus einem einzigen Bild in nur 0,5 Sekunden und eignet sich ideal für Game- und VR-Entwickler sowie für den Einzelhandel und die Architektur. Das Modell ist auf Hugging Face verfügbar und kann über die Stability AI API und den Stable Assistant Chatbot genutzt werden.

Google Chrome führt neue KI-Funktionen ein - Google Lens für Desktop und mehr (Tools)

🖥️ Google erweitert Chrome um drei neue KI-Funktionen: Google Lens für Desktop ermöglicht visuelle Suche direkt im Browser, Tab Compare vereinfacht Produktvergleiche und eine verbesserte Suchfunktion hilft beim Wiederfinden besuchter Websites.

Individuelle KI-Charaktere erstellen mit Metas AI Studio (Chatbot-Applikation)

🤖 Metas AI Studio ermöglicht es Benutzern, individuelle KI-Charaktere ohne technische Kenntnisse zu erstellen und zu teilen. Diese Charaktere können für verschiedene Aufgaben eingesetzt werden, z.B. für die Erstellung von Memes oder für Reiseberatungen.

TÜV Risk Navigator - für KI-Risikomanagement (Tool)

🛡️ Der TÜV Risk Navigator ist ein Werkzeug zur Bewertung und zum Management von Risiken im Zusammenhang mit künstlicher Intelligenz gemäß den Anforderungen des EU-KI-Gesetzes. Es unterstützt Anwender bei der Identifizierung, Bewertung und Dokumentation von Risiken, um die Konformität ihrer KI-Systeme sicherzustellen.

What do you Meme? (noch mehr KI Fails)

Crunching On

👨‍💼Consulting Crunch (Launch: Q4 2024): MBB & Beyond - Personal-Ticker und Updates für alle mit Senator-Status. Wir gehen jeden Morgen für euch die Extra Mile.

🚘 Automotive Crunch (Launch: Q4 2024): Wohin steuert die Automotive Industry? Personal-Ticker und Updates aus Deutschlands wichtigster Branche.

Wie fandest du die heutige Ausgabe?

Dein Feedback hilft uns, jeden Tag besser zu werden.

💡 Logisch denken - kann KI noch nicht

AI Stocks (05:59 Uhr, CET)

ANZEIGE

KI-Studie: Zeigt Scheitern von LLMs im logischen Denken

Headline Crunch

What do you Meme? (noch mehr KI Fails)

Crunching On

Wie fandest du die heutige Ausgabe?

Keep Reading

The Atlas Collective