• AI Crunch
  • Posts
  • #27 Googles neue Modelle und Reasoning-Modell für <$50 aus Stanford

#27 Googles neue Modelle und Reasoning-Modell für <$50 aus Stanford

⛪️, liebe Cruncher!

Wer die Kölner Seele kennen will, muss den Kölner Stadtanzeiger lesen. Der verdaut nämlich die schmerzliche Fußball-Niederlage gegen Leverkusen mit etwas Realitätsflucht – und bittet Midjourney, ihm das Köln in 50 Jahren zu zeigen.

Wir wünschen gutes Wochenende und allen Kölnern unter euch gute sportliche und seelische Erholung 🙏

before the bell

*Stand: Vortag, 22 Uhr – was diese Zahlen bedeuten 📊

big tech

Google: Veröffentlicht neue Gemini-Modelle

Was ist passiert? Google hat das neue Gemini 2.0 Pro Experimental veröffentlicht – das bislang leistungsfähigste Modell der Gemini-Familie

Die Details: Gemini 2.0 Flash Thinking wurde darauf trainiert, komplexe Fragen in mehrere Schritte zu zerlegen, um bessere Antworten zu liefern

  • Gigantischer Kontext: Gemini 2.0 Pro kann mit 2 Mio. Tokens arbeiten – bedeutet, es kann eine Anfrage mit etwa 1,5 Mio. Wörter auf einmal verarbeiten

  • Besser gesagt: Man könnte mit dem Modell die komplette Harry Potter-Reihe einlesen und es um eine Zusammenfassung bitten – frühere Modelle wie GPT-4 Turbo schaffen nur den Stein der Weisen

  • Code & Web-Integration: Gemini 2.0 Pro kann nicht nur programmieren, sondern für User auch die Google-Suche nutzen und eigenständig Code ausführen

  • Kosteneffiziente Variante: Mit Gemini 2.0 Flash-Lite bietet Google jetzt eine abgespeckte, aber leistungsstärkere Alternative zum Gemini 1.5 Flash – zum gleichen Preis

Warum das wichtig ist: DeepSeeks R1-Modell hatte bei KI-Reasoning-Tests für Furore gesorgt – aber Google zeigt mit Flash Thinking, was es noch in der Pipeline hat

  • Denn: Das Unternehmen bietet eine schnelle KI für die Handy-App und ein Spitzenmodell für Logikaufgaben

  • Heißt: Es stellt sich mit Flash-Lite der Konkurrenz aus China und mit Gemini 2.0 Pro auch OpenAI, das diese Woche sein Deep Research-Modell veröffentlichte

big bets

s1: Stanford-Forscher entwickeln Reasoning-Modell für nur $50 

Was ist passiert? Ein Team von Wissenschaftlern der Stanford University und der University of Washington hat für weniger als $50 ein KI-„Reasoning“-Modell namens s1 trainiert – und es performt fast so gut wie OpenAIs o1 und DeepSeeks R1 

Die Details: Statt Millionen Dollar für das Training auszugeben, nutzten die Forscher eine „Destillations-Methode”, um die Prozesse von Googles Modell Gemini 2.0 Flash Thinking Experimental zu kopieren

  • Die Destillation: Die Wissenschaftler fütterten das Modell mit nur 1.000 gezielt ausgewählten Fragen und dem detaillierten Prozess, mit dem Googles Modell sie beantwortet

  • Effizienz-Hack: Das Training war in unter 30 Minuten abgeschlossen und lief auf 16 NVIDIA H100 GPUs – geliehen von einer Cloud-Computing-Plattform für $50

  • Top-Performance: Bei Mathematik- und Coding-Aufgaben ist s1 fast so gut wie OpenAIs o1 und DeepSeeks R1

Warum das wichtig ist? Wenn Open-Source-Teams die Fähigkeiten teuer entwickelter Modelle immer schneller nachbilden können, gerät das Geschäftsmodell von Firmen wie OpenAI unter Druck 

  • Patentkrieg vorprogrammiert: OpenAI beschuldigte DeepSeek bereits, seine Daten für eine Destillation missbraucht zu haben – weitere Streits werden folgen

  • Die Schattenseite: Destillation hilft, bestehende Modelle günstig zu reproduzieren – sie schafft aber keine echten KI-Innovationen, diese dürften weiterhin Milliardeninvestitionen erfordern

3 top reads

  • SAP: Stellt wohl bald neue KI-Plattform vor

    📊 Wollen Firmen via KI Aufgaben automatisieren, müssen sie mit erheblichem Aufwand ihre Daten aufbereiten. Hier setzt Software-Riese SAP wohl bald mit einem eigenen Produkt an – doch der Markt ist hart umkämpft. (HB)

  • KI im Wahlkampf: Rechts, weiblich, fake

    ⚠️ Profile von vermeintlich jungen Frauen mischen im Wahlkampf mit. Sie äußern sich politisch eher rechts und geben an, die AfD bei der Bundestagswahl zu wählen. Das Problem: Sie sind KI-generiert. (TAG)

  • Bundesministerium: Präsentiert “Marktplatz der KI-Möglichkeiten”

    🔎 Das Bundesministerium des Innern und für Heimat hat den „Marktplatz der KI-Möglichkeiten“ eingeführt, eine zentrale Plattform für die Vernetzung von KI-Systemen in der Bundesverwaltung – mit dem Ziel, KI-Ressourcen und -Expertise effizient zu nutzen. Wir sagen: Super, faxt uns die Details. (BMI)

watchlist

insights 💡

  • Australien: Verbietet China-KI DeepSeek auf Regierungsgeräten – wegen Spionageverdacht (BIL)

  • Anthropic: KI-Unternehmen verbietet KI-geschriebene Bewerbungen (HEI)

  • EU-Kommission: Will bis zu €54 Mrd. in EU-KI stecken (HB)

  • DeepSeek: Wächst weiter rasant in den App-Charts (LI)

  • OpenAI: Nutzte Subreddit zur Optimierung von KI-Überzeugungskraft (TC)

tools 🔧

  • Chain-of-Agents: LLMs für komplexe Aufgaben mit langen Kontexten (GOOG)

  • WeatherNext: Fortschrittliche Wettervorhersagen mit KI (DM)

  • Proxy: KI-Assistent zur Automatisierung von Web-Aufgaben (CONV)

  • Pika: KI-Videotool stark verbessert (X)

  • Open AI o3-mini: Fortschritte in kosteneffizientem Reasoning (OP)

anzeige

desktoptimertrk_px

jobboard

🔥 Top Job: Blacklane, der Berliner Uber-Konkurrent mit Fokus auf’s Luxussegment (Cruncher wissen 🤝), sucht aktuell ein:e Lead Strategic Partnerships. Location: Berlin oder London, Hauptsache Deutschland.

📌 GovTech Campus: Lösungsanalyst und –manager, Heilbronn

📌 Trade Republic: Associate Partnerships, Berlin

📌 Climatiq: Junior Account Executive, Berlin

📌 Anybill: Head of Partnerships, München

📌 Proxima Fusion: Partnerships Manager, München

📌 Amazon: Junior Strategic Partnership Manager, Amsterdam

📌 Carbon Equity: Expansion Account Executive, Berlin 

📌 Google: Strategy and Operations Manager, Dublin

📌 Aleph Alpha: Executive Assistant, Heidelberg

what do you meme?

crunch portfolio

Markets Crunch: Dein kompaktes Börsen-Daily. ➡️ Hier anmelden

Deals Crunch: Tägliche News aus PE, M&A und VC. ➡️ Hier anmelden

Immo Crunch: Unternehmen, Projekte, Personen - Fachwissen für die Immobilien-Branche. ➡️ Waitlist

Consulting Crunch: Personal-Ticker und Updates für alle mit Senator-Status. ➡️ Waitlist

Automotive Crunch: Personal-Ticker und Updates aus Deutschlands größter Branche. ➡️ Waitlist