- AI Crunch
- Posts
- 💡 Deepdive: GPT-4o mini ist da
💡 Deepdive: GPT-4o mini ist da
🏃, liebe Cruncher!
Die Lauf-App Strava will jetzt KI einzusetzen, um Betrüger auf den Scorer-Boards zu enttarnen.
Wir fragen uns: Evtl. einen MorningCrunch Running-Club aufmachen? Und dann klassisch auf dem E-Roller die 12km im Grunewald abreißen, um Strava-Score zu pushen?
Let’s go!
AI Stocks (05:59 Uhr, CET)
TOP-STORY
GPT-4o Mini: Der LLM-Preiskampf hat begonnen
Was ist passiert: OpenAI hat mit GPT-4o Mini ein leichteres und kostengünstigeres Modell für Entwickler veröffentlicht
Affordable AI: GPT-4o Mini kostet nur 15 Cent pro 1m Eingabetokens und 60 Cent pro 1m Ausgabetokens – bei GPT-4o kosten 1m Tokens noch $5
Die Details: 1m Tokens sind 750.000 Wörter, also ~7.5x Donald Trumps The Art of the Deal – für nur 15 Cent
Was machen Sachen: Das Modell hat so ziemlich die gleichen Parameter wie der große Bruder GPT-4o und erzielte 82% im MMLU-Benchmarking, was es in etwa so leistungsstark wie Claude 3 Haiku und Gemini 1.5 Flash macht (aber schwächer als GPT-4o mit 88%)
Und wofür soll das gut sein? GPT-4o Mini eignet sich besonders für relativ simple KI-Anwendungen wie Kundensupport-Chatbots, die dadurch deutlich günstiger zu betreiben sind (als mit GPT-4o oder GPT-3.5)
Warum das wichtig ist: Mit dem günstigeren Modell geht das Race-to-the-bottom in die nächste Runde 👇
Mit >75% im MMLU-Benchmark sind jetzt viele Modelle auf dem gleichen Qualitätsniveau – Kernunterschied wird dann für Anwender der Preis sein
Bisher war Claude Haiku mit 25 Cent pro 1m Input Tokens und 1.25€ pro 1m Output Tokens deutlich günstiger als OpenAIs Modelle – und muss jetzt überlegen, ob es die Preise anpasst
Noch fängt zusätzlicher Bedarf die sinkenden Preise für die LLM-Betreiber auf und die LLM-Entwickler bezahlen ihren Research aus externen Funds (aka VC Cash)
Auf Dauer wird sich der Preiskampf aber auch auf Umsatzseite zeigen – und damit stellt sich dann die Frage, wie LLM-Betreiber langfristig die massiven Entwicklungskosten stemmen werden
Headline Crunch
HEADLINES & LAUNCHES
ElevenLabs präsentiert Turbo 2.5 (4 Minuten Lesezeit)
🎙 Das neue Modell bietet ziemlich gute Text-to-Speech Übertragung – und jetzt auch in neuen Sprachen, zum Beispiel: Deutsch. Wir probieren es aus und werden diese Woche dazu berichten.
Mistral und Nvidias stellen auch ein neues Modell vor (3 Minuten Lesezeit)
🤖 Mistral Nemo 12B ist ein mehrsprachiges Modell, das mit einem neuen Tokenizer trainiert wurde und bei Tests gut abschneidet.
Meta wagt den KI-Rückzug aus der EU (vorerst) (4 Minuten Lesezeit)
👋🏼 Meta will seine KI-Modelle erst einmal nicht mehr in der EU anbieten – weil es mit der Regulatorik aus Brüssel nicht einverstanden ist. Gerade bei Fragen bezüglich des Trainings der Modelle hatte es zuletzt Ärger mit der EU-Kommission gegeben.
OpenAI und Broadcom diskutierten über die Produktion eines KI-Chips (1 Minute Lesezeit)
💻 Broadcom hat Gespräche mit OpenAI über den Bau eines neuen künstlichen Intelligenz-Serverchips geführt.
Entwickler: Weniger begeistert von KI als ihre Manager (2 Minuten Lesezeit)
🧠 Zwei Drittel der Softwareentwickler glauben, dass ihnen KI nicht oder nur wenig hilft. Das zeigt eine Studie von Atlassian zur Developer Experience.
ANZEIGE
TOOLS & WISSENSWERTES
Neue Funktionen bei Google Gemini (6 Minuten Lesezeit)
👋🏼 Google will neue Features in Gemini Advanced vorstellen – eigentlich schon vergangene Woche, das ging dann aber im CrowdStrike Debakel ein bisschen unter.
🎬 Flow Studio generiert vollständig produzierte, filmqualitative 3-minütige Videos mit ganz guten Handlungen, konsistenten Charakteren und automatisch angepasster Hintergrundmusik und Soundeffekten.
Updates für ChatGPT Enterprise – Neue Verwaltungstools
🔧 OpenAI hat neue Tools für ChatGPT Enterprise eingeführt, die speziell für die Compliance und die Verwaltung von Unternehmensdaten entwickelt wurden. Diese ermöglichen eine bessere Kontrolle und einen sicheren Einsatz von benutzerdefinierten ChatGPT-Modellen in Unternehmensumgebungen.
Deep Dive: Google-Experte Hartmut Neven über Quantencomputer bei TED2024 (12 Minuten Video)
📹 Hartmut Neven von Google Quantum AI erklärt, wie Quantencomputer durch Quantenphysik traditionelle Computer übertreffen und Probleme in Medizin, nachhaltiger Energie und mehr lösen können.
Leitfaden: Effektives Prompt Engineering für Generative KI (Buch)
✍️ Das Buch von James Phoenix und Mike Taylor vermittelt wichtige Techniken des Prompt Engineering, die Entwicklern helfen, zuverlässige Ergebnisse aus diesen Modellen zu erhalten und sie effektiv in ihre Arbeitsabläufe zu integrieren.
What do you Meme?
Crunching On
👨💼Consulting Crunch (Launch: Q4 2024): MBB & Beyond - Personal-Ticker und Updates für alle mit Senator-Status. Wir gehen jeden Morgen für euch die Extra Mile.
🚘 Automotive Crunch (Launch: Q4 2024): Wohin steuert die Automotive Industry? Personal-Ticker und Updates aus Deutschlands wichtigster Branche.
Wie fandest du die heutige Ausgabe?Dein Feedback hilft uns, jeden Tag besser zu werden. |
Login oder Abonnieren um an umfragen teilzunehmen. |