Laut des Branchendienstes „The Rundown AI“ hat Apple eine neue Familie multimodaler KI-Modelle vorgestellt, die visuelles und sprachliches Verstehen kombinieren. Diese Modelle („MM1“) wurden mit einer Mischung aus Bildunterschriften, Bild-Text-Daten und reinen Textdaten trainiert.
Das größte Modell mit 30 Milliarden Parametern zeichnet sich durch schnelles Lernen aus wenigen Beispielen und die Fähigkeit aus, mehrere Bilder zu interpretieren. Insbesondere durch die Verbesserung der Bildverarbeitung konnte die Leistung deutlich gesteigert werden.
MM1 kann mit führenden Modellen wie GPT-4V und Gemini Pro konkurrieren. Diese Veröffentlichung markiere einen ungewöhnlich offenen Ansatz für Apple und könnte bedeutende Auswirkungen auf die Entwicklung von Siri haben, schreiben die KI-Expert:innen von „The Rundown AI“ in ihrem Newsletter.
Der Link zum Beitrag „Apple’s AI model revealed!“ wurde am 18. März 2024 der Presseschau auf „Internet für Architekten“ hinzugefügt.
Übrigens: Wenn Sie Link-Tipps für unsere Presseschau haben, schreiben Sie uns.
Weitere Einträge in unserer Presseschau
- Test: KI-Bildgeneratoren für Architektur-Visualisierung 19. Januar 2026
- Gebäudecheck: Ist mein Haus bereit für die Wärmepumpe? 11. Januar 2026
- Erich-Mendelsohn-Preis 2026: Backstein-Architektur-Projekte können ab sofort eingereicht werden 7. Januar 2026
- Organize your insights with Data Tables in NotebookLM. 5. Januar 2026
- GlobalBuildingAtlas: 3D-Modelle aller 2,8 Milliarden Gebäude der Welt auf GitHub 6. Dezember 2025
- KI ist toll, aber auch ganz schön teuer 2. Dezember 2025
- KI-Update Deep-Dive: Besser texten mit KI 22. November 2025
- Lärm und Energieverbrauch: KI-Rechenzentren in den USA 16. November 2025
- Geschichten hinter den Fassaden 10. November 2025
- DeepL Agent: der KI‑Agent, der Ihre Tools nutzt wie ein Mensch 6. November 2025


Noch ausführlicher (und vor allem auf deutsch) werden die neuen KI-Modelle von Apple in diesem Beitrag des KI-Magazins THE DECODER erläutert: https://the-decoder.de/mm1-apple-stellt-multimodales-ki-modell-mit-hohem-visuellem-verstaendnis-vor/