Laut des Branchendienstes „The Rundown AI“ hat Apple eine neue Familie multimodaler KI-Modelle vorgestellt, die visuelles und sprachliches Verstehen kombinieren. Diese Modelle („MM1“) wurden mit einer Mischung aus Bildunterschriften, Bild-Text-Daten und reinen Textdaten trainiert.
Das größte Modell mit 30 Milliarden Parametern zeichnet sich durch schnelles Lernen aus wenigen Beispielen und die Fähigkeit aus, mehrere Bilder zu interpretieren. Insbesondere durch die Verbesserung der Bildverarbeitung konnte die Leistung deutlich gesteigert werden.
MM1 kann mit führenden Modellen wie GPT-4V und Gemini Pro konkurrieren. Diese Veröffentlichung markiere einen ungewöhnlich offenen Ansatz für Apple und könnte bedeutende Auswirkungen auf die Entwicklung von Siri haben, schreiben die KI-Expert:innen von „The Rundown AI“ in ihrem Newsletter.
Der Link zum Beitrag „Apple’s AI model revealed!“ wurde am 18. März 2024 der Presseschau auf „Internet für Architekten“ hinzugefügt.
Übrigens: Wenn Sie Link-Tipps für unsere Presseschau haben, schreiben Sie uns.
Weitere Einträge in unserer Presseschau
- Scheinselbständigkeit: Architekturbüros im Visier der Prüfer 7. Juli 2025
- Opt-Out-Anleitung für Websites 2. Juli 2025
- War Paul gar nicht in Israel? Die Greenscreen-Lüge der KI. Mit Fritz Espenlaub 29. Juni 2025
- Vom Experiment zur Methode: Wie Ihr Planungsbüro KI in den Alltag integriert 24. Juni 2025
- Stargate: Ein gigantisches Rechenzentrum zeigt den Platzbedarf von künstlicher Intelligenz 14. Juni 2025
- Sicherheitsrisiko „Digitaler Zwilling“? 22. Mai 2025
- Elektronsiche Dienstleistungen: Barrierefreie Website nötig? 12. Mai 2025
- Neu in NotebookLM: Quellen entdecken und Audio-Zusammenfassungen jetzt auch auf Deutsch hören 2. Mai 2025
- Wem gehört das Bauwerk? Über das Recht am Entwurf 1. Mai 2025
- Midjourney startet mit neuem Bildmodell v7 und Entwurfsmodus 24. April 2025
Noch ausführlicher (und vor allem auf deutsch) werden die neuen KI-Modelle von Apple in diesem Beitrag des KI-Magazins THE DECODER erläutert: https://the-decoder.de/mm1-apple-stellt-multimodales-ki-modell-mit-hohem-visuellem-verstaendnis-vor/