Apple überrascht: Neues KI-Modell schlägt die Konkurrenz bei LangvideoanalyseApple überrascht: Neues KI-Modell schlägt die Konkurrenz bei Langvideoanalyse

Wenn Sie dachten, Apple sitze nur gemütlich da und entwerfe noch eine weitere Variante des MacBook Air in einer neuen Pastellfarbe, dann denken Sie noch einmal nach. Die Leute aus Cupertino haben gerade SlowFast-LLaVA-1.5 vorgestellt – ein neues großes Sprachmodell (LLM) für die Analyse von Langvideos, das still und leise größere, schwerere Konkurrenten in Präzision und Effizienz übertrifft. Ja, Sie haben richtig gelesen: Apple hat das KI-Videoverständnis von einem Fitnessstudio für Schwergewichte in einen flinken Marathonläufer verwandelt.

Dank seines messerscharfen Zwei-Strang-Netzwerks analysiert das Modell sowohl Bilder als auch Videos – sowohl schnelle als auch langsame Sequenzen – mit chirurgischer Präzision. Laut Quellen von 9to5Mac und We❤️Apple ist das Modell Open Source (ja, Sie haben richtig gelesen, Apple UND Open Source im selben Satz), ausschließlich mit öffentlich zugänglichen Datensätzen trainiert. Zielgruppe? Nerds, Datenwissenschaftler weltweit – und natürlich Sie, der immer wissen will, was sich hinter Apples verschlossenen Vorhängen verbirgt.

Apple hat – in gewohnt zurückhaltender Manier – erklärt, dass das Modell größere Konkurrenten bei mehreren Benchmarks schlägt. Mit anderen Worten: eine KI-Lösung der nächsten Stufe, die von Videoausschnitten bis zu ganzen Filmen reicht.
  • Starker Fokus auf Videoanalyse: Das Modell verarbeitet alles von Katzenvideos bis zu anspruchsvollen Vorlesungen. Perfekt, falls Sie schon immer wollten, dass KI Ihnen die WWDC-Livestreams zusammenfasst.
  • Zweistrom-Setup: Die Kombination aus „Slow“- und „Fast“-Streams macht das Modell zugleich agil und tiefgehend. Gerüchte, dass es auch für TV 2 Sport-Aufnahmen funktioniert, sind leider – noch – nicht bestätigt.
  • Open-Source-Magie: Ja, Sie dürfen tatsächlich an Apples KI tüfteln, sofern Sie zu denjenigen gehören, die ‘machine learning’ ohne vorheriges Googeln buchstabieren können.

Natürlich kommt diese KI nicht ohne Vorbehalte. Es gibt immer ein ‚Aber‘ – das Modell hat seine Grenzen, besonders bei sehr spezialisierten Videoanalysen. Aber dass Apple sich mit einem Produkt dieser Güteklasse auf dem wilden Open-Source-Markt engagiert, wird zweifellos die Konkurrenz anheizen – und das Leben für Google und die OpenAI-Fraktion unterhaltsamer (oder nervenaufreibender) machen.

Es bleibt spannend zu beobachten, ob SlowFast-LLaVA-1.5 irgendwann für uns normale Apple-Fans über Apple Intelligence nutzbar wird oder sich vielleicht heimlich im nächsten großen macOS- oder iOS-Release einschleicht. Bis dahin dürfen die Nerds sich austoben, experimentieren und – natürlich – versuchen, die KI alte Steve Jobs-Keynotes analysieren zu lassen.

Mehr dazu (und viele nerdige Kommentare) auf Reddit Apple.

'"''\\"'
Apple MagSafe-Ladegerät
Apple MagSafe-Ladegerät
€34,95 €50,95