Apple surprend : Un nouveau modèle d'IA écrase la concurrence dans l'analyse vidéo longueApple surprend : Un nouveau modèle d'IA écrase la concurrence dans l'analyse vidéo longue

Si vous pensiez qu'Apple se contentait de concevoir une nouvelle variante du MacBook Air dans une couleur pastel, détrompez-vous. Les gens de Cupertino viennent de lâcher SlowFast-LLaVA-1.5 – un nouveau large language model (LLM) dédié à l'analyse vidéo longue durée qui, en toute discrétion, surpasse des concurrents plus grands et plus puissants en termes de précision et d'efficacité. Oui, vous avez bien lu : Apple a transformé la compréhension vidéo par l'IA d'un club de boxe poids lourd en un marathonien agile.

Guidé par son réseau bi-flux affûté, le modèle analyse aussi bien les images que les vidéos – séquences rapides ou lentes – avec une précision chirurgicale. Selon des sources de 9to5Mac et We❤️Apple, ce modèle est open source (oui, vous avez bien lu, Apple ET open source dans la même phrase), entraîné uniquement sur des ensembles de données publics. Public visé ? Les geeks du monde entier, les data scientists – et bien sûr vous, qui souhaitez toujours savoir ce qui se cache derrière les rideaux fermés d'Apple.

Apple a – à sa manière sobre – déclaré que le modèle surpassait de plus grands concurrents sur plusieurs benchmarks. En d'autres termes, il s'agit d'une solution d'IA de nouvelle génération, allant du découpage vidéo aux longs métrages.
  • Forte orientation sur l'analyse vidéo : Le modèle gère tout, des vidéos de chats aux conférences avancées. Parfait si vous rêviez que l'IA résume les sessions WWDC en direct.
  • Configuration bi-flux : La combinaison des flux « Slow » et « Fast » rend le modèle à la fois agile et profond. Les rumeurs selon lesquelles cela fonctionne aussi sur les émissions TV 2 Sport n'ont pas encore été confirmées – du moins pour l'instant.
  • Magie open source : Oui, vous pouvez vraiment toucher à l'IA d'Apple, à condition d'être le genre à pouvoir épeler « machine learning » sans le chercher sur Google d'abord.

Bien sûr, cette IA ne vient pas sans réserves. Il y a toujours un « mais » – le modèle a ses limites, surtout pour les analyses vidéo de niche. Mais le fait qu’Apple se lance sur le marché sauvage de l’open source avec un produit de ce calibre va sans doute stimuler la concurrence – et rendre la vie plus amusante (ou plus stressante) pour Google comme pour le camp OpenAI.

Il sera intéressant de voir si SlowFast-LLaVA-1.5 finira dans les mains des fans Apple via Apple Intelligence, ou s'il fera son chemin jusqu'à la prochaine grande version de macOS ou iOS. En attendant, les geeks vont pouvoir s'amuser à tester, optimiser et – évidemment – tenter de faire analyser à l'IA de vieilles keynotes de Steve Jobs.

Lisez la suite (et plongez dans les commentaires de passionnés) sur Reddit Apple.

'"''\\"'