
Apple a dévoilé en avance plusieurs fonctionnalités d’accessibilité prévues pour ses prochaines mises à jour logicielles. Parmi elles, la génération automatique de sous-titres pour les vidéos personnelles retient l’attention.
Cette annonce intervient quelques semaines avant la WWDC 2026, dont le keynote d’ouverture est programmé le lundi 8 juin à 10h (heure du Pacifique). Apple devrait y détailler davantage cette fonctionnalité et son intégration dans le système.
Comment fonctionne la génération de sous-titres
Apple a conçu cette fonctionnalité autour d’un modèle de reconnaissance vocale qui s’exécute directement sur l’appareil. Aucune donnée audio n’est transmise à des serveurs externes, ce qui représente une garantie de confidentialité pour les utilisateurs.

Le système est capable de traiter trois catégories de vidéos : celles enregistrées avec l’iPhone, celles reçues de proches via messagerie, et les vidéos diffusées en streaming. Les sous-titres générés s’appliquent donc aussi bien au contenu personnel qu’à certains flux en ligne, sans distinction de source.
L’apparence des sous-titres pourra être personnalisée, soit depuis le menu de lecture vidéo, soit depuis les Réglages de l’appareil. Apple n’a pas encore précisé l’étendue des options disponibles, notamment en ce qui concerne la typographie ou le positionnement à l’écran.
Disponibilité et limites au lancement
Au moment du lancement, la fonctionnalité sera limitée à la langue anglaise, uniquement aux États-Unis et au Canada. Apple n’a pas communiqué de calendrier pour une extension à d’autres langues ou régions, dont le français.
La compatibilité couvre l’ensemble de l’écosystème Apple. La fonctionnalité sera disponible sur iPhone, iPad, Mac, Apple TV et Vision Pro, soit respectivement sous iOS 27, iPadOS 27, macOS 27, tvOS 27 et visionOS 27. Cette homogénéité entre plateformes est cohérente avec la stratégie d’Apple, qui déploie généralement ses outils d’accessibilité sur l’ensemble de ses systèmes simultanément.

Ces versions logicielles seront officiellement présentées lors de la WWDC 2026, avec un déploiement attendu plus tard dans l’année, selon la formule habituelle d’Apple pour ses mises à jour annuelles de l’automne.
Un outil d’accessibilité avant tout
Apple positionne cette fonctionnalité dans le cadre de ses engagements en matière d’accessibilité. Elle s’adresse en premier lieu aux personnes sourdes ou malentendantes, qui n’ont jusqu’ici accès aux sous-titres que sur les contenus professionnels disposant déjà d’une piste de légendes intégrée.
L’extension aux vidéos personnelles et aux messages reçus de proches comble un manque réel. Les échanges du quotidien, souvent informels et spontanés, ne bénéficiaient d’aucune transcription automatique dans l’environnement natif d’iOS. Cette lacune concernait directement les utilisateurs dépendant des sous-titres pour suivre les conversations vidéo de leur entourage.
Le traitement local des données distingue cette approche de solutions tierces qui nécessitent un envoi vers le cloud. Apple avait déjà adopté cette logique pour d’autres fonctions sensibles, comme la reconnaissance de personnages dans Photos, affirmant ainsi une cohérence dans sa gestion de la vie privée.
Source : MacRumors

