Shunyalabs.ai a lancé ZeroMed, un système de reconnaissance vocale automatique (ASR) de nouvelle génération conçu spécifiquement pour les environnements de soins de santé. La société l’appelle « un système de reconnaissance vocale automatique révolutionnaire, optimisé pour un domaine, adapté aux flux de travail médicaux et cliniques », offrant « la meilleure précision de sa catégorie et des frais de formation ultra faibles ».
ZeroMed aurait atteint un taux d’erreur sur les mots (WER) de 11,1 % et un taux d’erreur sur les caractères (CER) de 5,1 %, surpassant les principaux systèmes tels que Whisper V3, ElevenLabs Scribe, Gemini 2.5 Flash et AWS Transcribe. Sa particularité : il atteint « une convergence complète en seulement 3 jours de formation sur 2 × GPU A100 », soit une fraction du temps requis par les concurrents.
Cette rapidité pourrait permettre aux systèmes de santé de maintenir plus facilement le modèle à jour avec la dernière terminologie médicale, les procédures et les noms de médicaments, autant de domaines dans lesquels les modèles vocaux à usage général sont souvent à la traîne.
Conçu pour les réalités de la conversation clinique
La reconnaissance vocale médicale est notoirement difficile, remplie d’acronymes, d’échanges rapides et de langage spécialisé. Selon Shunya Labs, ZeroMed aborde ces problèmes grâce à « un vocabulaire et un formatage sensibles au domaine », « une diarisation robuste du locuteur et un suivi du contexte » et un « biais robuste à l’accent et au domaine faible ».
Le modèle peut faire la distinction entre plusieurs locuteurs, tels qu’un clinicien, un patient ou un soignant, même lors de dialogues qui se chevauchent. Il prend en charge les codes ICD et LOINC, la normalisation du dosage et l’expansion des abréviations, contribuant ainsi à réduire les erreurs d’édition et de transcription manuelles.
Tout aussi importante pour une utilisation clinique, « l’architecture temps réel d’abord » de ZeroMed signifie qu’elle « offre une qualité de reconnaissance identique en mode temps réel et hors ligne », ce qui lui permet d’alimenter la rédaction en direct, la dictée et la documentation de télémédecine sans décalage.
Déploiement axé sur la confidentialité pour les environnements réglementés
Alors que de nombreux outils de transcription d’IA reposent sur le cloud, ZeroMed a été conçu pour les systèmes de santé sensibles à la confidentialité. Shunya Labs souligne que le modèle « peut fonctionner sur site sur des serveurs CPU uniquement (pas de dépendance au cloud), offrant un contrôle total des données et une conformité aux normes de confidentialité des soins de santé (HIPAA, RGPD, etc.). »
Cette option sur site donne aux hôpitaux et aux entreprises un contrôle total sur les données des patients tout en maintenant la parité des performances avec les déploiements GPU et cloud, une combinaison rare dans les outils d’IA médicale.
Performances de pointe
Les tests de référence publiés par Shunya Labs montrent que ZeroMed est leader en termes de précision, d’efficacité et de flexibilité de déploiement, surpassant les autres systèmes ASR médicaux qui nécessitent des semaines de formation et des configurations GPU uniquement.
“Chez Shunya Labs, nous pensons que la transcription médicale doit être non seulement rapide, mais aussi parfaitement précise : chaque dosage, diagnostic et horodatage compte. ZeroMed incarne cette vision. Nous avons réduit le coût et le temps de formation, rendant l’ASR haute fidélité accessible à davantage de systèmes de santé”, a déclaré Ritu Mehrotra, PDG et fondateur de Shunyalabs.ai.
Le CTO Sourav Banerjee a ajouté : « Notre objectif avec ZeroMed n’était pas une amélioration progressive, mais plutôt une redéfinition de la reconnaissance vocale médicale : moins de corrections, une latence plus faible et une confidentialité totale des données. »
Disponibilité et prochaines étapes
ZeroMed est désormais disponible pour un aperçu et une évaluation pilote par les organisations de soins de santé et de technologie de la santé. Shunya Labs intègre les premiers partenaires pour l’intégration et les commentaires, avec des options sur site uniquement CPU disponibles pour les environnements de conformité stricte.
Actuellement disponible en anglais, ZeroMed sera bientôt étendu aux langues indiennes et internationales, reflétant les ambitions mondiales de l’entreprise. Les organisations intéressées peuvent demander une démo ou un accès pilote sur www.shunyalabs.ai/ZeroMed.
Alors que les systèmes de santé recherchent des moyens de réduire la charge administrative et l’épuisement des cliniciens, des outils comme ZeroMed pourraient signaler une évolution vers une documentation basée sur l’IA, à la fois précise et respectueuse de la confidentialité. Grâce à sa capacité à s’entraîner rapidement, à s’exécuter localement et à s’adapter à l’évolution des vocabulaires, l’approche de Shunya Labs se démarque dans un domaine de plus en plus compétitif de l’IA vocale.
Digital Trends s’associe à des contributeurs externes. Tout le contenu des contributeurs est examiné par l’équipe éditoriale de Digital Trends.

