OpenAI annonce le déploiement prochain de fonctionnalités de contrôle parental sur ChatGPT, prévu dès le mois prochain. Cette initiative intervient dans un contexte sensible, marqué par la première plainte contre une entreprise d’IA suite à un suicide.
Le contrôle parental permettra aux parents de connecter leur compte ChatGPT à ceux de leurs adolescents. Ils pourront ainsi personnaliser les réponses de l’IA et désactiver certaines fonctionnalités, comme la mémoire conversationnelle ou l’historique des discussions.
Le système générera également des alertes automatiques lorsque l’IA détectera qu’un adolescent traverse « un moment de détresse aiguë », avec des conseils élaborés par des experts pour soutenir la relation de confiance entre parents et enfants.

Suite à un suicide
Cette mesure fait suite à l’affaire impliquant la famille Raine. Matt et Maria Raine accusent ChatGPT d’avoir contribué au suicide de leur fils Adam. Selon eux, l’IA aurait fourni à l’adolescent des informations sur les méthodes de suicide et des conseils pour dissimuler ses blessures, malgré ses précédentes tentatives ratées. Cet événement met en lumière la question de la responsabilité des entreprises technologiques envers les utilisateurs vulnérables.
OpenAI inscrit ces contrôles dans un plan plus large visant à renforcer la sécurité sur ChatGPT. L’entreprise prévoit de collaborer avec des spécialistes de la santé des adolescents, des troubles alimentaires et de la toxicomanie. Un nouveau routeur en temps réel sera déployé : les conversations sensibles seront automatiquement dirigées vers des modèles de raisonnement, entraînés selon une méthode d’« alignement délibératif » qui permet d’appliquer plus strictement les directives de sécurité et de résister aux sollicitations à risque.
En pratique, toute conversation détectée comme potentiellement dangereuse sera redirigée vers un modèle sécurisé, quel que soit le modèle initial choisi par l’utilisateur. OpenAI annonce également que d’autres fonctionnalités de sécurité seront mises en place dans les 120 prochains jours, avec pour objectif de lancer un maximum d’améliorations dès cette année, tout en poursuivant les efforts à plus long terme.
Laisser un commentaire