Que fait l'IA de mes données ?

Foire aux questions (FAQ)

Vos questions, nos réponses.

Voici les réponses détaillées aux questions soulevées en direct lors de nos formations.

Question : « Comment m’assurer de ne pas donner à l’IA des informations qui pourraient ensuite se retrouver sur le net ? »

Réponse : Par prudence, considérez tout échange avec l’IA comme potentiellement public. Évitez systématiquement de fournir des données personnelles ou sensibles (nom complet, dossier, coordonnées, etc.), et utilisez plutôt des informations anonymisées ou fictives quand vous testez l’outil. Retenez qu’on ne peut pas garantir qu’une donnée partagée disparaîtra, mieux vaut donc ne pas la fournir du tout.

Question : « Est-ce que (outil d’agent conversationnel) réutilise les données qu’on lui donne quand on lui demande quelque chose ? »

Réponse : Certains outils enregistrent en effet vos questions et échanges pour personnaliser le service et améliorer l’expérience utilisateur. En pratique, la collecte de données est gérée par l’entreprise derrière l’outil, et vous pouvez désactiver certaines options de partage dans les paramètres de confidentialité si vous préférez limiter cette utilisation.

Le modèle IA génère du texte afin de répondre à votre demande. C’est le seul but et utilité du modèle. Ceux qui décident si ces données sont conservées, c’est la compagnie qui gère vos requêtes et vos données.

Question : « Est-ce que l’IA peut scruter mes infos que je mets dans mes courriels, Facebook, etc. ? «

Réponse : Non, l’IA ne va pas chercher tout seul dans vos comptes personnels. Il n’a pas la capacité d’explorer vos emails ou vos données Facebook sans que vous ne lui donniez explicitement accès via un compte lié ou en lui envoyant directement des données, par exemple via des captures d’écran ou du texte copié-collé.

Question : « Je discute en soirée avec des amis d’un voyage à Walt Disney (sans utiliser mon cellulaire) et le lendemain on m’offre différentes offres pour un voyage là-bas? Pourquoi? »

Réponse : La publicité en ligne utilise de nombreux indices pour deviner vos centres d’intérêt. Même sans utiliser votre téléphone, d’autres données (par exemple les recherches d’un ami ou votre localisation) peuvent suffire à l’algorithme pour comprendre que vous parlez de Disney et vous montrer des offres liées à ce voyage. Cela peut également être une coincidence!

Question : « Comment savoir quelles sont les compagnies tierces qui utilisent nos données pour les revendre? Est-ce inscrit dans les encadrés? »

Réponse : Ces informations figurent généralement dans la politique de confidentialité ou les conditions d’utilisation de l’application ou du service que vous utilisez.

Par ailleurs, les boutiques d’applications (Appstore, Play Store) affichent maintenant des encadrés ou “étiquettes” de confidentialité qui résument quelles données sont collectées et partagées, ce qui vous aide à repérer si vos informations sont transmises à des entreprises tierces.

Question: « Que fait chat GPT avec les informations que je lui donne? Par exemple, je lui donne le nom d’un élève. »

Réponse : ChatGPT utilise vos informations uniquement pour formuler une réponse, mais il peut aussi les conserver pour entraîner son modèle et améliorer ses performances. Il est donc déconseillé de fournir des données personnelles sensibles (comme le nom d’un élève) à ce type d’outil, car ces informations pourraient rester stockées dans ses serveurs internes.

Question : « Y a-t-il des applications plus sécuritaires que d’autres ou tous les LLM comportent des risques à l’utilisation ? »

Réponse : De règle générale, tous les grands modèles de langage (LLM) présentent un certain risque pour la confidentialité, surtout lorsqu’ils fonctionnent en ligne et stockent vos données sur leurs serveurs. Cependant, certains outils d’IA conçus pour un usage professionnel ou éducatif offrent des mesures de protection supplémentaires (chiffrement des données, traitement local, politiques de confidentialité strictes) qui les rendent globalement plus sécuritaires.

Question : « Est-ce que les données demeurent sécurisées (ex. nom, des résultats, etc.)? »

Réponse : La plupart des outils d’IA conservent les données saisies (noms, résultats, etc.) sur des serveurs sécurisés, mais rien ne garantit qu’elles seront effacées par la suite. Par précaution, il vaut mieux éviter de partager ce genre d’informations sensibles si l’on souhaite qu’elles restent strictement confidentielles.

Question : « Pourquoi ce n’est pas sécuritaire d’utiliser l’IA sans réfléchir? »

Réponse : Parce qu’une IA n’a pas de jugement propre, elle peut fournir des réponses inexactes ou biaisées sans distinguer le vrai du faux. Si on l’utilise sans esprit critique, on risque de prendre pour fiables des informations trompeuses ou d’adopter des décisions potentiellement risquées.

Question : « Comment gérer la protection des données en utilisant l’IA générative? »

Réponse : N’entrez jamais de renseignements personnels ou sensibles dans un outil d’IA générative. Il est également important de consulter la politique de confidentialité de l’outil pour comprendre comment vos entrées seront utilisées, et de privilégier les paramètres ou versions qui offrent des garanties de protection des données.

Question : « Comment bien choisir les liens vers lesquels j’envoie les élèves? Sur quoi se fier? »

Réponse : Privilégiez les sites web reconnus pour leur fiabilité (sites officiels, institutions éducatives, médias sérieux) afin d’orienter vos élèves. Fiez-vous à la réputation de la source, à la qualité et à l’actualité du contenu, et vérifiez que l’information est corroborée par d’autres sources fiables avant de la partager.

Question : « Comment savoir si un modèle utilise mes requêtes pour continuer d’apprendre? »

Réponse : Il faut consulter les informations officielles de l’outil (conditions d’utilisation ou politique de confidentialité) pour le savoir. En général, les fournisseurs précisent si les requêtes des utilisateurs sont enregistrées et réutilisées pour entraîner ou affiner le modèle, et certains offrent même des options de paramétrage pour désactiver cet apprentissage continu.

Question : « Est-ce que les sites web que j’utilise ou mon moteur de recherche partagent mes recherches? »

Réponse : De nombreux sites web et moteurs de recherche enregistrent vos requêtes et peuvent en partager certaines données avec des partenaires (par exemple à des fins publicitaires ou d’analyse). En pratique, tout ce que vous recherchez en ligne est conservé par l’entreprise qui fournit le service et peut être exploité selon les termes de sa politique de confidentialité.

Question : « Si je demande à un agent conversationnel de ne pas garder en mémoire notre conversation, ou de l’effacer, le fait-il réellement? »

Réponse : Non. Demander à l’agent conversationnel d’« oublier » ou d’effacer la conversation dans le chat ne supprime pas réellement les données enregistrées en arrière-plan. La conversation reste généralement stockée sur les serveurs du fournisseur du service, quel que soit ce que l’IA répond, et il faut utiliser les options de confidentialité officielles (paramètres du compte, suppression de l’historique) pour que vos échanges ne soient pas conservés.

Question : « Est-ce que les conversations sur iMessage et Messenger collectent nos données? »

Réponse : La plupart des applications de messagerie conservent au minimum certaines informations sur vos communications (par exemple qui a envoyé un message à qui et à quel moment). Pour le contenu même des messages, iMessage applique un chiffrement de bout en bout qui le rend illisible pour Apple (le fournisseur ne voit que les détails d’envoi), tandis que Messenger n’a pas ce chiffrement par défaut. Le service peut donc techniquement accéder au contenu des conversations et l’exploiter conformément à sa politique de confidentialité.

Question : « J’ai remarqué que souvent ChatGPT commence dans sa réponse en me disant que j’ai raison ou une phrase qui commence comme ça. Pourquoi? »

Réponse : Les modèles de langage ont été entraînés à adopter une formule d’échange polie et coopérative, ce qui les pousse parfois à valider ou à reformuler vos propos même si ce n’est pas nécessaire. Ils reproduisent des habitudes de langage apprises dans leurs données d’entraînement, sans que cela signifie qu’ils évaluent réellement l’exactitude de ce que vous dites.

Question : « Y a-t-il moyen de désactiver l’utilisation de l’IA (dans le haut de la page de réponses) lors de mes recherches Google? »

Réponse : Il existe plusieurs façons de désactiver les aperçus basés sur l’IA lors d’une recherche Google. La façon la plus simple est d’ajouter « -ai » à notre requête. Si on veut le faire de façon permanente, certaines extensions de Chrome spécialisées sont disponibles.

Question : « On parle de plus en plus de l’empreinte environnementale de l’IA. Est-ce possible de la mesurer? »

Réponse : L’empreinte environnementale exacte de l’utilisation de l’IA est difficile à calculer puisqu’elle dépend de plusieurs facteurs: la tâche demandée, la complexité de la requête, les sources d’énergie utilisées pour alimenter les centres de données, la localisation des centres de données, …

Par contre, sans être parfaitement précise, il existe de belles applications, telle que https://what-uses-more.com/, permettant de comparer la quantité d’énergie et de resources naturelles (principalement l’eau) requises pour accomplir certaines tâches, permettant par exemple de comparer une recherche internet avec et sans IA, une heure de visionnement en ligne comparée à une génération d ‘une video à l’aide de l’IA, …