Comment bloquer OpenAI ChatGPT d'utiliser le contenu de votre site Web
ChatGPT d'OpenAI est un chatbot d'IA avancé qui utilise du contenu récupéré sur Internet pour entraîner son système. Bien que cette technologie soit bénéfique pour beaucoup, certains propriétaires de sites Web peuvent préférer empêcher ce bot d'accéder au contenu de leur site. Que ce soit pour des préoccupations de confidentialité ou pour la protection du contenu, le processus est simple.
Accéder au fichier Robots.txt
Accédez aux paramètres de votre site dans le tableau de bord Umso.
Localisez la section Robots.txt.
Blocage général
Ajoutez les lignes suivantes pour empêcher le bot d'OpenAI d'accéder à tout contenu et cliquez sur Save Robots.
User-agent: GPTBot
Disallow: /
Pour confirmer que le fichier robots.txt fonctionne correctement, vous pouvez consulter https://yourwebsite.com/robots.txt dans votre navigateur.
Blocage avancé
Pour bloquer toutes les pages d'un répertoire, mais autoriser un fichier spécifique :
User-agent: GPTBotAllow: /privatePage/
Disallow: /privatePage/publicFile.jpgPour bloquer une page spécifique
User-agent: GPTBot Disallow: /privatePage/Pour bloquer un fichier spécifique
User-agent: GPTBot Disallow: /privatePage/privateFile.htmlComprendre le Robots.txt
Le Robots.txt est un standard utilisé par les sites Web pour indiquer aux bots d'exploration et de scraping quelles pages ou quels fichiers le bot peut ou ne peut pas demander à votre site. Tous les bots ne respectent pas ce standard, mais ChatGPT d'OpenAI s'y conforme. En apportant des modifications simples au fichier robots.txt de votre site, vous pouvez gérer l'accès de divers crawlers, dont ChatGPT.