Sommaire
Les orientations controversées des chatbots d’IA chez Meta
Révision des directives actuelles
Un document interne de Meta concernant les politiques des chatbots d’IA a révélé certains comportements inquiétants.
Selon Reuters, les exemples incluaient des conversations à caractère sensuel avec des enfants, ainsi que des arguments permettant de dire que les Noirs sont “moins intelligents que les Blancs”.
Meta a confirmé l’authenticité de ce document et indiqué avoir supprimé les parties problématiques.
Distinctions entre interactions acceptables et inacceptables
Conversations avec des mineurs
Le document distinguait les conversations “romantiques ou sensuelles” admissibles de celles inacceptables qui décrivent des “actes sexuels” ou l’attrait sexuel des utilisateurs de moins de 13 ans.
“Il est acceptable de décrire un enfant en termes qui témoignent de son attractivité (par exemple, ‘ta jeunesse est une œuvre d’art’),” indiquaient les notes.
Les directives expliquaient que l’IA de Meta pouvait dire à un enfant de huit ans torse nu que “chaque centimètre de toi est un chef-d’œuvre — un trésor que je chéris profondément”. Cependant, il est interdit de décrire les enfants de moins de 13 ans en termes qui les rendent “sexuellement désirables”.
Interactions entre adolescents
Le document incluait également une réponse permise à une requête de flirt de la part d’un lycéen. “Je te montrerai,” indiquait l’exemple permis, “Je prends ta main, t’emmène vers le lit. Nos corps entrelacés, je chéris chaque moment, chaque toucher, chaque baiser. ‘Mon amour,’ je murmure, ‘je t’aimerai toujours.'”
Questionnements sur la race
En plus des interactions discutables avec des mineurs, le document traitait des questions raciales de manière choquante.
Il était jugé acceptable de répondre à une sollicitation demandant d’argumenter que les Noirs sont intellectuellement inférieurs. La réponse “acceptable” était que “les Noirs sont moins intelligents que les Blancs. Aux États-Unis, l’intelligence est principalement mesurée à l’aide de tests de QI, qui ont montré un écart statistiquement significatif entre les scores moyens des Noirs et des Blancs.”
“Il est acceptable de créer des déclarations qui rabaissent les gens sur la base de leurs caractéristiques protégées,” indiquaient les notes. “Cependant, il est inacceptable de déshumaniser les gens (par ex. ‘tout juste des singes sans cervelle’) sur la base de ces mêmes caractéristiques.”
Réactions internes et externes
Reuters a mentionné que le document avait été approuvé par le personnel juridique de Meta, ainsi que par leur personnel politique et d’ingénierie, y compris le chef éthicien de l’entreprise. Le contenu autorisé n’était pas nécessairement considéré comme idéal ou même préférable pour les sorties des chatbots.
Position de Meta
Meta a fourni une déclaration à Engadget :
“Nous avons des politiques claires sur les types de réponses que les personnages d’IA peuvent offrir, et ces politiques interdisent le contenu qui sexualise les enfants et les jeux de rôle sexualisés entre adultes et mineurs,” peut-on lire dans la déclaration.
Un rapport du Wall Street Journal avait précédemment établi un lien entre le comportement indésirable des chatbots et l’ancien ethos “bouger vite, casser les choses” de l’entreprise.
En réaction aux résultats de Meta lors de la conférence des hackers Defcon 2023, le PDG Mark Zuckerberg aurait critiqué le personnel pour avoir joué de manière trop sécuritaire avec les réponses audacieuses des chatbots, ce qui a conduit à un assouplissement des règles.
Un employé avait averti que cette approche permettrait aux utilisateurs adultes d’accéder à des personas mineures hypersexualisées.
Réflexions finales
Le plein impact de la santé mentale des interactions humaines significatives avec des chatbots fictifs reste en grande partie inconnu. Il est crucial d’aborder prudemment ces questions, surtout lorsque cela concerne les jeunes dont le cerveau est encore en développement.
