Une nouvelle étude examine si l’IA pourrait être un assistant automatisé dans les tâches créatives, avec des résultats mitigés : elle semble aider les personnes moins naturellement créatives à écrire des nouvelles plus originales – mais atténue la créativité du groupe dans son ensemble. C’est un compromis qui pourrait être de plus en plus courant à mesure que les outils d’IA s’imposent dans les entreprises créatives. L’étude est réalisée par les chercheurs Anil Doshi et Oliver Hauser de l’University College London et de l’University of Exeter, respectivement, et a été publiée dans Science Advances. Et bien que nécessairement limitée en raison de son focus sur les nouvelles, elle semble confirmer le sentiment exprimé par beaucoup : l’IA peut être utile, mais n’offre finalement rien de vraiment nouveau dans les entreprises créatives.
“Notre étude représente une vue préliminaire sur une très grande question sur la façon dont les grands modèles de langage et l’IA générative plus généralement affecteront les activités humaines, y compris la créativité,” a déclaré Hauser à TechCrunch dans un courriel. “Alors qu’il y a un énorme potentiel (et, sans aucun doute, un énorme battage médiatique) pour que cette technologie ait de grands impacts dans les médias et la créativité plus généralement, il sera important que l’IA soit effectivement évaluée de manière rigoureuse – plutôt que simplement mise en œuvre à grande échelle, dans l’hypothèse qu’elle aura des résultats positifs.”
“En bref, nos résultats suggèrent que malgré l’effet d’amélioration que l’IA générative a eu sur la créativité individuelle, une note de prudence peut être émise si l’IA générative était adoptée plus largement pour les tâches créatives.”
L’expérience a demandé à des centaines de personnes d’écrire de très courtes histoires (environ huit phrases), sur n’importe quel sujet, mais adaptées à un large public. Un groupe a simplement rédigé ; un deuxième groupe a eu l’opportunité de consulter GPT-4 pour une seule idée de récit en quelques phrases (ils pouvaient en utiliser autant ou aussi peu qu’ils le souhaitaient) ; un troisième groupe pouvait obtenir jusqu’à cinq de ces débuts de récit. Une fois les récits rédigés, ils ont été évalués à la fois par leurs propres auteurs et par un deuxième groupe qui ne savait rien de la variante de l’IA générative. Ces personnes ont évalué les histoires en termes de nouveauté, d’utilité (c’est-à-dire la probabilité de publication) et de plaisir émotionnel.
Avant d’écrire les histoires, les participants ont également effectué une tâche de production de mots qui sert de substitut à la créativité. C’est un concept qui ne peut pas être directement mesuré, mais dans ce cas, on peut au moins approximer la créativité en écriture (sans jugement ! Tout le monde n’est pas un écrivain né ou pratiqué). “Capturer quelque chose d’aussi riche et complexe que la créativité avec une quelconque mesure semble semé d’embûches”, a écrit Hauser. “Pour autant, il y a un ensemble riche de recherches autour de la créativité humaine et il existe un débat en cours sur la meilleure façon de saisir l’idée de la créativité dans une mesure.”
Ce que les chercheurs ont découvert, c’est que les personnes avec des mesures de créativité plus basses obtenaient les scores les plus bas dans l’évaluation de leurs histoires, ce qui valide sans doute l’approche. Ils ont également vu les gains les plus importants lorsque l’on leur a donné l’opportunité d’utiliser une idée de récit générée (il convient de noter que la grande majorité a choisi cette option au cours de l’expérience). Les histoires de personnes ayant un score de créativité faible qui ont simplement rédigé ont été systématiquement notées inférieures aux autres en termes de qualité d’écriture, de plaisir et de nouveauté. Avec une idée générée par l’IA, elles ont obtenu des scores plus élevés sur chaque critère.
Mais qu’en est-il des personnes qui ont obtenu des scores élevés en matière de créativité ? Leur écriture a-t-elle atteint de nouveaux sommets ? Malheureusement, non. En fait, ces participants ont vu peu ou pas de bénéfice, voire (bien que ce soit très proche et sans doute non significatif) des notes plus faibles. Il semble que ceux de la catégorie créative ont produit leur meilleur travail lorsqu’ils n’ont pas eu d’aide de l’IA.