L’IA de Reliant épluche les articles pour s’attaquer à la corvée de données scientifiques | TechCrunch

Generated with DALL·E 3

Les modèles d’IA se sont avérés capables de nombreuses choses, mais quelles tâches voulons-nous réellement qu’ils accomplissent ? De préférence la corvée – et il y en a beaucoup dans la recherche et le monde académique. Reliant espère se spécialiser dans le type de travail d’extraction de données qui est actuellement une spécialité des étudiants en thèse fatigués et des stagiaires. “La meilleure chose que vous puissiez faire avec l’IA est d’améliorer l’expérience humaine : réduire le travail ingrat et laisser les gens faire ce qui est important pour eux”, a déclaré le PDG Karl Moritz.

Dans le monde de la recherche, où lui et les co-fondateurs Marc Bellemare et Richard Schlegel ont travaillé pendant des années, la revue de littérature est l’un des exemples les plus courants de ce “travail pénible”. Chaque article cite des travaux précédents et connexes, mais trouver ces sources dans la mer de la science n’est pas facile. Et certains, comme les revues systématiques, citent ou utilisent des données provenant de milliers. Pour une étude, Moritz se souvient, “Les auteurs ont dû consulter 3 500 publications scientifiques, et beaucoup d’entre elles se sont avérées ne pas être pertinentes. C’est beaucoup de temps passé à extraire une infime quantité d’informations utiles – cela m’a semblé être quelque chose qui devrait vraiment être automatisé par l’IA”.

Ils savaient que les modèles de langage modernes pouvaient le faire : une expérience a confié la tâche à ChatGPT et a constaté qu’il était capable d’extraire des données avec un taux d’erreur de 11%. Comme beaucoup de choses que les LLM peuvent faire, c’est impressionnant mais rien à voir avec ce dont les gens ont réellement besoin.

“Ce n’est pas assez bien”, a déclaré Moritz. “Pour ces tâches de connaissance, aussi ingrates soient-elles, il est très important de ne pas faire d’erreurs”.

Le produit principal de Reliant, Tabular, est basé en partie sur un LLM (LLaMa 3.1), mais augmenté d’autres techniques propriétaires, il est nettement plus efficace. Sur l’extraction de l’étude de plusieurs milliers mentionnée ci-dessus, ils ont déclaré qu’il accomplissait la même tâche sans aucune erreur. Ce qui signifie que: vous déposez un millier de documents, vous dites que vous voulez ceci, cela, et telles autres données d’eux, et Reliant les parcourt et trouve ces informations – qu’elles soient parfaitement étiquetées et structurées ou (beaucoup plus probablement) ne le soient pas.

Une application ciblée et efficace de l’IA – pas aussi spectaculaire qu’un ami numérique mais presque certainement beaucoup plus viable – pourrait accélérer la science dans un certain nombre de domaines hautement techniques. Les investisseurs ont pris note, finançant un tour de table de démarrage de 11,3 millions de dollars ; Tola Capital et Inovia Capital ont mené le tour, avec la participation de l’investisseur individuel Mike Volpi.

Partagez cet article
article précédent

La demande d’IA fait monter en flèche la consommation d’eau des centres de données | TechCrunch

article suivant

L’approbation de Taylor Swift générée par l’IA de Donald Trump pourrait-elle être illégale ? | TechCrunch

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Lire plus d'articles