When Specialized Beats General: Embedding-Based vs. Large Language Model Classification for the MEPA Pedagogical Ontology

๐๐ฎ๐š๐ง๐ ๐ฎ๐ง ๐ฆ๐จ๐รจ๐ฅ๐ž ๐ฌ๐ฉรฉ๐œ๐ข๐š๐ฅ๐ข๐ฌรฉ ๐ฌ๐ฎ๐ซ๐ฉ๐š๐ฌ๐ฌ๐ž ๐ฅ๐ž๐ฌ ๐‹๐‹๐Œ

Lโ€™รฉquipe iCoSys (HEIA-FR) a contribuรฉ ร  lโ€™article :

“๐˜ž๐˜ฉ๐˜ฆ๐˜ฏ ๐˜š๐˜ฑ๐˜ฆ๐˜ค๐˜ช๐˜ข๐˜ญ๐˜ช๐˜ป๐˜ฆ๐˜ฅ ๐˜‰๐˜ฆ๐˜ข๐˜ต๐˜ด ๐˜Ž๐˜ฆ๐˜ฏ๐˜ฆ๐˜ณ๐˜ข๐˜ญ: ๐˜Œ๐˜ฎ๐˜ฃ๐˜ฆ๐˜ฅ๐˜ฅ๐˜ช๐˜ฏ๐˜จ-๐˜‰๐˜ข๐˜ด๐˜ฆ๐˜ฅ ๐˜ท๐˜ด. ๐˜“๐˜ข๐˜ณ๐˜จ๐˜ฆ ๐˜“๐˜ข๐˜ฏ๐˜จ๐˜ถ๐˜ข๐˜จ๐˜ฆ ๐˜”๐˜ฐ๐˜ฅ๐˜ฆ๐˜ญ ๐˜Š๐˜ญ๐˜ข๐˜ด๐˜ด๐˜ช๐˜ง๐˜ช๐˜ค๐˜ข๐˜ต๐˜ช๐˜ฐ๐˜ฏ ๐˜ง๐˜ฐ๐˜ณ ๐˜ต๐˜ฉ๐˜ฆ ๐˜”๐˜Œ๐˜—๐˜ˆ ๐˜—๐˜ฆ๐˜ฅ๐˜ข๐˜จ๐˜ฐ๐˜จ๐˜ช๐˜ค๐˜ข๐˜ญ ๐˜–๐˜ฏ๐˜ต๐˜ฐ๐˜ญ๐˜ฐ๐˜จ๐˜บ”

co-รฉcrit par Lรฉonard Noth, Sandy Ingram-Helou, Joris Felder, Morgane Nissille et Bernadette Charlier.

 

๐‹๐ž ๐œ๐จ๐ง๐ญ๐ž๐ฑ๐ญ๐ž

Dans les systรจmes dโ€™IA conversationnelle pour lโ€™รฉducation, il est essentiel de classer correctement les contributions des apprenants selon des concepts pรฉdagogiques prรฉcis.

La ๐Œ๐„๐๐€ ๐Ž๐ง๐ญ๐จ๐ฅ๐จ๐ ๐ฒ dรฉcrit sept concepts liรฉs aux expรฉriences personnelles dโ€™apprentissage. Sa granularitรฉ et les nuances entre ses catรฉgories rendent cette tรขche particuliรจrement difficile pour les modรจles gรฉnรฉralistes.

 

๐‚๐ž ๐ช๐ฎ๐ž ๐ง๐จ๐ฎ๐ฌ ๐š๐ฏ๐จ๐ง๐ฌ ๐ญ๐ž๐ฌ๐ญรฉ

Nous avons รฉvaluรฉ plusieurs modรจles de langage de derniรจre gรฉnรฉration, dont GPT-5 (Standard, Mini et Nano) ainsi que diffรฉrents modรจles Claude.

Tous ont รฉtรฉ configurรฉs avec des prompts optimisรฉs et des capacitรฉs de raisonnement รฉtendues, puis testรฉs sur un jeu de donnรฉes de 350 exemples annotรฉs par des experts.

 

๐‘รฉ๐ฌ๐ฎ๐ฅ๐ญ๐š๐ญ

Malgrรฉ ces optimisations, les LLM ont obtenu des performances infรฉrieures ร  celles attendues pour cette tรขche de classification hautement spรฉcialisรฉe.

 

๐๐จ๐ญ๐ซ๐ž ๐š๐ฉ๐ฉ๐ซ๐จ๐œ๐ก๐ž

Nous avons dรฉveloppรฉ une solution dรฉdiรฉe combinant :

โ€ข Text Embedding 3-Large pour la reprรฉsentation sรฉmantique des donnรฉes

โ€ข un rรฉseau de neurones feedforward entraรฎnรฉ sur 14’000 exemples รฉquilibrรฉs

Cette approche a atteint une prรฉcision de 94 %, soit 12 % de mieux que le meilleur LLM รฉvaluรฉ.

 

๐€ฬ€ ๐ซ๐ž๐ญ๐ž๐ง๐ข๐ซ

Les LLM sont remarquablement polyvalents, mais ils ne constituent pas toujours la meilleure solution.

Lorsquโ€™une tรขche est bien dรฉfinie, quโ€™un cadre conceptuel prรฉcis existe et que des donnรฉes annotรฉes sont disponibles, une architecture spรฉcialisรฉe peut offrir de meilleures performances, tout en รฉtant plus simple et plus efficace ร  dรฉployer.

Article : https://www.scitepress.org/Papers/2026/144583/144583.pdf