MedKGEval propone un metodo innovativo per valutare modelli linguistici clinici durante dialoghi medici multi-turno, usando un knowledge graph che guida simulazioni realistiche e una valutazione in tempo reale della correttezza clinica, sicurezza e accuratezza. Identifica rischi e limiti non rilevati da metodi tradizionali.


