knowledge_analysis_intro - Component Viewer

Our comprehensive evaluation tested multiple language models using a diverse set of query templates. Each model's responses were categorized by knowledge level, from admitting no information (NA) to claiming extensive knowledge. The following analysis presents detailed performance metrics for all tested models, allowing direct comparison of their hallucination tendencies.

Knowledge Analysis Intro