VisOnlyQA - a ryokamoi Collection

ryokamoi 's Collections

VisOnlyQA

updated Mar 2

Dataset for evaluating the visual perception capabilities of LVLMs.

VisOnlyQA: Large Vision Language Models Still Struggle with Visual Perception of Geometric Information

Paper • 2412.00947 • Published Dec 1, 2024 • 8
ryokamoi/VisOnlyQA_Eval_Real_v1.1

Viewer • Updated Jul 9, 2025 • 900 • 192
ryokamoi/VisOnlyQA_Eval_Synthetic

Viewer • Updated Jul 9, 2025 • 700 • 156 • 2
ryokamoi/VisOnlyQA_Train

Viewer • Updated Mar 29, 2025 • 70k • 374 • 2
ryokamoi/VisOnlyQA_metadata

Viewer • Updated Jun 19, 2025 • 3 • 105
ryokamoi/VisOnlyQA_Eval_Real

Viewer • Updated Mar 29, 2025 • 500 • 124 • 2
ryokamoi/VisOnlyQA_eval_analysis_2

Viewer • Updated Jun 3, 2025 • 150 • 84
ryokamoi/VisOnlyQA_eval_analysis_3

Viewer • Updated Jun 3, 2025 • 150 • 78
ryokamoi/VisOnlyQA_eval_analysis_4

Viewer • Updated Jun 3, 2025 • 150 • 106
ryokamoi/VisOnlyQA_eval_analysis_5

Viewer • Updated Jun 3, 2025 • 150 • 108
ryokamoi/VisOnlyQA_eval_analysis_6

Viewer • Updated Jun 3, 2025 • 150 • 123
ryokamoi/VisOnlyQA_length_angle

Viewer • Updated Jun 7, 2025 • 150 • 95