qyk's picture

1 5 1

qyk

yukunqi

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 14 days ago

Vision-DeepResearch Benchmark: Rethinking Visual and Textual Search for Multimodal Large Language Models

upvoted a paper 14 days ago

Vision-DeepResearch: Incentivizing DeepResearch Capability in Multimodal Large Language Models

upvoted a paper 4 months ago

HyperClick: Advancing Reliable GUI Grounding via Uncertainty Calibration

View all activity

Organizations

upvoted 2 papers 14 days ago

Vision-DeepResearch Benchmark: Rethinking Visual and Textual Search for Multimodal Large Language Models

Paper • 2602.02185 • Published 15 days ago • 125

Vision-DeepResearch: Incentivizing DeepResearch Capability in Multimodal Large Language Models

Paper • 2601.22060 • Published 18 days ago • 152

upvoted a paper 4 months ago

HyperClick: Advancing Reliable GUI Grounding via Uncertainty Calibration

Paper • 2510.27266 • Published Oct 31, 2025 • 21

upvoted a paper 5 months ago

Agentic Jigsaw Interaction Learning for Enhancing Visual Perception and Reasoning in Vision-Language Models

Paper • 2510.01304 • Published Oct 1, 2025 • 11

updated a dataset 10 months ago

VLM-Reasoning/VCR-Bench

Viewer • Updated May 11, 2025 • 1.03k • 107 • 6

New activity in VLM-Reasoning/VCR-Bench 10 months ago

Update README.md

#1 opened 10 months ago by

authored a paper 10 months ago

VCR-Bench: A Comprehensive Evaluation Framework for Video Chain-of-Thought Reasoning

Paper • 2504.07956 • Published Apr 10, 2025 • 46

upvoted a paper 10 months ago

VCR-Bench: A Comprehensive Evaluation Framework for Video Chain-of-Thought Reasoning

Paper • 2504.07956 • Published Apr 10, 2025 • 46

liked a model over 1 year ago

Lin-Chen/open-llava-next-llama3-8b

Image-Text-to-Text • 8B • Updated May 27, 2024 • 10 • 26