DIVE-Doc models

JayRay5 's Collections

updated 9 days ago

Contains the 3 models presented in the paper: DIVE-Doc: Downscaling foundational Image Visual Encoder into hierarchical architecture for DocVQA