Vidore

company

https://github.com/illuin-tech/colpali

Activity Feed

AI & ML interests

Retrieval, Computer Vision, LLM

Recent Activity

antoineedy new activity about 11 hours ago

vidore/vidore-leaderboard:Add ViDoRe V3 (MTEB embed)

manu new activity 6 days ago

vidore/colqwen2.5-v0.2:Training Hyperparameter for Colqwen2.5-v0.2 reproduce

manu new activity 15 days ago

vidore/colpali:Add LICENSE file

View all activity

vidore 's collections 11

ViDoRe Benchmark V3

ViDoRe V3 is our latest benchmark, engineered to set a new industry gold standard for multi-modal, enterprise document retrieval evaluation.

vidore/vidore_v3_hr

Viewer • Updated 30 days ago • 13.4k • 1.61k • 4
vidore/vidore_v3_finance_en

Viewer • Updated 30 days ago • 13.6k • 1.67k • 3
vidore/vidore_v3_industrial

Viewer • Updated 30 days ago • 16.7k • 1.53k • 1
vidore/vidore_v3_pharmaceuticals

Viewer • Updated 30 days ago • 14.9k • 1.15k

ColPali Models

Pre-trained checkpoints for the ColPali model.

vidore/colpali-v1.3-merged

3B • Updated Aug 4 • 8
vidore/colpali-v1.3

Visual Document Retrieval • Updated Mar 14 • 59.5k • 80
vidore/colpali-v1.2-merged

Visual Document Retrieval • 3B • Updated Feb 5 • 7
vidore/colpali-v1.2

Visual Document Retrieval • Updated Mar 14 • 28.7k • 112

ColSmolVLM

Pre-trained checkpoints for the ColVision models with a ColSmolVLM backbone.

vidore/colSmol-500M

Visual Document Retrieval • Updated Mar 14 • 2.02k • 20
vidore/colSmol-256M

Visual Document Retrieval • Updated Mar 14 • 2.07k • 17

ViDoRe Benchmark

Benchmark for document retrieval using visual features, introduced in the ColPali paper. Datasets are using the QA format.

vidore/arxivqa_test_subsampled

Viewer • Updated Jun 20 • 500 • 594 • 3
vidore/docvqa_test_subsampled

Viewer • Updated Jun 20 • 500 • 725 • 4
vidore/infovqa_test_subsampled

Viewer • Updated Jun 20 • 500 • 620 • 3
vidore/tabfquad_test_subsampled

Viewer • Updated Jun 20 • 280 • 607

ViDoRe Chunk OCR (baseline)

The ViDoRe benchmark was passed to Unstructured to partition each page into text chunks. Detected figures/tables were captioned with Claude 3-Sonnet.

vidore/arxivqa_test_subsampled_ocr_chunk

Viewer • Updated Jun 13, 2024 • 1.44k • 35
vidore/docvqa_test_subsampled_ocr_chunk

Viewer • Updated Jun 13, 2024 • 1.24k • 56
vidore/infovqa_test_subsampled_ocr_chunk

Viewer • Updated Jun 13, 2024 • 2.78k • 45
vidore/tabfquad_test_subsampled_ocr_chunk

Viewer • Updated Jun 13, 2024 • 636 • 14

ViDoRe Page OCR (artifact)

ViDoRe benchmark with the full OCR text of each page. ⚠️ This dataset serves a intermediate step → use "ViDoRe Chunk OCR (baseline)" for evaluation!

vidore/arxivqa_test_subsampled_tesseract

Viewer • Updated Jun 20 • 500 • 36
vidore/docvqa_test_subsampled_tesseract

Viewer • Updated Jun 20 • 500 • 40
vidore/infovqa_test_subsampled_tesseract

Viewer • Updated Jun 20 • 500 • 87
vidore/tabfquad_test_subsampled_tesseract

Viewer • Updated Jun 20 • 280 • 27

ViDoRe Benchmark v2

vidore/esg_reports_v2

Viewer • Updated Jul 2 • 2.91k • 6.37k • 1
vidore/biomedical_lectures_v2

Viewer • Updated Jul 2 • 3.74k • 6.06k
vidore/economics_reports_v2

Viewer • Updated Jul 2 • 4.32k • 5.62k
vidore/esg_reports_human_labeled_v2

Viewer • Updated Jul 2 • 1.72k • 5.76k

ColQwen2 Models

Pre-trained checkpoints for the ColQwen2 model.

vidore/colqwen2-v1.0-merged

Visual Document Retrieval • 2B • Updated Apr 16 • 18
vidore/colqwen2-v1.0

Visual Document Retrieval • Updated Jun 5 • 69.3k • 114
vidore/colqwen2-v0.1-merged

2B • Updated Mar 8 • 2
vidore/colqwen2-v0.1

Visual Document Retrieval • Updated Mar 21 • 43.8k • 193

Hf-native ColVision Models

Models that can be used with the native transformers 🤗 implementation instead of colpali-engine.

vidore/colqwen2-v1.0-hf

Visual Document Retrieval • 2B • Updated Jun 2 • 4.96k • 21
vidore/colpali-v1.3-hf

Visual Document Retrieval • 3B • Updated Apr 16 • 1.84k • 26
vidore/colpali-v1.2-hf

Visual Document Retrieval • 3B • Updated Apr 16 • 2.4k • 8
Sahil-Kabir/colqwen2.5-v0.2-hf

4B • Updated Sep 13 • 1.56k

ViDoRe Benchmark (BEIR)

Benchmark for document retrieval using visual features, introduced in the ColPali paper. Datasets are using the BEIR format.

vidore/arxivqa_test_subsampled_beir

Viewer • Updated Jun 20 • 1.5k • 6.44k • 1
vidore/docvqa_test_subsampled_beir

Viewer • Updated Jun 20 • 1.45k • 4.72k
vidore/infovqa_test_subsampled_beir

Viewer • Updated Jun 20 • 1.49k • 4.42k
vidore/tabfquad_test_subsampled_beir

Viewer • Updated Jun 20 • 630 • 4.4k

ColPali Paper Resources

Main resources for the paper: "ColPali: Efficient Document Retrieval with Vision Language Models"

ColPali: Efficient Document Retrieval with Vision Language Models

Paper • 2407.01449 • Published Jun 27, 2024 • 50
vidore/colpali

Visual Document Retrieval • Updated 15 days ago • 5.65k • 464
vidore/colpali_train_set

Viewer • Updated Jun 20 • 119k • 4.73k • 88
Running

189

Vidore Leaderboard

🥇

189

Browse and compare visual document retrieval models

ViDoRe Benchmark V3

ViDoRe V3 is our latest benchmark, engineered to set a new industry gold standard for multi-modal, enterprise document retrieval evaluation.

vidore/vidore_v3_hr

Viewer • Updated 30 days ago • 13.4k • 1.61k • 4
vidore/vidore_v3_finance_en

Viewer • Updated 30 days ago • 13.6k • 1.67k • 3
vidore/vidore_v3_industrial

Viewer • Updated 30 days ago • 16.7k • 1.53k • 1
vidore/vidore_v3_pharmaceuticals

Viewer • Updated 30 days ago • 14.9k • 1.15k

ViDoRe Benchmark v2

vidore/esg_reports_v2

Viewer • Updated Jul 2 • 2.91k • 6.37k • 1
vidore/biomedical_lectures_v2

Viewer • Updated Jul 2 • 3.74k • 6.06k
vidore/economics_reports_v2

Viewer • Updated Jul 2 • 4.32k • 5.62k
vidore/esg_reports_human_labeled_v2

Viewer • Updated Jul 2 • 1.72k • 5.76k

ColPali Models

Pre-trained checkpoints for the ColPali model.

vidore/colpali-v1.3-merged

3B • Updated Aug 4 • 8
vidore/colpali-v1.3

Visual Document Retrieval • Updated Mar 14 • 59.5k • 80
vidore/colpali-v1.2-merged

Visual Document Retrieval • 3B • Updated Feb 5 • 7
vidore/colpali-v1.2

Visual Document Retrieval • Updated Mar 14 • 28.7k • 112

ColQwen2 Models

Pre-trained checkpoints for the ColQwen2 model.

vidore/colqwen2-v1.0-merged

Visual Document Retrieval • 2B • Updated Apr 16 • 18
vidore/colqwen2-v1.0

Visual Document Retrieval • Updated Jun 5 • 69.3k • 114
vidore/colqwen2-v0.1-merged

2B • Updated Mar 8 • 2
vidore/colqwen2-v0.1

Visual Document Retrieval • Updated Mar 21 • 43.8k • 193

ColSmolVLM

Pre-trained checkpoints for the ColVision models with a ColSmolVLM backbone.

vidore/colSmol-500M

Visual Document Retrieval • Updated Mar 14 • 2.02k • 20
vidore/colSmol-256M

Visual Document Retrieval • Updated Mar 14 • 2.07k • 17

Hf-native ColVision Models

Models that can be used with the native transformers 🤗 implementation instead of colpali-engine.

vidore/colqwen2-v1.0-hf

Visual Document Retrieval • 2B • Updated Jun 2 • 4.96k • 21
vidore/colpali-v1.3-hf

Visual Document Retrieval • 3B • Updated Apr 16 • 1.84k • 26
vidore/colpali-v1.2-hf

Visual Document Retrieval • 3B • Updated Apr 16 • 2.4k • 8
Sahil-Kabir/colqwen2.5-v0.2-hf

4B • Updated Sep 13 • 1.56k

ViDoRe Benchmark

Benchmark for document retrieval using visual features, introduced in the ColPali paper. Datasets are using the QA format.

vidore/arxivqa_test_subsampled

Viewer • Updated Jun 20 • 500 • 594 • 3
vidore/docvqa_test_subsampled

Viewer • Updated Jun 20 • 500 • 725 • 4
vidore/infovqa_test_subsampled

Viewer • Updated Jun 20 • 500 • 620 • 3
vidore/tabfquad_test_subsampled

Viewer • Updated Jun 20 • 280 • 607

ViDoRe Benchmark (BEIR)

Benchmark for document retrieval using visual features, introduced in the ColPali paper. Datasets are using the BEIR format.

vidore/arxivqa_test_subsampled_beir

Viewer • Updated Jun 20 • 1.5k • 6.44k • 1
vidore/docvqa_test_subsampled_beir

Viewer • Updated Jun 20 • 1.45k • 4.72k
vidore/infovqa_test_subsampled_beir

Viewer • Updated Jun 20 • 1.49k • 4.42k
vidore/tabfquad_test_subsampled_beir

Viewer • Updated Jun 20 • 630 • 4.4k

ViDoRe Chunk OCR (baseline)

The ViDoRe benchmark was passed to Unstructured to partition each page into text chunks. Detected figures/tables were captioned with Claude 3-Sonnet.

vidore/arxivqa_test_subsampled_ocr_chunk

Viewer • Updated Jun 13, 2024 • 1.44k • 35
vidore/docvqa_test_subsampled_ocr_chunk

Viewer • Updated Jun 13, 2024 • 1.24k • 56
vidore/infovqa_test_subsampled_ocr_chunk

Viewer • Updated Jun 13, 2024 • 2.78k • 45
vidore/tabfquad_test_subsampled_ocr_chunk

Viewer • Updated Jun 13, 2024 • 636 • 14

ColPali Paper Resources

Main resources for the paper: "ColPali: Efficient Document Retrieval with Vision Language Models"

ColPali: Efficient Document Retrieval with Vision Language Models

Paper • 2407.01449 • Published Jun 27, 2024 • 50
vidore/colpali

Visual Document Retrieval • Updated 15 days ago • 5.65k • 464
vidore/colpali_train_set

Viewer • Updated Jun 20 • 119k • 4.73k • 88
Running

189

Vidore Leaderboard

🥇

189

Browse and compare visual document retrieval models

ViDoRe Page OCR (artifact)

ViDoRe benchmark with the full OCR text of each page. ⚠️ This dataset serves a intermediate step → use "ViDoRe Chunk OCR (baseline)" for evaluation!

vidore/arxivqa_test_subsampled_tesseract

Viewer • Updated Jun 20 • 500 • 36
vidore/docvqa_test_subsampled_tesseract

Viewer • Updated Jun 20 • 500 • 40
vidore/infovqa_test_subsampled_tesseract

Viewer • Updated Jun 20 • 500 • 87
vidore/tabfquad_test_subsampled_tesseract

Viewer • Updated Jun 20 • 280 • 27

AI & ML interests

Recent Activity

Team members 9

vidore 's collections 11

Vidore Leaderboard

Vidore Leaderboard