1 2

Mehul Damani PRO

mehuldamani

https://damanimehul.github.io

AI & ML interests

Reinforcement Learning, Large Language Models

Recent Activity

published a model about 14 hours ago

mehuldamani/qwen25noInstruct_rlvr_multi_veryHardDataset_moreThinking

published a model about 19 hours ago

mehuldamani/qwen25noInstruct_SFTed_rlvr_multi_veryHardDataset_moreThinking

published a model about 19 hours ago

mehuldamani/qwen25_rlvr_single_veryHardDataset

View all activity

Organizations

None yet

Collections 1

Papers 4

models 210

datasets 57

mehuldamani/aime

Viewer • Updated 1 day ago • 78 • 8

mehuldamani/multi-answer-sft-target-dataset

Viewer • Updated 5 days ago • 1.59k • 8

mehuldamani/big-math-very-tough

Viewer • Updated 7 days ago • 12.5k • 54 • 1

mehuldamani/hotpot_qa_test_gold_removed_1

Viewer • Updated Jan 26 • 20.5k • 9

mehuldamani/hotpot_qa_test_gold_removed_2

Viewer • Updated Jan 26 • 20.5k • 9

mehuldamani/hotpot_qa_trainTest_gold_removed_2

Viewer • Updated Jan 26 • 20.5k • 8

mehuldamani/hotpot2Removed_eval_10Runs_rlvr_multi_on_rlcr_multi

Viewer • Updated Jan 25 • 500 • 7

mehuldamani/big-math-tough

Viewer • Updated Jan 20 • 18.5k • 44

mehuldamani/medTroubleshootig-rlvr-220-evaled-on-rlcr

Viewer • Updated Jan 15 • 5k • 6

mehuldamani/medTroubleshootig-rlvr-220-evaled-on-rlvr

Viewer • Updated Jan 15 • 5k • 4

View 57 datasets

Mehul Damani PRO

AI & ML interests

Recent Activity

Organizations

Collections 1

mehuldamani/big-math-digits-v2-correctness

mehuldamani/hotpot-v2-correctness-7b

mehuldamani/orm-big-math-digits-v2-correctness

mehuldamani/big-math-digits-v2-brier

mehuldamani/big-math-digits-v2-correctness

mehuldamani/hotpot-v2-correctness-7b

mehuldamani/orm-big-math-digits-v2-correctness

mehuldamani/big-math-digits-v2-brier

Papers 4

models 210

mehuldamani/qwen25noInstruct_rlvr_multi_veryHardDataset_moreThinking

mehuldamani/qwen25noInstruct_SFTed_rlvr_multi_veryHardDataset_moreThinking

mehuldamani/qwen25_rlvr_single_veryHardDataset

mehuldamani/sfted2_rlvr_multi__veryHardDataset_moreThinking

mehuldamani/sfted_rlvr_multi__veryHardDataset_moreThinking

mehuldamani/qwen25Instruct_rlvr_single_veryHardDataset

mehuldamani/qwen25Instruct_rlvr_multi_veryHardDataset_moreThinking

mehuldamani/qwen25Instruct_rlvr_multi_hardDataset_moreThinking

mehuldamani/sft-base-half-tranches-v1-global-step-394

mehuldamani/qwen25Instruct_rlvr_single_hardDataset

datasets 57

mehuldamani/aime

mehuldamani/multi-answer-sft-target-dataset

mehuldamani/big-math-very-tough

mehuldamani/hotpot_qa_test_gold_removed_1

mehuldamani/hotpot_qa_test_gold_removed_2

mehuldamani/hotpot_qa_trainTest_gold_removed_2

mehuldamani/hotpot2Removed_eval_10Runs_rlvr_multi_on_rlcr_multi

mehuldamani/big-math-tough

mehuldamani/medTroubleshootig-rlvr-220-evaled-on-rlcr

mehuldamani/medTroubleshootig-rlvr-220-evaled-on-rlvr

Mehul Damani PRO

AI & ML interests

Recent Activity

Organizations

Collections 1

Papers 4

models 210 Sort: Recently updated

datasets 57 Sort: Recently updated

models 210

datasets 57