sarosavo
/

Master-RM

Text Classification

text-generation

text-embeddings-inference

Model card Files Files and versions

sarosavo commited on Jul 15, 2025

Commit

9fd43a7

·

verified ·

1 Parent(s): e5186bd

Update README.md

Files changed (1) hide show

README.md +1 -1

README.md CHANGED Viewed

@@ -29,7 +29,7 @@ This repository contains a robust, general-domain generative reward model presen
 - **Paper**: [One Token to Fool LLM-as-a-Judge](https://huggingface.co/papers/2507.08794)
 - **Training Data**: [https://huggingface.co/datasets/sarosavo/Master-RM](https://huggingface.co/datasets/sarosavo/Master-RM)
-- **Code/GitHub Repository**: [https://github.com/Yulai-Zhao/Robust-Reward-Model](https://github.com/Yulai-Zhao/Robust-Reward-Model)
 - **Training algorithm**: Standard supervised fine-tuning, see Appendix A.2 for more details.
 ## Model Description

 - **Paper**: [One Token to Fool LLM-as-a-Judge](https://huggingface.co/papers/2507.08794)
 - **Training Data**: [https://huggingface.co/datasets/sarosavo/Master-RM](https://huggingface.co/datasets/sarosavo/Master-RM)
+<!-- - **Code/GitHub Repository**: [https://github.com/Yulai-Zhao/Robust-Reward-Model](https://github.com/Yulai-Zhao/Robust-Reward-Model) -->
 - **Training algorithm**: Standard supervised fine-tuning, see Appendix A.2 for more details.
 ## Model Description