Skywork-Reward-Model - a Skywork Collection

Skywork 's Collections

Skywork-Unipic3

Skywork-Unipic2

Skywork-MindLink

Skywork-Reward-V2

Skywork-o1-Open

Skywork-Reward-Model

Skywork-Reward-Data-Collection

Skywork-Critic-Models

Skywork-Reward-Model

updated Mar 2

Skywork reward model series

Skywork-Reward: Bag of Tricks for Reward Modeling in LLMs

Paper • 2410.18451 • Published Oct 24, 2024 • 21
Skywork/Skywork-Reward-Gemma-2-27B-v0.2

Text Classification • 27B • Updated Oct 25, 2024 • 1.18k • 34

Note A new version of our 27B reward model trained on Skywork-Reward-Preference-80K-v0.2, the decontaminated version of Skywork-Reward-Preference-80K-v0.1
Skywork/Skywork-Reward-Llama-3.1-8B-v0.2

Text Classification • 8B • Updated Oct 25, 2024 • 66.3k • 43

Note A new version of our 8B reward model trained on Skywork-Reward-Preference-80K-v0.2, the decontaminated version of Skywork-Reward-Preference-80K-v0.1
Skywork/Skywork-Reward-Gemma-2-27B

Text Classification • 27B • Updated Oct 25, 2024 • 17 • 50
Skywork/Skywork-Reward-Llama-3.1-8B

Text Classification • 8B • Updated Oct 25, 2024 • 11.2k • 33