Direct Preference Optimization of Video Large Multimodal Models from Language Model Reward.

Published in: CoRR (2024)

Keyphrases