Direct Multi-Turn Preference Optimization for Language Agents.

Wentao Shi Mengqi Yuan Junkang Wu Qifan Wang Fuli Feng

Published in: CoRR (2024)

Keyphrases