Advancing Large Multi-modal Models with Explicit Chain-of-Reasoning and Visual Question Generation.

Kohei Uehara Nabarun Goswami Hanqin Wang Toshiaki Baba Kohtaro Tanaka Tomohiro Hashimoto Kai Wang Rei Ito Takagi Naoya Ryo Umagami Yingyi Wen Tanachai Anakewat Tatsuya Harada

Published in: CoRR (2024)

Keyphrases