研究团队提出Geo-Image-Textualization框架,利用强化学习与可验证奖励生成高质量几何图像-文本数据。首个完全对齐的高质量几何图像-文本数据集GeoReasoning-10K包含1万对数据。该方法不仅提升模型几何推理能力,还能泛化至算术、代数等非几何任务,甚至处理非几何图像。实验表明,GeoReasoning-10K在权威基准上表现优异,且能显著提升模型多项能力,为多模态AI在教育、科学计算等领域应用奠定基础。
💡 **Geo-Image-Textualization框架与GeoReasoning-10K数据集:** 该研究提出了一种新颖的基于强化学习与可验证奖励(RLVR)的数据生成与优化框架,命名为Geo-Image-Textualization。为支持此框架,研究团队发布了首个完全对齐的高质量几何图像-文本数据集GeoReasoning-10K,包含1万对精心构建的图像与描述。这为解决多模态大语言模型在几何推理方面的瓶颈提供了新的解决方案,并已开源数据集和代码以促进社区发展。
🚀 **强大的泛化能力与高质量表现:** 采用Geo-Image-Textualization框架训练的模型,不仅在几何推理任务上表现出色,还能有效泛化至算术、代数、数值推理等更广泛的数学领域,甚至能处理非几何图像输入。GeoReasoning-10K数据集经过精心构建,确保了生成数据的质量,使得在该数据集上训练的模型在下游任务上性能超越其他同类型数据集,并展现出良好的缩放性质。
🧩 **可扩展的几何题目生成机制:** 该框架的核心优势之一在于其可扩展性。生成的几何题目样本由预设模板中的字句组合而成,这种设计使得研究人员能够组合出任意复杂度水平的几何题目,极大地丰富了训练数据的多样性,并为模型提供了更全面的学习机会,从而提升其解决复杂几何问题的能力。