
Meta 发布 ReasonIR-8B:破解复杂推理检索难题

ReasonIR-8B采用双编码器(bi-encoder)架构,将查询和文档独立编码为嵌入向量,通过余弦相似度评分。其训练数据包括长达2000个token的多样长度查询(VLQueries)和需逻辑推理的困难查询(HQ),有效提升模型处理长上下文和抽象问题的能力。
在BRIGHT基准测试中,该模型原查询得分达24.4nDCG@10,结合Qwen2.5重新排序后提升至36.9,远超更大的Rank1-32B模型,且计算成本低至后者的1/200。此外,在MMLU和GPQA等RAG任务中,模型分别带来6.4%和22.6%的显著提升。
MetaAI目前已在HuggingFace上开源ReasonIR-8B模型、训练代码及合成数据工具,鼓励研究社区进一步探索多语言和多模态检索器的开发。附上参考地址