中国教育报-中国教育新闻网讯(记者 阿妮尔)日前,南京农业大学正式发布司农大语言模型(Sinong)。该模型是国内首个面向通用农业领域的开源垂直大语言模型,也是南京农业大学主导研发的首个农业领域大语言模型,其发布标志着南京农业大学在农业领域人工智能基础模型研究与应用上的新突破。
据悉,“司农”命名取自中国古代财政与农业管理官职体系,该大语言模型重点服务农业领域。研究团队依托学校农业领域顶尖学科优势,收集了包括动物科学、农业经济管理、农业资源与环境、园艺学、智慧农业、动物医学、植物保护、作物育种等细分学科数据,涵盖了近9000册书籍、24万余篇学术论文和近2万份政策、标准以及海量网络知识,构建了体系相对完整、质量过硬的农业基础数据集。
针对大语言模型在专业领域应用中常见的“幻觉问题”和知识滞后性,团队进行了全方位技术攻坚。在模型训练阶段,除传统指令微调外,引入思维链和上下文参考等多维训练数据,显著提升模型对于农业专业知识的理解与生成能力。此外,针对领域文献知识利用效率问题,推出多智能体检索增强框架。该框架通过优化知识库构建、智能查询改写、混合检索等策略,使模型能够精准调用专业知识,有效保障了生成内容的准确性与时效性,为模型在科研、教育、生产等场景的可靠应用提供了保障。
目前,司农大语言模型已在魔塔社区和GitHub社区全面开源,发布了8B和32B两种参数规模版本。这一开源开放策略,旨在降低农业AI应用门槛,助力广大科研机构、企业和开发者基于司农大语言模型进行二次开发与创新应用,共同培育智慧农业的应用生态。
作者:阿妮尔


