“东北地区植被覆盖厚、岩石出露少,给地质找矿增添很大难度,如何创新模式实现找矿新突破?”“经过40多年的地质勘查工作,积累了大量地质数据,取得了一系列找矿成果和地质认识,但对海量数据和系列成果分析不够、研究不深,如何更好地利用以往成果资料助力新一轮找矿突破战略行动?”“传统找矿模式已不能完全适应国家战略需求,如何精准高效获得找矿新成果?”……单位改革转制以来,这些问题一直困扰着中国地质调查局哈尔滨自然资源综合调查中心(以下简称“哈尔滨中心”)党委班子成员和广大找矿科技人员。
近日,经过一年多的精心谋划、集智攻关、综合验证,哈尔滨中心大数据智能找矿这一有效载体解答了上述一串串问题。哈尔滨中心通过大数据智能找矿工作,系统预测研究区内铜矿和金矿成矿潜力,先后圈定铜矿预测区8处,金成矿预测区11处。其探索建立的从成矿要素选取、数据挖掘、模型训练、预测评价的大数据成矿预测模型和方法科学管用,极大提高地质找矿工作效率和精准度。
群山四应布“棋局”
党的十八大以来,以习近平同志为核心的党中央作出建设数字中国的重大决策部署,把发展数字经济上升为国家战略。其中《国家大数据行动纲要》提出,在地质找矿领域,围绕新一轮地质找矿突破战略行动,聚焦基础调查区、重点调查区、重点勘查区、重要矿山深边部开展地质数据资源的集成整合,探索构建基于大数据和人工智能的找矿预测模式,全面支撑重点成矿区带新一轮找矿和增储上产。《新一轮找矿突破战略行动“十四五”实施方案》提出,要构建战略性矿产资源“一张图”大数据体系,加强地质矿产数据的整合分析与应用。《地质调查信息化“十四五”规划》要求,要构建地质大数据科学研究范式,建立地质数据密集型科学范式相关关系理论应用模型,在成矿预测、水资源变化模拟、地质灾害预测预警等领域示范应用,助力地质调查工作模式改变。
国家有需求,队伍有行动。作为地质勘查的“国家队”,哈尔滨中心党委始终心怀“国之大者”,坚持主责主业,紧盯新形势新任务新要求,认真对标对表,积极响应党中央号召。在全国新一轮找矿突破战略行动部署后,第一时间召开“诸葛亮”会,集智研究落地落实的对策办法。
“这么多年来,我们收集整理了大量基础地质资料,但系统分析还不够,需要综合研究。”“地质勘查作为一门科学,是有规律可循的,很有必要以数字化的方式汇总分析。”“地质找矿是咱们老本行,有基础有底蕴,要千方百计在新一轮找矿突破战略行动中‘露一手’,关键在于创新。”与会代表你一言我一语。经过反复研究论证,一个用智能大数据找矿的建议赢得了在场人员的一致赞许。
行动是通向成功的唯一途径。哈尔滨中心精心抽调地质、物探、化探、遥感、信息化等专业的科技人员组建大数据智能找矿专班,从收集以往工作区海量数据入手,有计划有步骤地开展综合研究分析,探索建立数字找矿模型,用科技力量支撑新一轮找矿突破战略行动。
独辟蹊径落“棋子”
万事开头难。立项之初,智能找矿团队的压力是空前的。他们深知,这种创造性开拓性的工作没有经验可借鉴,没有模式可效仿,感到推起来一头雾水、十分迷茫,找不到下手之处。但初生牛犊不怕虎,年轻的团队成员紧盯国家战略需要和目标导向,认真研究人工智能时代下信息技术在地质找矿中的应用。他们连续工作数日查资料、问专家、搞研讨,寻找大数据智能找矿的立项依据、方法路径以及突破节点。在团队的共同努力下,几易其稿的立项报告顺利通过了专家组验收。
从无到有、破旧立新的创新之路,注定道阻且长、充满激流险滩,需要持之以恒的毅力和闯关夺隘的勇气。大量的数据收集汇总后,团队在选择研究区上陷入了困境,几次试验后,效果均不佳。有的成员开始灰心丧气,甚至要打退堂鼓。团队负责人带头研究,又跟进引导、加油鼓劲,把 “唯创新者强,唯创新者胜”作为团队建设的座右铭,定期召开碰头会、分享会,报告进展情况,分享最新成果,部署下步任务。
经过多轮论证,智能找矿团队最终将研究区定为东乌珠穆沁旗—嫩江成矿带的多宝山—黑河Cu-Mo-Au-Fe-Zn成矿亚带。该成矿带至今已发现超大型Cu矿床2个、大中型Cu-Pb-Zn矿床6个、大中型Au矿床8个、大型Ag矿床1个,地质、物探、化探、遥感、勘探和矿山开采、文献资料等数据翔实,是国内外学者研究的热点区带。
研究区确定后,关键是寻找技术路径。如何让海量的数据关联起来,这又成了困扰团队的最大技术难题。团队副负责人自小就有计算天赋,学习地质专业的他在大学期间便能自主编程,并研制开发过多个实用软件程序。
破冰攻坚的日子里,他与团队相关成员没日没夜搞研究、作试验,对获取的数据反复归并、屡次处理,千方百计构建数字成矿带,力争实现地质找矿信息透明立体表达。那段时间,他们住在办公室,没有睡过一个囫囵觉,有时有了新想法新思路第一时间跑到电脑前输入数据,逐一论证。团队成员感慨地说,“寻找技术路径时,我们都快魔怔了。”
功夫不负有心人。经过数十次的验证,团队通过数据降维、分类提取多源找矿信息,选定了利用神经网络、集成学习和深度学习组合的技术路径,开展典型矿床中各数据之间的监督学习,分析数据间的关联关系,建立起具有代表性的数字找矿模型,探索形成了大数据智能找矿预测技术方法。
步步为营筑“棋势”
付出终有回报,努力总有收获。经过智能找矿团队14个月的潜心钻研,成功构建多宝山—黑河数字成矿带,探索出建库方法,建立出三维场景,开发出软件系统,研究出预测流程,有力支撑了重点勘查区资源潜力评价。
一是构建多宝山—黑河数字成矿带。智能找矿团队综合整理近40年来的公开地质数据和文献资料,应用GIS技术手段,构建多宝山—黑河数字成矿带。内容主要包含地形地理、基础地质、地球化学、地球物理、矿产数据、遥感数据、报告及文献7个方面,数据库采用了统一的文件组织和数据属性字段,数据量10.4GB,属性记录25万条。
二是探索出建库方法。在数据库建立过程中,智能找矿团队系统规范数据的组织形式、属性结构,并对数据的分层存储制作了规范性的标准,实现数据组织、文件分层、属性指标、属性字段、文件格式五个统一。在应用过程中,团队总结探索出一套从资料收集、文件组织、结构标准化、数据清洗的建库流程和技术方法。
三是建立出多宝山—黑河一带的三维场景。智能找矿团队依托ArcSense软件,深化利用已建立的数字成矿带,再现多宝山—黑河的三维场所景,而且叠加了地物化遥数据,成功实现了数据立体存储和表达。
四是开发出用于智能找矿预测的辅助软件系统(GeoAI)。智能找矿团队采用python作为开发语言,利用sklearn库进行机器学习。该系统具有常见矢量数据读取、属性数据处理、算法模型、模型训练、分析评测和图像处理等五大功能,既能有效对数据的补充、异常值查证、数据量纲变换等预处理,又能快速制作直方图、散点图等插图,还能支持机器学习模型的训练、评价、预测、再学习,实现评价结果图形化显示的清晰化精准化。
五是研究出通过地质数据实施智能预测的流程。智能找矿团队深入总结研究区内矿床成矿特征,归纳出与成矿相关的地质体、构造、地球化学、地球物理、遥感和地形6大要素,针对不同要素和表达方式提取相关数据,利用GIS软件通过网格单元法,建立了用于多宝山—黑河一带大数据智能预测的基础数据,其网格数据高达153万余条;利用自制研发的GEOAI软件对要素信息提取和数据实施预处理,确保数据满足机器学习的基础要求。通过多个预测方法实验,团队研究得出采用回归算法中的层次感知(人工神经网络)法进行数据训练和预测。实验结果表明,测试数据准确率高达98.9%。
探索是穿越迷雾的灯塔,是解答谜题的钥匙。哈尔滨中心将继续加大在大数据智能找矿预测领域人力、物力、财力的投入力度,用实际行动助力国家新一轮找矿突破战略行动。