南极鹅
您的位置:光伏分布式光伏工商业光伏企业正文

2026油气数智化发展高峰论坛:专家呼吁全行业协同打造高质量石化数据集

2026-05-20 19:48:40来源:互联网

在2026中国石油石化企业信息技术交流大会暨油气产业数智化发展高峰论坛上,与会嘉宾的讨论始终围绕“数据”展开——“数据治理”与“高质量数据集建设”成为全场高频热词。作为人工智能发展的核心基础,当前石油石化行业的数据资源虽体量庞大、覆盖全面,却面临完整性不足、质量不高的困境,深层价值尚未得到充分挖掘。如何让智能化转型产生切实效益?多位与会专家形成共识:全行业协同构建高质量数据集,是实现这一目标的核心路径。

中国工程院院士刘合在论坛上直指行业核心痛点:油气行业数据基础薄弱,“有数据无质量”的问题尤为突出。以勘探开发数据为例,这类数据不仅标准不统一、非结构化特征明显,海量数据背后是精准度不足的尴尬;同时上游数据还存在小样本、多解性、不可重复性等天然属性;更关键的是,高质量标注数据稀缺,人力投入也难以跟上需求。此外,石油石化行业数据涉及国家安全与商业机密,跨单位共享机制不健全,进一步制约了数据价值的释放。

中国海洋石油集团有限公司科技与数字化部原总经理单彤文对此深有同感,他提到,目前行业内尚未形成统一的全行业数据集,即便各集团内部,跨子企业、跨业务领域的数据集中也鲜有真正落地的案例。“阻力主要来自体制和观念,而非技术。”他认为,需要搭建互利互惠的平台,让各业务部门、各级企业的数据资源能有效联动,真正实现数据资源化。

中国石油化工集团有限公司副总工程师、信息和数字化管理部总经理王子宗也坦言,数据治理是信息化与智能化的基础,也是最难啃的硬骨头。“华为的数据治理用了近17年,而石油石化行业的数据广度和复杂程度,比离散制造业有过之而无不及。”据他介绍,中石化从2020年启动上中下游全业务数据治理,目前总部经营管理、销售电商领域的治理已基本完成,生产管理仍在推进中,累计形成570亿条高质量行业数据,这是多年深耕的成果。

什么才是真正的高质量数据集?中国石油化工集团有限公司信息和数字化管理部副总经理蒋楠给出了清晰界定:并非数据堆砌或单纯质量高就算数,而是要符合国家标准,即“具有一定主题,可以标识并可以被计算机化处理的数据集合”。在他看来,高质量数据集需满足三个核心要点:一是有明确主题,所有数据围绕特定目标归集;二是可标识,每条数据都能被精准识别、定位;三是可计算机处理,必须是机器能读懂、运算的格式。“能切实提升人工智能效能的,才算得上高质量数据集。”

基于这一标准,中石化启动了三个“1”工程:以1套面向石化行业的高质量数据集建设方法论为指导,打造1组覆盖全链路的高质量数据集工具,建设1批多模态行业高质量数据集。2025年8月,中石化“石油化工领域高质量数据集”成功入选国家数据局高质量数据集典型案例。

中国石油集团总经理助理、首席信息官乔辉强调,高质量数据集是支撑模型能力的核心基础。他分享了中石油的工程化实践:按业务领域成立专业语料工作组,采用“四阶八步”工作法,构建“数据—模型—应用—反馈回流”的完整闭环。目前,中石油已参编4项国家标准,研制2项企业标准、81项数据采集与标注规范,建成600TB高质量行业数据集,其中地球物理测井、炼化时序数据集均入选国家数据局高质量数据集典型案例。

中国海洋石油集团有限公司智慧数据部副总经理陈溯介绍,中海油近年来高度重视数据治理,先后获评国家数据局高质量数据集与DCMM五级认证。“两年前,为了理顺庞大的数据资源,我们提出并实施了‘采运分离’,彻底将采集系统与应用系统拆分,当时甚至停用了近700个系统。”他坦言,虽然初期付出了不小代价,但如今成效正逐步显现。

面对行业数据体量庞大、治理环境复杂的现状,如何破局?刘合提出,要在保障数据安全的前提下,推动跨单位数据协同。“我们需要从体制机制层面入手,构建安全传输、存储、计算的体系。数据不流通,计算能力就无法提升;但数据流通又面临商业秘密泄露的风险。”他呼吁,各方应共同探索建立具备保密运行机制的共有算力中心,破解这一矛盾。

“协同”成为现场专家的共识。无论是企业内部的信息互联互通,还是全行业的数据集共建,都需要行业站在更高层面达成一致、合力推进。王子宗感慨道:“人工智能的应用是行业发展的必然趋势,而非可选项。我们正处在数智化转型的关键阶段,必须打好基础,做好生态建设。”中石化内部早已明确,数据治理既是技术工作也是管理手段,需要各部门集体发力,共同支撑企业数智化转型。

多位专家还强调了复合型人才培养的重要性。单彤文提到,明确数据背后的属性,需要大量人力、脑力的投入。王子宗也认为,队伍建设与能力建设、生态建设同等关键。“既懂人工智能、又懂信息化、还懂专业技术的复合型人才十分稀缺。”为此,中石化建立了“域长负责制”,将全集团划分为20个域、32个分域,由域长牵头负责业务流程标准化、数据治理、深化应用及人工智能相关工作。该机制已运行四年,每季度召开全集团局长会,党组主要领导亲自参与半年会与年度会议,自上而下推动数智化转型落地见效。

这场聚焦油气数智化的高峰论坛,不仅梳理了行业数据治理的痛点与难点,更通过各大企业的实践案例,为全行业指明了方向。在数智化转型的浪潮中,全行业协同构建高质量数据集,将成为石化行业挖掘数据深层价值、实现智能化升级的核心路径。

特别声明:南极鹅转载其他网站内容,出于传递更多信息而非盈利之目的,同时并不代表赞成其观点或证实其描述,内容仅供参考。版权归原作者所有,若有侵权,请联系我们删除。

凡来源注明南极鹅*网的内容为南极鹅原创,转载需获授权。

阳光新能源查看更多>工商业光伏查看更多>屋顶光伏查看更多>