1. 引言
近年来,全球能源格局正在发生深刻变化,如何应对新形势下的严峻挑战,让传统油气企业“大象”在快速变化能源局势中能够“翩翩起舞”数字化转型,大力推进创新驱动发展或是当前破局之法。世界经济论坛研究数据表明,油气行业的数字化之路已经开启,到2025年数字化可为石油和天然气行业提供约1.6万亿美元的价值。数字化技术与油气行业的深度融合正驱动油气数字化转型。结合业务场景的数字化,人工智能技术,实现数据协同和数据驱动决策,正在成为国际油气企业的数字化战略重点。敏捷,高效,灵活的数字化新模式正引领油气颠覆性技术创新,必将给整个油气行业带来巨大变革。
2. 数字驱动,敏捷研发
敏捷研发的关键是数字驱动。以客户为中心和市场导向对油气行业研发快捷高效和灵活柔性提出了很高的要求。石油行业的领导者正在使用数字解决方案重新定义产品创新。通过引入信息化,人工智能,虚拟仿真等数字化手段,实现传统经验驱动到数字驱动的研发理念转变,有效降低研发成本,提高研发效率,加快产品上市,是数字化转型助力敏捷研发的核心,是企业保持竞争力和可持续性的关键。
“虚实融合,业务智能”是新一代“体验孪生”在油气研发领域的最佳实践。
油气行业的研发工作集中在实验室中进行,如何将实验室的日常研发工作有效数字化,并与现有成熟信息技术进行融合,是油气研发数字化转型的关键。针对这一关键挑战,达索系统BIOVIA通过整合“实验室全面数字化”,“科研数据智能”和“材料虚拟仿真”三个方向,引入“数据”,“智能”,“仿真”三项能力,支撑研究实验室,开发实验室和检测实验室的具体业务目标,有效结合实体实验和虚拟实验优势,借助人工智能和机器学习技术,实现虚拟现实的数据协同。
3. 敏捷研发第一步:全面实验室数字化
实验室数据的有效数字化,是实现研发数字化转型的前提。油气作为实验密集的传统行业,其实验过程和实验结果的记录往往需要通过人工方式来实现。尽管现阶段一些先进分析仪器或实验装置能够自动输出检测结果,LIMS(实验室信息化管理系统)也已经在部分检测实验室得到了使用。但在进行实验记录时,科研人员仍习惯于将实验步骤,过程和结果誊写至纸质实验记录本上。低效率,规范性差,管理存储困难等问题已经不能适应当今高速发展的研发需求。这就为能够全面追溯记录实验过程的数字化解决方案提出了迫切要求。
实验过程的数字化一般通过电子实验记录本(ELN,Electronic Lab Notebook)来实现。电子实验记录本是数字时代的实验记录本。在实现传统纸质实验记录替代的同时,能够享受数字化所带来的实验数据检索与共享协作,图像、语音等非结构数据的链接记录等红利,从而更有利于实验室经验知识的传承和分享。ELN系统以实验操作的记录为核心,支持实验室工作流程管理,能够对记录数据按照权限进行跨实验、多样本的对比分析。其广泛灵活的数据兼容使实验室的各种数据(非结构化数据,例如实验过程记录,音视频等;结构化数据,例如化学结构,原材料信息,仪器设备信息,电子表格等)均能够得到全面有效的管理,保证了数据完整性和可用性。
油气行业所使用ELN系统主要包含如下几大功能:
(1) 智能辅助实验设计
ELN系统能够提供实验设计工具,能够利用程序设定的科学实验设计方法对研究人员需要考察的影响因素和水平进行分析,并以单因素设计、正交实验设计、均匀实验设计等多种设计模式为研究人员科学合理地自动生成实验组合。系统支持重复性实验的记录可以直接“克隆”模板,提供化合物分子式拖拽设计和分子参数自动计算功能,有效提高新型材料设计能力和分子数据复用能力。支持根据用户需要选择需要克隆的模块,大量减少需要重复书写的内容。
(2) 规范化实验过程执行与数据记录
ELN系统基于实验模板进行实验过程执行和数据记录的规范化管理。系统通过界面友好的客户端,可以记录实验相关的全部内容,包含实验设计,过程记录,仪器读数,图文结果,文献引用,更可以支持复杂的研发工作流程,并提供了丰富的即开即用记录模块, 针对化学,化工,材料,分析,配方等各个领域都有精心设计的专用模块,方便记录各种不同类型(制备实验、合成实验、配方实验、分析实验、工艺实验,筛选实验)的实验过程和实验结果。油气企业还可根据需要定制个性化模块,用户可以非常便捷地设计所需的实验模板和功能应用,体验灵活而高效的电子化数据管理。
(3) 数据比对与分析展示
ELN系统支持跨越多个文档的数据汇总与集中展示,能够实现矢量谱图转换与对比,谱图与实验参数的多维度视图建立。提供强大的化学结构处理功能,通过输入的化学结构自动计算机分子式、分子量。提供自动计算避免人工输入错误,通过输入的投料表自动计算产率;根据记录的密度和化合物进行体积与质量的自动换算。并提供数据统计和动态报表展示功能,支持项目进度统计、辅助人员工作量统计、辅助仪器利用率统计。
(4) 智能数据搜索
ELN系统提供关键字检索、化学结构式检索、谱图注释检索、全文检索等功能。还能够与通用化合物数据库结合,科技检索更加精准、高效,减少科研创新的时间和成本,凝聚创造力的捷径,用更少的时间产生更多的化合物。
(5) 自动数据采集
ELN系统能够支持实验仪器数据的自动上传功能,减少人工输入错误,提高工作效率。针对色谱等带有工作站的仪器,通过智能数据采集系统,完成实验数据的自动采集;针对带有COM口/USB口的小型仪器,采用专用的接口软件与智能数据采集系统相结合的方式,完成数据的自动化采集;针对观察型实验结果进行简单采集,支持图像,文本,手写以及扫描等多种数据类型。
(6) 信息系统集成
ELN系统具有强大的二次开发能力,并提供丰富的接口程序,方便与其它信息系统的集成。支持与LIMS实验室信息管理系统,化学试剂与设备管理系统,危化品管理系统,门户系统等信息化系统的集成。在与现有LIMS系统集成时,能够实现在ELN系统中直接发送样品分析请求调用LIMS系统,并获取分析结果,无须在不同软件系统之间切换。
4. 敏捷研发第二步:科研数据智能
在当今竞争激烈的油气行业,研发机构都希望通过集成的、数据驱动的方法,将强大的预测模型与先进的数据分析和机器学习结合起来,以获得新的洞察力,加快创新速度并降低成本,从而实现创新。当前在油气研发领域,数据探索和分析工作流程存在如下难点:
脱节的系统和不同的数据源阻碍了充分利用数据的能力;
当前的数据科学解决方案无法提供研发所需的专用领域功能;
数据科学上手困难,阻碍模型的广泛部署和使用。
在油气研发领域,基于全面实验室数字化所得有效数据,能够使用数据科学工具针对业务场景进行数据智能应用,最典型的应用场景包括:配方推荐系统,实验数据看板和智能搜索引擎。
配方推荐系统能够基于现有配方数据进行数学建模,针对多组分配方进行分析,预测不同配方组成,添加剂含量,种类等因素对产品性能的影响,在考虑成本的条件下,指导新配方的开发工作。并将配方和工艺优化结合,通过对现有实验数据的分析,获取工艺条件的参数,顺序等对产品性能的影响。
实验数据看板能够对实验室运行情况进行趋势追踪和实时动态数据查看。实时追踪原料库存,仪器设备,人员工作量,实验进度等动态信息。通过优化仪器使用效率,减少无效和重复实验,促进数据共享,有效提高实验室运营效率。
智能搜索引擎能够针对科研数据进行智能检索和动态展示。它不仅能够针对结构化数据(例如文本,表格)进行检索,还能够对化学实验室中常见的化学式、官能团、甚至分子结构片段等非结构化数据进行智能检索。并拥有可定制的多目标优化和检索能力,支持使用表格、图表、图片和文字等定制数据报告,对数据分析和数据挖掘过程进行总结和展示。
在生产领域,还能够通过图像识别和IoT技术结合,对生产质量回溯,生产质量管理和设备预测性维护等方向进行有效的数据科学应用。
科研数据智能通过汇集多个数据源并简化复杂分析和机器学习任务的创建,使复杂的数据处理和分析任务自动化。凭借其易于使用的图形化开发环境,使数据科学家能够设计出满足其需求的数据科学和机器学习解决方案,然后将这些工作流程作为最佳实践在整个组织中共享。
通过数据智能应用从现有数据中获得最大收益,充分利用已有资源;
使用预测分析和机器学习,通过数据驱动的可重复流程增强研发效率;
使用自助式建模工具来提高研究人员对数据的认知水平并提高工作效率;
降低学习成本,通过拖放界面将编码减少到最小;
自动化数据处理,自动执行数据聚合,融合,合并和清理;
通过网络服务和应用程序简化部署,快速推广最佳实践;
支持云端部署,以快速实施并实现价值增值。
5. 敏捷研发第三步:材料虚拟仿真
基于分子模拟和人工智能的新一代材料虚拟仿真,是第四科研范式的重要支撑。以材料虚拟仿真技术为核心的材料基因工程融合数字化技术和材料研发,是“中国制造2025”的关键内容之一,已作为重大战略任务在“新材料重大工程”专项中布局。自上世纪80年代起,国际各大石油化工企业广泛将材料虚拟仿真技术应用于研发领域,并将材料虚拟仿真技术与信息化技术结合,有效提高研发效率。在油田化学、催化剂研制、高分子设计、化学工程及重油特征化等领域,分子模拟技术有着越来越广泛的应用。
在产品开发中引入基于计算机仿真技术的材料虚拟仿真和高通量虚拟筛选,能够有效降低试错成本,缩短产品开发设计周期,增强企业竞争力。
材料虚拟仿真能够实现:
先于实验预测材料性能,进行配方筛选,优化工艺流程设计,从而缩短研发周期、降低项目淘汰率,提高研发效率,降低开发风险;
部分代替化学合成、结构分析、物性检测等实验,减少仪器占用率,降低总体研发成本;
提高企业的管理创新、业务拓展、降本增效、信息化水平及核心竞争力水平。
材料虚拟仿真在催化剂开发中能够基于量子力学预测反应活性位点,考察催化反应机理。
针对润滑油,高分子和流体微观分析,材料虚拟仿真在纳米尺度采用基于分子力学的物理模型能够预测扩散、渗透、表面吸附分子取向和粘度等性质。
针对高分子、新型复合材料,材料虚拟仿真在微米尺度采用基于介观方法的物理模型进行仿真预测。
针对液相热力学行为,材料虚拟仿真能够基于COSMO-RS预测极性组分的分配系数,萃取及液液相平衡,溶解度和固液相平衡,气体溶解度和复杂体系增气压,吸附模型,界面张力,纯物质的密度和粘度等。
通过引入高通量虚拟筛选,快速筛选目标材料。
财富500强公司的成功经验表明,材料虚拟仿真应用的引入能够有效提高实验研发效率,加速研发人员的能力建设,加深研发理解;作为新型工具有效丰富现有研究手段,拓宽研究思路;并通过前期筛选有效控制研发风险,规避可能的危险实验。引入材料虚拟仿真够减少25%的实际项目支出,减少60%数据获取耗时,减少最多40%的实际实验次数,缩短50%的项目周期,总体提高研发效率25%以上。