一、【人工智能】国际油气巨头,是如何玩转“大模型”的?
OpenAI从2023年3月发布ChatGPT/GPT-4以来,生成式人工智能(AIGC)成为当今世界能够在各个行业和专业领域被视为最有前途的一项通用技术,不到半年时间就会有一款新产品分布,今年5月14日发布了GPT-4o(o是omni的缩写,有全知的意思),这款产品不仅仅可与用户进行高质量文本对话,而且可实现有情感色彩的语音对话。可正确理解人类的复杂思想,在文学、数学、物理、编程、视觉、医学、法律、会计、心理学、绘画及音乐等不同领域展示出了高水平的专业知识,可完成复杂的任务。GPT-4o与以往AI产品比较具有两大特征:一是可以像人一样不间断的实现与人的交互对话,二是实现了多领域、多任务的执行都统一到了同一个对话框中。这两大特征都是目前所有AI产品所不具备的。
全球各行各业都对该产品极度关注,掀起了百模大战的局面。全球油气行业也不例外,2023年第3期国际石油工程师协会权威杂志《石油技术(JPT)》发文宣称:ChatGPT可在地质、地球物理、油藏、钻井、完井、采油、地质力学、井筒完整性、预测性维护与虚拟助理等10大领域应用,彻底变革传统油气工业领域的高投入、风险高及效率低等挑战。时隔1年,该杂志今年同期宣称:目前,没有一种模型像 GPT-4那样准确,使其能够在更多领域得到应用。
AIGC成为数据科学和工程分析学科最有前途的技术,如果不使用GPT-4是一个错误,跟上它并参与其发展,对于公司保持竞争力至关重要。笔者需要强调的是:GPT-4本质上是一种可与自然人进行交互的“智能体(Intelligent Agent, IA)”,不是一种“大模型(LM)”,由于OpenAI在研发ChatGPT/GPT-4时,使用了构建“大语言模型(LLM)”的技术,所以,在某种程度上ChatGPT/GPT-4成了LLM的热门象征。但发展行业IA,要实现IA与人的交互以及辅助决策功能,需要走出局限在LM的误区之中,LM不等于LLM,通常意义上的LM是没有交互功能的。下文所言的LLM,实际上是IA。
该公司开发LLM,研究解决了数据稀缺和特定领域的语言挑战,展示了该模型在特定石油和天然气任务和定性测试中的性能。为此,在能源和石油和天然气领域收集了33000 个文档高度多样化的数据集,用以训练模型和基准测试。结果表明,即使是对特定领域数据进行适当微调的小型模型,优于在通用语料库上训练的LLM,这突出了在技术领域微调LLM的好处,有助于推进石油和天然气行业的LLM发展,强调解决特定领域的细微差别和限制对于提高LLM性能和可靠性的重要性。
该公司开展的LLM业务:一是将生成式AI集成到物联网、AI和机器学习解决方案的结构中,推动了前所未有的向运营效率和成本效益的转变,使混合传感器数据的能力彻底改变了传统机器学习模型的训练,使它们能够识别表明潜在设备故障的模式。通过模拟不同的运行条件和故障场景,AIGC提高了预测性维护模型的准确性和可靠性,从而推动了运营洞察力的转变。二是将生成式AI和聊天机器人技术结合,从钻井报告和生产数据库中提取有价值的信息。它可以从各种数据格式中提取数据,并为钻井和生产系统创建数据库,然后通过利用经过自定义训练的聊天机器人和LLM自动对其业务数据集进行高级分析,增强了钻井和生产分析能力,展示了生成式AI的聊天机器人在油气行业应用潜力。
英国这三家国际石油公司都在公司部署了微软的365AI关键产品Copilot,他们已经允许成千上万的员工访问微软的新云服务平台Copilot,深度应用生成式AI技术,提高公司运营效率。因为Copilot的核心由GPT-4提供支持,这是OpenAI最新、最强大的LLM。
克森该公司在有两种不同的使用和开发LLM的机制,一是将GPT-4的使用限制在内部。二是与私人有限公司开发了专为石油和天然气行业任务服务的自定义大型语言模型 (LLM),使用了PetroWiki、与油气行业相关研究论文、开源工单数据和行业的报告,增强了当前模型能力,该模型在数据处理、缩写处理及行业特定任务处理等方面都显示了巨大潜力。
沙特该公司有两款LLM服务,一是开发了一种TransLing语言模型,可以训练、微调和部署较小的LLM模型,可以与油气行业中的采购、仓储、工厂维护、供应链、财务、销售和营销业务进行自然语言交互,并从描述中查找业务事项和交易,可以生成准确的信息输出,这些输出与用户叙述和屏幕上下文一致,可为使用者提供来自业务系统的所需信息,并可根据需求编写报告。二是开发了另一种创新LLM框架,它实现了对扫描存档文档中封装的知识的提取、知识管理系统 (KMS) 的搜索和检索功能的扩展,可用来查找各类信息,并进行文档间的相似性比较,以实现信息精准检索,该方法与传统技术相比,更加有效和高效,使企业能够解锁和利用其数字档案中的内容,它是对KMS领域的重大贡献。
阿联该公司开展了关于油气LLM的2个项目,一是启动了第一个钻探专用的 ChatGPT-4,使 GPT-4能够从钻井数据中学习,以准确有效地为服务于钻井过程。GPT 4能够为混合结构、非结构化和多种格式表格形式的数据提供准确答案。相比之下,其他LLM模型无法处理相同的数据,而是给出错误信息。因此,无论输入的数据架构有多复杂,GPT-4都能处理这些数据,以确保提供答案。GPT-4具有处理和分析大量运营数据的能力,突显了它在在识别运营异常或停滞方面的价值。尤其在钻井领域,这是石油行业第一个使用 GPT-4的试点,其结果显示GPT-4是一款能为钻井工程师提供高效和高质量的快速钻井作业的方法和工具。二是采用GPT-4大型语言模型分析地质文本描述,开发的应用程序成功地从非结构化文本中提取了有价值的地质参数及其尺度,促进了地下储层的岩石类型和渗透率预测。该项目的持续推进有助于LLM在加强油藏表征、优化生产和改善能源部门的整体决策过程中发挥重大作用。
马来该公司成功地使用LLM搜索大型非结构化数据存储库。系统支持对返回结果进行后续查询,支持内容自动汇总。该系统已集成到该公司开发的新型端到端数据挖掘平台中,该平台不断挖掘非结构化勘探数据以发现新的变化,并将结果编入索引。其中,为非结构化数据查询开辟了一种全新的数据发现方法。
Spot在LLM发展的当下,对中小油气企业来说也意味着变革时代的到来。这家压裂公司约有10几名员工,以前花2个小时做的一项工作,而使用了GPT-4只需要花15秒就完成了。该公司已经取得了GPT-4的API许可,在不损害其与客户之间的数据协议的前提下,能够利用此项技术。在融合GPT-4之前,花了几年时间开发了一个软件平台,将来自压力泵机、搅拌机和井口的多个压裂数据源集成到一个界面中。本来需要多花几个月的时间编写代码,以便对数据进行分析。但当嵌入GPT-4之后,不必这样做,每个人都可以使用这些工具,对公司任何一位员工而言,都没有数据使用壁垒和门槛,软件分析业务变得更加便捷,工作效能得到提升。
石油SPE数据科学与工程分析技术部门主席Pushpesh Sharma一直在与行业同行讨论LLM的使用领域和方式。同时,SPE邀请了近200名SPE 的会员测试 PetroQA ,它是一个可以采用自然语言问答的原型工具,它使用 PetroWiki 内容向 ChatGPT 发送油气行业的特定知识,使用 GPT-4 从他们的自然语言问题中自动生成准确的图形查询,形成了几种提示 GPT-4 生成正确查询的新技术,并开发了一种先进的缓存机制来减少与云模型的交互,从而减少回答时间和成本。SPE还与一家名为i2k Connect AI公司和沙特阿美公司签署了一份备忘录,计划在油气领域开发LLM,以期油气行业的工程师和研究人员可使用LLM解决油气行业中带有挑战性的技术问题。
挪威该中心与斯塔万格大学联合,研究宣称:他们使用了石油行业数据集对7个商业和开源LLM进行了评估,结果显示:GPT-4因其在多项选择和上下文任务中的卓越性能而脱颖而出,它有效地解决了各种具有不同难度级别的一般和特定领域的问题。研究证实LLM在提供上下文时,提供准确响应的潜力。
ChatGPT/GPT-4o点燃了世界各行各业对AI研究和使用的兴趣。使用了OpenAI 许可的GPT-4 API ,将其业务需求通过少量代码嵌入 GPT-4,指导GPT-4处理来自不同领域的数据库的数据,并进行端到端的各类数据分析,每个员工都可以公平的使用这些工具,对任何人而言消除了使用数据与软件的壁垒和门槛,使软件分析业务变得更简易。同时,应用GPT-4可以整合来自各种来源的数据,消除数据壁垒和碎片化,使数据和工具软件管理和使用更有效,不仅简化了各类数据与信息的检索与查询,而且加快了操作者进行知识提取的速度,使得工作过程中节省了大量时间,凸显了IA不同于传统的AI产品,体现出了IA在业务场景中实际操作方面的潜力,因此,在油气行业已经有许多油气公司已经瞄准了IA产品的研发和落地。