内容来源:「文因互联航空业务团队」线下访谈整理,内容有删减。
航空领域是最看重安全、容错率最低的领域之一。每架飞机有3000~20000个传感器,每架飞机每年能生成百亿个数据点,文因在航空领域不断探索、实践用数据转化为知识,为飞行品质提供更多升级助力。为此,我们邀请文因航空团队一起深入聊聊:如何让行业 know-how 、海量飞行数据发挥更高价值。
航司通常如何管理飞行安全?
举个例子,民航局要求飞机着陆 G 值不超过2.0 ,航司就会以 G 值 1.8 为标准。一旦数字达到 1.8 ,航司就开始调查飞行员,也就是安全前移式管理。
这样一来,确实可以规避安全风险、达到民航局的要求,但也造成了一个隐忧:容易忽视其他数据,只看重政策要求的标准,操作背后可能存在的风险就被隐藏起来了。
如今随着飞行大数据平台的建设日益完备,数据应用更加广泛,技术的助力有望一改往日的粗放式管理风格,让飞行安全管理和飞行员培训逐渐向更人性化、更符合具体飞行员能力提升需求的方向发展。
飞行员考的
其实是“科目九”?
民航的飞行员每年必须训练,在航线里通过模拟机训练。训练就是从学员到副驾驶、机长再到教员的打怪升级的过程,是很漫长的,其中最基本的要素是累积飞行小时。
学员有教员带飞,带飞的过程主要是教员在飞,学员看着就可以了,关键的地方让学员飞,但都有教员手把手辅导。从学员慢慢成为副驾驶,副驾驶再和机长搭班,起飞副驾驶来操作,着陆机长来操作。
除了飞行过程,还有一个动作—— 复训,飞行员每年都必须要满足一定小时数的复训,航司大概要花6万让一个飞行员在模拟机上进行复训。模拟机和真飞机一样,但只有机头部分,有的航司也会安排到专门的训练基地。
复训就是要飞“特情(特殊情况)”。因为实际飞行很安全很少有事,所以即使飞得多可能经历也比较少。就像大家开车,开了 10 年都没有发生过车祸,并不能代表驾驶能力有多强。
所以,复训就相当于一个定期的驾照考试,保证应急处理能力。那么,这样一个考试题库,是怎样设计的呢?
这个题库基于 9 大胜任力设定对应科目。现在大家也都在做 EBT “循证式训练”,也叫飞行员全生命周期管理。以前飞行和训练这两个环节是脱节的,飞归飞,训练归训练,所有人的训练都是千篇一律没有针对性的。
那么,通过收集飞行数据之后,我们把这些数据折算成具体事件。通过调查具体事件,会发现有些是没达到调查级别的“轻微事件”。比如,飞行时间 2 万个小时中可能会触发 2000 个事件,这些事件是一种飞行能力的体现,但不能绝对地表现出飞行员的能力。针对这些事件数据,也能客观地反映出飞行员在某个方面是否弱项。
怎么基于弱项数据帮助具体的针对性训练呢?不能通过事件直接挂钩到训练,所以要把事件折算到 9 大胜任力,按照一个标准的体系去做分析、分类,根据弱项对应的 9 大胜任力中的具体能力方向,用能力方向对应的科目题库做针对性训练,来辅助提升飞行员弱项。
这九大维度
是干什么用的?
航空中我们常说的是“人、机、环”或“人、机、料、法、环”[1]五个维度,但这些维度比较很粗放,而“ 9 大胜任力”是围绕人的 9 个维度。比如,当事件中人的原因占50%的时候,分析不能只打一个主观的标签说“人操作不当”,太笼统了。
为了规范分类人为操作有哪些致因,所以分了 9 个胜任力的维度。比如工作负荷的胜任力、心理状态的胜任力,以及各种应急情况处置能力。每个胜任力都有相应的考核标准,通过这个标准,调查员结合飞行员表述,记录下当时的事件的分析结论,这样分析的依据会充分很多。
航司一般都有一个飞管部门,它下面有个叫安监室或者叫安技室,专门管安全的一个部门,每天负责监控有没有事件发生。事件发生后,他们作为第一层把关人会去辨别事件的真假。因为他们是地面工作人员不是飞行员,所以会把飞行员作为专家顾问一样定期来轮岗,来做分析、事件调查。安监部门会持有历史数据、新增事件信息以及要做哪些调查,这些都会在OA流程中体现。
以前制约运算能力是因为数据不通。机务是机务的,飞行数据就到安监,安监结束就是事件,事件调查形成文档, OA 流程结束,数据都停留在安监部门,没有流转了。维修员也希望有数据,希望知道飞机到底哪个部件的数据有异常,没有数据有时候只能等飞机坏了才知道。
注释[1] :人机料法环是对全面质量管理理论中的五个影响产品质量的主要因素的简称。人,指制造产品的人员;机,制造产品所用的设备;料,指制造产品所使用的原材料;法,指制造产品所使用的方法;环,指产品制造过程中所处的环境。人员、机器、原料、方法、环境。现场管理中,有五个方面是需要现场的班组长注意的,也是工业制造企业管理中所讲的五个要素。
飞行事件报告编写过程,是从调查到人工经验判断。
调查的过程,首先找到指定的飞行员,先询问,再听录音(舱音),结合的数据三方一体地分析整个过程,分析之后会出一个报告,这就是我们刚刚说的历史文档。
这个报告会以权威的方式来写,分析事件触发了什么阈值,自然语言描述当时飞行员的心理状况、主观的因素是哪些条件、当时怎么飞的。还会记录当时录音的情况,分析数据比如风、跑道的情况,最后形成一个报告,通过人工判断得出结论人的因素占多少。最后报告发出来会递交给领导,再上报到民航局,事件调查的整个过程是这样的。
在这过程中文档就会留存下来,各家的调查流程是一样的,但形成的数据完全不一样,没有具体的规范可言。
因为文因在这个领域做了很多年,所以对那些事件的致因、相关数据的理解比较深刻。从文档处理来说,有些是可以接到数据的,有些接不到就需要解析(原始)文档,解析过程不是说像对通用 PDF 文档做解析那样,只是把所有数据解析出来,没有知识与知识的关联。
如果对行业不理解,让机器自己去分析知识与知识的关系是完全不可能的,所以就需要一些人为的因素。
事件本身有结构化,有数据库的。每个航司都有它的文档风格,所以需要调研近几年的风格,比如有一种叫胜任力的风格,会把事件分析归咎到九大胜任力,考察一个人的九个维度,作为履职的情况的反映。
所以,我们在文档解析在理解这个知识库的过程中,发现是有胜任力标签的,理解了做前置文档的意图,建立知识库的知识关系就会容易很多。
九大胜任力有一层中间标签,经过这层标签才会折射到下一层数据,有时甚至会经过两层、三层才会折算到具体的数据本身。
从数据到九大胜任力,
如何设计飞行员考核“题库”
飞机每天只要发动机打开直到关车的,会记录整个全生命周期的数据。比如今天飞了 10 个小时,那这 10 个小时数据都在里面。整个航空公司围绕着飞机来做运营,所以飞机的数据其实是个很大宝库。
从经验的角度来说面临的问题是事件本身到底怎么跟科目挂钩,如果一刀切,那么管理者面临的困境是,比如想做“一人一策”,每个人的全生命周期应该有标签组成的一个能反映整个职业生涯的画像,复训的时候能有针对性训练弱项。
但数据量太少,对数据的表现太少。因为事件的维度是属于民航局在处罚的角度来看的,一个飞行员不可能一天发生那么多事件,那驾照早就吊销了,所以基本上一个航司一个月发生两三起事件就已经很严重了,所以事件量是非常少的。
事件越少越好,
但数据越多越好,
“天然悖论”怎么破?
为什么近年来慢慢跨到大数据,为什么要建立飞行大数据?这也是我们的主产品,讲飞行大数据的。站在事件的维度来说,数据利用其实是很不充分的,只探测航班飞完有没有事,大部分情况下一天下来,一班都没事,那这海量数据里一个有价值的数据都没产生。
这个数据就这样放过去了,为什么要这样做?因为只要发生了事,从整个航空公司都会被处罚很影响经济效益。航司怎么管理?民航局抓G值 2.0 的标准,我航司就抓G值 1.8。在G值达到 1.8 以后,就开始调查我的飞行员,所以压根就不会发生G值 2.0,这叫安全前移。所有的管理都这样,政策有政策的标准,那我一定比政策还要严,越抓越严,大家有意地规避风险。
有个悖论,让我着陆轻一点,那么我就飘得就远一些。飞机着陆进跑道以后,正常情况下两秒钟应该接地,但为了着陆轻一点于是花了 8 秒钟慢慢调整姿态,到 10 秒后才开始接地,飞得确实很轻,但飘得很远。国内的机场跑道很长的,所基本上飘不出去,这个操作背后可能存在的风险就被隐藏起来了。
这种属于从上至下的管理,导致了获取的数据点、知识表现越来越少,很难通过数据还原飞行员的弱项。
近年为什么搞飞行大数据?民航局也在提倡绿色QAR。
国内对于数据的分析应用相比国外其实更多,近年也在慢慢放宽事件本身,提出一个概念,叫 “事件参数化”。
以前在事件调查的时候,人工来实现事件参数化。事件当时G值多少?地数多少?风的情况怎样?这都需要人工去看数据,把数据摘出来填到文档里。
现在,慢慢变成了自动化的过程,并且每一班飞机落地不管接地轻重,都把接地参数提出来,并且不是一个事件和非事件的状态,而是围绕重着陆形成参数集合,有多个参数描述接地情况。这个数据也是飞行管理层需要的,所以慢慢从参数开始建立新一轮的飞行员画像。
航司通过参数带动一个专题,专题是类似管理抓手的一个运动。比如擦机尾的事件,会给航司带来很大的经济损失。航司从擦机尾的维度,他们各个机型都会派来业务分析师、很懂飞行的飞行员,站在操作的角度来看除了已有事件模型的参数,还可以挖掘出哪些相关的有价值的参数。
用专题参数带动操作优化。
事件是结果,这个结果一定是人为操作产生的,那么到底是哪些操作导致的?需要把提前的操作都展示出来,比如拉杆过猛。空客的拉杆不是液压式的,而是电动拉杆,电传信号不像机械式拉杆立刻有操作反馈,有滞后效应。电动拉杆可能拉得很猛,但飞机实际还没动,立刻又把它收回来,飞机在滞后效应下会把动作放大,就会出现操作过猛。
在类似这样的操作过猛的实践调查中,发现有些飞行员在训练过程中怕不遵守 SOP 流程,所以一落地不管三七二十一就拉反推(操纵杆),很顺手也拉地很快,就会因此产生 风险因素。
为什么我们要做飞行数据智能平台,首先各个航司很多飞行员其实都有想法,很多管理者也有想法。现在新一代的管理不像传统的不管业务只管人, 60 后慢慢被淘汰了,现在 70 后 80 后已经属于信息概念很强的一群二了,知道信息的价值,懂数据了。
在懂数据的基础上,他也知道作为航司运营,这么大一堆数据在里面,飞行的数据、运行的数据、维修的数据都要分析,那数据是不是该有一个便利的平台?所以为什么我们现在在打基础、造平台,因为需要把他们的数据做融合。
但数据里能挖掘多少财富还是依赖于(航司数据本身),不是说建了平台以后就立刻很厉害,我们只是老老实实在做信息化的第一步,把数据能够打通,把效率能提上来。
飞行员也有专题运动,
还是“定制化”的?
大家看到的所有都是围绕着飞机记载的数据本身,因为这个数据反映了飞机的各个部件、各个传感器的工作状态,分析人只是因为人、机、环里面,人的因素是最关键的, 90% 的事故都是人的因素造成的,而不是飞机本身。
回顾整个航空百年历史,空难基本上都是人造成的,为什么要在人的管理上下功夫?因为飞机无非是保养得好一点,而环境更是改变不了的。所以,数据打通了以后,管理者就有依据来提专题、提诉求。
大数据另一个维度叫快、准、清,数据融合在一起了,效率提升不上来。比如,飞行员今天提了一个想法,半年以后才收到反馈,时效太慢了、为什么专门提“快”的概念?因为数据量很大,在工业里面,如果把数据的效率能提升上来,解决了数据融合的快准清,那基础建设就做到了。
为什么现阶段还是通过专题的方式来带动知识的沉淀呢?
首先,为什么要有专题?因为没有专题,漫无目的地提参数,提几万个参数出来,没什么意义。这也是为什么,现在说飞行员不要做一个“数据飞行员”,不要作为一个 QAR 飞行员,只站在数据的视角去飞行是错的。
飞行操作技能的要求是很高的,是结果导向的。所以做专题的时候一定是结果导向重经验的,飞行过程中应该抓哪一地方,通过经验描述得到一些参数标签,这是我觉得最宝贵的一个知识点。第一层通过专题告诉我们一些经验点后,再做第二层需求理解,把经验参数化。
举个例子,操作冲猛。推杆的过程中,要考虑一个最大值,然后推杆时间八分之一秒的变化率有多大?
航司会根据经验做制定考量维度、阈值用来帮助衡量操作情况。飞机的传感器会收集各项数据,最大值、最小值、均值,操作期间的变化等等。我们围绕某个维度把数值描述出很多个参考点,于是一个经验就会伴随着有二三十参数描述。所以维度一定要从经验出发,用数据去描述可被证实的经验。
为什么要建设知识库?知识库、大模型跟海量数据一定是靠经验建立关系。但很难让所有飞行员都来梳理经验,经验是长期积累下来的,准确率是靠积累出来的。
大模型到底懂不懂飞行行业?
在基建平台做好以后,有的大航司一年会提几十个专题,完成准确的数据提取之后,用数据来描述、证实经验,大模型可结合的几个经验模型之间做一个泛化,发挥人工智能更多的价值。
航司一年顶多能做 20 个专题,而且耗财耗力。专题提出后是无止尽的,因为 描述知识全貌是很难的。如果我们能够让每个经验、专题都能适配大模型,让大模型具备Agent智能体,让智能体之间、数据之间做角联,大模型可以泛化出更多经验之外的东西。
通过提示工程,基于人工的经验引导。假设全中国几个头部航司已经做了 100 个专题,这 100 个专题都能够沉淀为基础的知识数据,然后喂给大模型,建成通用的航空大模型。新飞行员很难凭空构建一个专题出来,如果没有领导支持,没有财力、物力支持,自己提瞎提也没用,很多飞行员就没有学习的动力。
下一个阶段能做的是,构建一个大模型平台,让用户通过提示词引导大模型探索,融合人工经验共同产生新的更有价值的专题。
航空大数据的应用,其实也是伴随着知识库的方式去建设,但它是一个“活”的知识库。
专题是活的,每天都有新的航班,于是就有新的数据产生,不停描述航班特征,时时刻刻都在运转。所以,这个知识库也在不停地积累数据和基于专题经验沉淀的知识。
传统知识库还是偏人工经验,传统的文档问答是死的,但工业领域的产品手册、法律法规其实是会更新的,回答新旧版本需要有出处不涉及到数据本身,这也是工业领域的一个特点。现在做的知识库都是类似于理论知识库,比如产品知识库这些都是偏文档体系。
现阶段,还是以经验带动知识处理,建立好知识经验跟数据点的关系。从知识图谱的角度来说,知识是有层次关系的,至于数据怎么能够预训练到大模型里面去,怎么去让整个行业能够共享这个数据?目前还是探索的阶段。
以前没有知识库,没有大模型,航司也在做飞行手册体系的更新维护。比如航司的数字体系,因为每一个飞机零部件都有数字编号三字码,他们建文档体系时,为了让这文档好用,通过数字编码,快速定位再把手册拆得非常细。 如果大模型只解决这种问题,那跟传统 IT 手段建系统没什么差别,没有带来多大提效。
所以,关键在于实现基于专题大模型的建设完成,沉淀专家经验、数据,形成一个智能体,能够借助这个智能体探索出新的专题。结合九大胜任力为飞训“一人一测”提供重要依据,比如让大模型根据个人弱项,准确推荐训练科目。
飞训模拟机每个小时要花费差不多1万块,所以基于数据支撑做针对性训练,让推荐来源有数据可查,相比人工拍脑袋、一刀切制定训练科目,会以更少成本见更好的训练成效。
除了飞行员,
机务和维修部门也很关心数据。
节油
增效降本增效除了刚才说的安全方面提升改进,做针对性训练、指导训练,另外就是经营指标。我们还有另外一类应用系统,比如做节油。
每一班飞机理论上应该除了按飞行计划以外,也需要考虑用最经济的方式去飞,或者根据探测到的气象条件,提供不逆风、更省油济的高度层参考。
一个航班如果能节省 100 公斤油,一年下来几十万航班可以节省多少个亿的燃油成本。从指标来看,节油指标对航司经营来说是很重要的。
维修
维修需要的数据最好是实时的,但条件达不到,因为现在空地没有带宽,空地之间的卫星网络也还在试点,所以现在前仓的空地网络打不通,但总有一天会打通。
国内现在也在试点,打通以后飞机飞行过程中的每个传感器的数据在地面都能看得到,慢慢就可以过渡到无人飞行,驾驶舱不用飞行员可能做个机器人,因为数据都在地面都可以看得到,完全可以指导飞行。
从维修的角度来说,如果数据的及时性很高,那么它就可以看到当前飞机通过传感器,反映出哪些潜在故障。维修很讲时效性,从落地到下一班,一般最短 30 分钟、40 分钟这么快。
机务得判断,提前备货提前修,如果说不能修就报故障保留。等到晚上飞机返到基地以后开始修他的飞机,保证第二天飞机又健康地飞,飞机的利用率一般十几个小时每天。
保养
为什么机务对数据需求很旺?目前是飞机结束飞行后做事后分析,飞机也像汽车一样也要保养,5000 公里小保养,几万公里大保养,传统的飞机保养一样被国外垄断,厂商只告诉你一个保养计划,包括发动机多少小时以后要返厂大修、水洗,这些都非常花钱。
现在,有了数据依据,航司可以按照实际的寿命来,比如发动机有 a 检、 b 检、 c 检,发动机是最耗钱的,飞机发动机要拆下来运走自己修不了,要运到那种 MRO 的厂。
发动机要拆下来水洗,从全部就要拆下来重新洗一遍,这个都是很费钱。传统是按照飞行小时、发动机震动温度、排气温度、发动机转数等几个监测指标。如果按照飞机性能手册来看性能还很不错,就没必要到了1万小时就去修,可以延长保养。
以前我们帮发动机部门专门处理发动机的维修发票。维修厂家寄来的发票正常情况下都是英文的,很繁杂,如果航司没有仔细去分析这个发票,可能会有没有修的东西厂家也写上了。所以航司要专门分析发票,对应发票核实维修项目,通过数据来去验证,一年可以省好几百万美金。
当前,航空领域的数据挖掘在行业知识库构建中已悄然成熟,可以预见,随着大语言模型技术的深度赋能,智能应用将逐步渗透至航司运营的核心场景——从运营管理的策略优化,到飞行员复训的智能辅助,再到维修保障的智能诊断,以数据驱动的精细化决策支持将成为常态。
未来,这些技术创新不仅会为航空安全管理体系注入智能化新动能,更将推动行业在安全与效率的平衡中,迈向更具预见性的数字化运营新范式。