当前位置: 首页 » 电子期刊 » 业界动态 » 正文

制造业中的大数据分析技术应用研究综述

梁志宇 王宏志 李建中 高宏 (哈尔滨工业大学 计算机科学与技术学院)

  信息来源:《肉类机械装备》     2018年第10期   浏览次数:97  字号:[ ]
 
内容摘要:  摘要:信息技术的普及使制造业中积累了大量与生产、管理和运营相关的数据,这些数据中隐藏着诸多有价值的知识,可以指导企业
  摘要:信息技术的普及使制造业中积累了大量与生产、管理和运营相关的数据,这些数据中隐藏着诸多有价值的知识,可以指导企业优化管理流程、改进生产工艺、调整加工参数、诊断设备故障等,帮助制造业企业提高效率、降低成本,达到利润最大化,并为实现智能制造打下基础。然而,当前制造业中存在着数据量大、数据利用率低的矛盾,许多场景中的数据规模甚至已经超出传统数据分析方法所能承受的极限。因此,越来越多的研究者致力于研究大数据分析在制造业中的应用,旨在通过大数据分析技术发掘蕴含在数据中的宝贵知识和财富。介绍了制造业大数据的概念和特征,讨论了制造业大数据及其分析的特点和挑战,并从制造业产业链流程的角度出发,将制造业概括为设计、生产、采购、销售和售后五个阶段,分别阐释了每个阶段的典型业务场景及需求,总结了大数据分析模型在这些业务场景中的应用方面的研究进展。最后,对大数据分析在制造业中的应用现状做出了分析和评价,并讨论了其中存在的问题和不足。
 
  关键词:大数据;制造业;数据挖掘;工业流程;智能制造
 
  制造业大数据是指在制造业领域中所产生的大数据。伴随着工业自动化和信息化发展,信息技术渗透到了制造业产业链的各个环节,条形码、二维码、RFID、工业传感器、自动控制系统、ERP、CAX等技术在制造业中得到了广泛的应用。互联网、移动互联网、物联网等新一代信息技术与制造业的融合,使制造业各个环节产生的数据都可以被快速收集、存储到信息系统中。随着企业规模的扩大以及时间的积累,这些数据以空前的速度增长,使制造业进入“大数据时代”。例如,长虹集团有限公司等离子显示板制造中,生产流程数据超过10000个参数,每天产生3000万条记录,约10GB;GE能源监测和诊断中心每天从客户收集10G字节的数据。在这些不断产生和积累的海量数据中蕴含着大量有价值的潜在信息。运用统计、机器学习、数据挖掘等大数据分析方法对制造业产生的数据进行分析,发掘其中蕴含的知识和规则,并基于这些知识和规则指导制造业的研发设计、生产制造、销售售后、经营管理等过程,有助于改进生产方式、优化管理流程、感知客户需求、提升品牌价值,达到节约成本、提高效率、降低能耗的目的,使制造业逐步走向智能化。
 
  制造业大数据除了具有大数据共有的“5V”(即Volume、Velocity、Varity、Value和Veracity)特性,还具有诸多与制造业产业特性相关的特征,概括如下:
  (1)数据来源多样。由于制造业门类众多,企业的大数据来自产品设计软件、生产装备运行过程、产品质量监测设备、企业管理信息系统、供应链与销售网络等多种数据源。另一方面,由于制造业企业自动化程度不一致,大量中小企业未达到全自动化水平,存在人机协同工作,因此制造业中的大数据既有机器产生的数据(如实时感知数据),也有人工输入的数据(如企业管理数据、供应链数据)。大量自治数据源中存在数据不一致和冲突,加之制造过程复杂、数据量大、更新速度快,因而制造业中的数据产生错误的概率更大。
  (2)数据质量低。由于制造业流程中各工序环境复杂,收集数据的传感器或传递信息的无线网络都有可能出错而导致收集到的数据中存在较一般大数据中更多的噪音或缺失。
  (3)数据蕴含信息复杂,耦合性不确定。由于制造业企业信息化水平参差不齐,以及不同行业生产过程的特性差异,生产环节各步骤之间可能存在不同程度的耦合,因此制造业中数据之间的关联和相互影响较为普遍。
  (4)数据实时性高。生产线监测数据(如设备运行状态监测数据和各工序生产状况监测数据)等是连续采样的时间序列数据,具有时间标签和严格的先后次序。而工业系统是典型的实时控制和实时信息处理系统,生产线上的诸多环节具有严栺的实时性约束,这决定了制造业中较大比例的数据是实时数据。
 
  制造业大数据的特点决定了其分析任务具有如下特点:
  (1)分析模型复杂多样。制造业大数据分析注重特征背后的物理含义以及特征之间关联性的机理,从而有效发现数据背后的意义。在制造业的不同领域,生产制造过程中原材料、工艺流程、产品形态不同,相应的数据类型、格式、规模上均存在差异,这导致不同的内涵和应用价值,因而制造业大数据的分析与具体领域密切相关,相应的分析模型也复杂多样。
  (2)数据质量要求高。数据的质量,会直接影响到分析结果的质量。而制造业对大数据分析结果的容错能力较低。在工业环境中,一次失误可能造成严重后果。因此,必须保证制造业大数据的质量。
  (3)分析实时性要求高。制造业大数据的一些场景,如电子芯片自动化生产线的实时监控和故障预警等,对数据处理的实时性要求很高,这些场景需要监控数据的获取及处理时间在秒级甚至毫秒级。
 
  综上所述,目前大数据分析在制造业中的应用面临着如下挑战:
  (1)如何提高数据质量;
  (2)如何根据具体领域和应用场景设计合适的分析模型;
  (3)如何设计满足实时性要求的行之有效的分析算法;
  (4)如何用大数据分析结果指导企业优化管理和生产。
  本文主要关注上述挑战(2)和(3),即制造业具体领域和业务场景下的大数据分析模型和算法的应用方面的研究进展。制造业涉及行业众多,实际工作场景千差万别,但广义上讲,所有产品的制造流程都可划分为设计、生产、采购、销售和售后五个阶段。因此,本文从上述五个阶段出发,分别阐述每个阶段的主要任务场景和需要,以及大数据分析模型在各个场景中的应用方面的研究情况。
 
  1 设计阶段
 
  制造业流程中的设计阶段在广义上不仅包括产品本身的功能和外观设计,还包括加工产品所需的工艺流程设计等。目前,大数据分析在设计阶段的应用主要体现在工艺流程的参数优化上。此外,在能效优化、成本优化、工艺标准优化及智能设计等方面,大数据分析也能起到作用。
 
  1.1 参数优化
  在冶金、化工、医药、食品加工等涉及复杂物理化学变化的工艺过程中,产品的质量和产率通常由多个参数确定,且各个参数彼此存在耦合关系,确定使产品质量、产率和能耗最优化的输入参数较为困难。传统上,各个参数的设置一般都是依据经验,或是经过大量的实验得来,不仅费时费力,且难以找到优化参数。而大数据分析方法,如关联规则分析、回归分析、决策树、聚类、神经网络等,可以从大量数据中提取出复杂过程隐含的规则。采用这些方法,建立模型对历史生产数据进行分析,可以帮助找到最优化的生产参数,对生产参数的设计具有重要的参考价值。
  文献中采用关联规则分析并找出了制造过程中化学成分(如碳、锰、磷、硫)含量、出钢温度和轧制速度对最后产品的机械性能的影响;文献运用聚类分析算法对炼钢厂脱硫数据进行分析,得到不同铁水条件下的脱硫剂消耗情况,以此找到不同铁水条件下脱硫效果最好的脱硫剂。文献运用前馈神经网络和分类决策树对玻璃镀膜工艺进行建模,训练好的模型可以根据给定参数预测产品质量,从而帮助企业快速确定符合预期质量产品的工艺参数。文献提出用动态神经网络模型,从数据中提取发动机缸盖机加工参数、模具状态和成品缸盖燃烧室容积间的关系,指导机加工参数的选取,以控制燃烧室容积的制造误差。文献对批退火工序进行建模,用同一训练数据对线性回归、回归分类树、前馈反向传播神经网络三种模型分别进行训练,验证可知无需相关冶金和机械方面知识的前馈反向传播神经网络反而得出了最为精准的退火工序模型,该模型可根据当前数据预测退火工序的运行情况,专家也可针对该模型找到各参数的最优值,进而改善退火工序。文献采用前馈人工神经网络对树脂中间体生产流程和印刷电路板制造流程中各因素间非线性的因果关系进行建模,模型使相关工作人员更好地认识了流程的运行情况,将明确的因果关系进行量化,进而可以运用这些关系优化制造工艺,提升产品质量。
 
  1.2 能耗优化
  在能耗巨大的工业,如冶金工业中,节能减耗可以在很大程度上提高企业的经济效益,具有重大的现实意义。
  文献利用关联规则、K聚类和改进的门限法聚类等方法,从大量的炼钢历史能耗数据中获取隐含的规则,指导企业改进生产参数,降低生产能耗。文献提出了一种基于车间历史数据的数控加工工艺参数自适应能效优化方法,用多元统计技术和聚类分析方法对车间历史数据进行分析,得到了工艺参数与能耗间的影响规律,再用模糊关联规则算法得到高能效工艺参数优化规则。
 
  1.3 成本优化
  成本分析是设计阶段的一项重要内容,在钢铁企业的成本分析中,对其工艺路线中各工序的成本消耗进行分析和控制是企业成本控制的首要任务。文献基于抽样的C4.5决策树算法从工艺路线中选出对制造成本影响最大的工序,通过对选出的工序进行控制和改进来优化整个工艺路线的成本。
 
  1.4 工艺标准优化
  在工艺标准优化方面,有文献尝试用数据挖掘的方法优化服装企业标准工时制定方案,以此提高企业成本核算和生产加工能力。文献对服装企业标准工时系统的数据用决策树方法进行分类,再用关联规则对每一类数据进行分析,得到款式、材料、年龄对实际工时与标准工时差异的影响程度,并以此为依据对原有标准工时进行优化。类似地,文献基于神经网络模型预测生产工时,找出影响因素并排序,再用关联规则模型评估导致标准工时不合理的影响因素并进行修正。此外,文献运用关联规则中的Apriori算法对模具企业CAPP改模知识库进行挖掘,较好的解决了模具企业改模工艺知识的获取和积累问题。该方法进行工艺设计可提高CAPP智能化程度,提高改模工艺继承性与重用性、促进改模工艺标准化。
 
  1.5 智能设计
  在智能设计方面,文献用ART1神经网络对摩托车总体设计方案实例库进行聚类,再用BP神经网络记忆聚类结果并根据设计要求检索设计方案,提高了摩托车总体方案设计的效率。文献运用模糊物元的方法将客户的多维度需求问题进行优化,对基本粒子群算法稍作变化,提出了混合式算法,并将其运用在某型号轿车的整体外观造型设计的客户需求知识挖掘中。
 
  2 生产阶段
 
  随着自动化生产线的广泛应用,生产过程产生的数据都可以被采集和存储。对这些数据进行分析,可以帮助人们对生产过程进行监控,以优化生产过程、检测和诊断故障,达到提高效率和产率、降低成本和能耗的目的。
 
  2.1 质量监控
  实际生产过程是一个动态过程,生产线上工艺、设备和环境都极其复杂,许多未知因素往往都会影响最终产品的质量。为了达到生产任务的要求,常常需要对产品质量进行快速检测和提前预测,以便及时做出调整。然而,由于生产线的复杂性,检测或预测产品质量并不容易。许多现有方法,或是准确率较低,或是成本高昂。而诸如回归、分类、聚类、决策树、粗糙集、神经网络等数据挖掘和机器学习方法,由于能够从大量数据中发现规则,因此能够在一定程度上提高产品质量的检测或预测准确率,且实施成本较低。
  伸缩探针被用于检测半导体产品的质量。但由于伸缩探针本身存在使用寿命,若探针老化,则会影响产品检测结果,带来经济损失。文献基于线性回归和分类模型对伸缩探针的状态进行建模,从而掌握探针的老化程度,减少由于探针自身寿命问题带来的产品质量检测错误,提高准确率。
  传统的冶轧产品缺陷检测方法,检测标准不一,且存在大量漏洞和误判。文献使用实际的生产数据训练二分决策树和多分决策树,得到了找到产品缺陷的众多规则,使企业可以根据所得规则快速准确的检测生产出的冶轧产品的缺陷,提高了检测的准确率。
  文献针对印刷电路板中焊锡球缺陷这一质量问题,采用能够识别个体区别的粗糙集对其进行数据挖掘并得到三个规则集,分别是存在焊锡球缺陷时的规则集、不存在焊锡球缺陷时的规则集和两种情况皆可能的规则集,这三个规则集对不存在焊锡球缺陷的印刷电路板的预测正确率接近100%,对存在焊锡球缺陷的印刷电路板的预测正确率接近50%,整体预测正确率达到97.66%。根据这些规则,焊锡球工艺可得到相应的改进,其缺陷也可以及早发现,极大地降低了电路板由于焊锡球缺陷而带来的损失。
  现有的酿酒工序中并没有什么工具能够提前检测出预示着酿酒中存在瑕疵的早期征兆,因此也没有办法针对酿酒中出现的征兆进行改进。且酿酒工序环境复杂,相关数据繁多,如某关于酿酒的数据库中即保存有29种数据记录值,包括糖、醇类、有机酸、富氮化合物等。文献针对上述酿酒数据库采用数据挖掘方法,分出训练数据和测试数据,先采用主成分分析法选出关键属性对训练数据进行降维,然后采用K-means聚类迚行数据挖掘,获取模式。利用聚类结果,研究人员得以在酿酒过程中就检测出其产品质量是否合栺,大大减少了由于酿酒出错带来的损失。
  发酵是一种生物化学反应,在食品工业、生物和化学工业中均有广泛应用。进行一次发酵通常需要不短的时间,传统上发酵过程经常采用许多高科技手段诸如流动注射分析法、液相色谱法、红外先谱法、气相色谱法、质谱分析法等来实时监测发酵过程的情况,以使其发酵过程始终处于正常范围。但这些设备对于小型企业来说都比较昂贵。文献提出了另一种监测发酵过程的方法,该方法只需用少许廉价的传感器,获得发酵过程中的各相关数据诸如pH值、温度、溶解氧含量等,并对其进行数据挖掘,即可实现发酵过程的实时异常监测。数据挖掘过程采用文献中提到的方法,得到具体发酵过程的模式,以此为依据实时监测发酵过程的异常,并可根据特定的异常制定相应解决方案。
 
  2.2 故障检测和诊断
  在实际生产线上,任何一个小的故障不及时解决,都可能会影响到整个生产系统的正常运行,带来巨大的经济损失。因此,快速、准确地进行故障检测、诊断和预警,一直是制造业企业迫切需求。然而,如上所述,生产线是一个复杂的系统,整个生产线有数十道甚至上百道工序,每个工序有多级操作,每步操作又对应不同的机器和设备。对于这样的复杂系统,用传统方法去定量分析建模,找到异常状况的影响因素是十分困难的。因此,即使经验丰富的工程师,在面对一个原因未知的系统或工序故障时,也不能短时间低开销解决问题。而基于大数据的方法,有助于从多种复杂因素中找到造成异常的因素以及相应的规则,因而对于故障检测和诊断问题有很好的效果。
  文献提出将聚类分析模型(自组织映射神经网络和模糊C均值)应用到钢铁等冶金行业,分析并找出生产数据中的异常点,为进一步发现生产过程的异常状况或根据正确数据进行更深层次的分析奠定基础。文献通过记录6个属性数据来描述电机设备的状态信息,基于粗糙集思想提取其故障诊断规则,使得系统能够通过设备的运行状态来实时监测其生产状况,及时检测出设备故障,保证生产系统的正常运行。文献就半导体制造业中的缺陷检测提出了RMI(RootCause Machine Identifier)综合处理程序,其采用关联规则得到预处理后数据库的候选集。由于制造工序中许多间歇出现的问题都是多因素引起的,且因素间非线性的相互作用十分常见,因此RMI将计算出每个候选集的关趣度,并对其进行排序,根据关趣度高低找到问题根源。凭借RMI,制造过程中出现多种问题都将被立即识别并定位出根源,相关人员得以高效解决相关的机器缺陷,从而极大地提高了产品产量和高质量产品比例。文献提出了FDC(Fault Detection andClassification)方法,首先采用主成分分析法整理训练数据,建立模块化的神经网络以进行故障识别;D-S理论则是用于在存在不确定性的情况下(例如多故障产生或故障传递)进行故障分类。采用模块化神经网络和D-S理论的FDC方法具有在异常出现时快速识别异常,并定位该异常产生的根源部件的能力,使得相关人员能够快速定位故障部件并采取相应措施解决。文献就土耳其一家毛毯制造公司的数据,提出了基于C4.5决策树算法的数据挖掘方案来快速识别定位毛毯制造流程中出现的故障原因,使得相关人员能够快速精确解决故障,大大提高了毛毯的生产效率。其采用预处理技术提高所收集数据的质量,使用关联分析找到关键属性集以减少训练数据的维度,最后采用C4.5决策树算法,共得到101条规则,其识别故障原因的精准度达到72.811%。
 
  2.3 智能调度
  提高生产效率在制造业生产过程中至关重要。在制造业中,生产调度是车间管理的核心,合理有效的车间调度是高效率生产的保障。文献研究了基于大数据分析的车间调度问题。对于离散工业,针对静态Job Shop调度问题,提出了用决策树模型提取调度知识的方法,优化了调度方案;针对动态Job Shop调度问题,提出采用遗传算法获取优化调度方案,再用极限学习机从优化调度数据中提取新的调度规则,指导车间调度。对于流程工业中的单阶段多产品批处理调度问题,提出采用遗传算法结合启发式规则优化加工设备分配方案,并用极限学习机预测订单加工分配序列,实现订单加工序列的快速确定。
  在生产调度方面,决策树模型受到了广泛关注。文献将生产计划中不同交工期的工单加工顺序、不同类型工件分配在同一机器时的加工顺序等记录存储起来,作为历史数据训练决策树模型,模型可根据实时数据为工件安排合适的机器进行加工,使得车间能够根据生产状态进行实时优化调度,充分利用加工资源,达到效率最大化。文献中也提到这一思想。文献用决策树模型对纺纱厂数据进行分析,得到了机器细小位置移动次数和机器效率对停止次数的影响,以此为依据调整、检测机器,提高车间生产效率、加强人员、机器的调配。文献对于典型机械制造企业业务流程中存在的问题,运用ID3决策树算法,对企业质量管理信息进行挖掘,建立了处理部门归属决策模型,规范了管理流程,提高了管理效率。
 
  2.4 能耗管理
  除了保证产品质量、排除设备故障和提高生产效率,对生产过程中的能耗进行实时监控,对于制造业企业来说也是不可或缺的。如今的企业能源管理模式较为传统,主要依靠人工管理,系统集成化程度不高,缺少决策支持,能源利用率低。文献针对烟草企业,建立了企业能源管理系统,集中监控了企业生产中的供水系统、压缩空气系统、供配电系统和锅炉系统,并采用线性回归、残差灰色和附加动量的前馈神经网络模型,对企业的能效进行了监控和预测,保证了企业的用能安全和效率;文献针对造纸业,将其制造过程中的电耗、气耗分为四类能耗,对每类能耗先使用偏最小二乘法(PLS)从众多能源影响因素中选出具有重要影响的因素,然后利用这些因素建立神经网络模型,实现了对造纸过程各工序能耗的有效预测,为企业的能源管理控制提供了重要的决策依据。
 
  3 采购阶段
 
  采购阶段主要涉及的问题是优化库存和节约成本。
 
  3.1 库存优化
  库存量适当是确保企业正常连续生产的必要条件,库存量过多或多少都会造成不必要的经济损失。为了减少货物的积存,省去不必要的库存开销,制造业中产生了按订单装配的策略,该策略将产品的装配操作推迟,直到客户下了订单。这样一来,库存中的都是产品的组件,可根据客户要求进行装配;而不是已装配好了的成品,等有需求的客户购买。该策略从根本上解决了货物的积存情况,也省去了大量的库存开销。但由于按订单装配的策略,工厂在得到订单后才开始进行产品的装配,因此装配的时间将直接影响到工厂交货到客户的时间。这意味着装配过程中出现任何耽误时间的情况(如返工等),都将影响交货的时间。
  文献针对某有色冶金企业,采用改进的遗传算法、神经网络和模糊控制方式完善库存优化系统。文献采用进化规划算法对库存模型进行优化,以提高企业的经济效益。文献关注在后期装配过程中,装配顺序对产品质量的影响,并采用关联规则方法从历史数据中抽取出11条规则,经专家整理分析,获得更加清晰简洁的规则和知识。根据这些规则,产品在组装前即可对装配序列进行优化,其成品出现瑕疵品的几率大大减少。文献用广义回归神经网络(GRNN)模型对大型制造业企业库存安全水平进行预测,用灰色聚类法对库存中产品和原材料进行重要性划分,以帮助企业控制和优化库存。
  备件管理是制造业设备管理中的重要环节。如何运用最少的资金来保证最优的备件供应与管理,并不断提高设备的可靠性、维修性和经济性是一个重要的课题。周期补充是目前很多企业普遍采用的备品备件管理模式,订购量Q和订购点s是周期补充控制法的两个基本控制参数。文献基于(s,Q)的故障持续时间分布和生命周期分布模型,提出了一个基于效用的库存管理模型(τ, Tm),该模型考虑了技术折旧和资金挤压所带来的影响,也光服了供货周期随机性导致的缺货损失、故障率过低导致的库存冗余维护损失等问题。在机械制造业中,许多大数据分析挖掘模型都有很好的应用。文献提出了基于主成分分析和支持向量机的模型进行备件需求的预测,获得了较好的预测精度,预测结果可以作为管理者的决策依据。文献用关联规则分析机械制造企业外购件间的隐含关系,有助于企业合理制定采购计划,有效控制采购资金。
  成品的库存量关联着产品的生产、销售等过程。文献针对服装企业库存管理,通过库存周转率、商品保本储存期、动销率、高中低档商品消费能力等数据,对BP神经网络模型进行训练,企业可以依据训练完成的模型预测产品的库存量,并依据预测结果安排生产,进而减轻了商品库存堆积的情况,缓解企业订货瓶颈。
  此外,库存作为供应链的一个重要组成,其优化过程常常与整个供应链密不可分。例如,生产、库存与配送联合优化调度问题是供应链中的一个复合问题,该问题要涉及供应链中制造商以及零售商的生产、库存、配送及缺货成本等。文献提出可以基于大数据分析方法,综合分析生产消耗、采购及销售情况,找出保证企业正常生产的原材料合理库存量,以优化原材料库存;根据设备使用、维修和保养原始记录找出关键备件磨损规律,从而预测其寿命,为备件库存控制提供依据。在具体的应用中,文献基于禁忌搜索算法、模拟退火算法优化了生产、库存与配送的联合调度问题。文献提出建立制造业企业采购决策支持系统,通过关联规则分析产品价格、供应商评价、退货原因等问题间的关联关系,帮助企业进行采购方案的制定。文献以汽车产品一个季度的销量作为数据挖掘对象,在建立采购业务数据集市的基础上,运用ID3决策树模型进行数据挖掘,为采购业务的管理者在制定采购计划时提供重要的参考依据。
 
  3.2 成本优化
  制造业中大量依赖原材料和生产设备,因此制造业中采购成本在企业总运行成本中占比很大。例如,煤矿企业在原煤开采过程中所消耗的材料种类繁多、数量巨大,材料成本占总成本的20%、直接成本的35%。同时,煤矿材料投入也是最具可控性的项目,通过准确预测材料成本,有效控制材料消耗,可以降低原煤生产成本、提高煤矿企业的竞争力。文献运用粒子群(PSO)优化算法对支持向量机模型的参数进行优化,极建基于粒子群优化的支持向量回归机(PSO-SVR)煤矿材料成本预测模型对相关煤矿材料的成本进行预测,进而从材料需求计划和采购计划的制定、材料成本控制、材料成本管理信息化等方面提出了煤矿材料成本管理的政策建议。文献提到运用BP神经网络模型,通过学习制造业采购数据仓库中的采购历史数据,对采购价栺进行时间序列的预测,预测结果能够满足企业决策的需要。
  降低采购成本、优化采购方案的一项重要举措是合理选择供应商。文献提出用关联规则(改进的Apriori算法)方法来解决离散制造企业零部件供应商选择问题。文献建立基于关联规则的装备制造业供应商质量评价模型,指导企业采购时评价和选择供应商。
 
  4 销售阶段
 
  在销售阶段,大数据分析的应用主要体现在预测产量、销量、发现需求和优化配送方案上。
 
  4.1 产销量预测
  制造业的销售主体是其制造的产品,产品的产量和销量影响着整个供应链。因此,销售阶段的重要任务之一就是准确、合理地预测产品的产量和销量。
  在产量预测方面,文献提出了一种基于动态改进多元线性回归模型的次年产量预测方法,运用到某航空制造企业的次年产量预测中,证明了该模型的预测实用性;文献提出了基于有动量的自适应梯度下降法BP神经网络模型,并用它对攀枝花市的钢产量进行预测,实例表明该系统具有使用价值;文献基于RouGh集理论实现了薄膜蒸发器的产量预测,研究结果找出了对产量影响较大的因素,对产量的预测基本符合实际。
  在销量预测方面,文献运用BP神经网络模型,以月份因子(根据经验对产品淡旺季的描述)和历史月销售量为输入量对某电机企业五种产品进行销量预测,得到了较好的预测结果。文献采用了滑动平均和指数平滑法对PVC主型材销量进行预测,为生产计划制定、作业控制、库存控制等生产管理环节提供决策基础。文献提出了改进遗传算法结合Holt-winters的销售预测模型,并对实际卷烟销售量进行了预测,预测结果准确率90%以上。文献用时间序列分析预测流行饰品在不同区域的未来直销趋势,帮助管理人员制定销售策略,并合理安排生产、采购计划,提高利润。
 
  4.2 需求发现
  随着市场经济的逐渐完善,客户需求知识的作用越来越大,其中隐藏着消费者对产品的个性化需求以及产品未来的发展趋势等信息。客户需求的日渐多样化和个性化,要求企业能够快速响应市场,在高质量低成本前提下以最短时间开发客户需要的产品,制定符合客户需求的销售策略。基于大数据分析的方法,对海量销售历史数据进行建模,能够准确地帮助企业发现需求。文献从卡车制造商的视角出发,将大数据分析方法综合应用到经销商的客户价值分析中:用聚类模型进行经销商细分;用决策树模型分析经销商的重要程度;用关联规则分析经销商订购车型间的关系以进行品牌推广;用异常检测方法分析经销商流失;用神经网络模型综合分析经销商价值。上述模型在相应场景中的也应用具有一定的通用性。文献将关联规则算法运用到笔记本电脑BTO(Build to Order)生产计划中,基于BTO制造的特点,采用了分类、多最小支持和增量挖掘的改进算法,挖掘PC用户配置选择的关联关系,以此制定生产计划。文献提出用关联规则模型挖掘钟表企业物料清单(BOM)中的历史数据,分析不同零部件组合的产品的客户认可度和盈利能力,以此为基础制定营销策略。文献以机械制造企业为景,运用决策树枝技术中的CART算法对企业已有客户群数据进行分析,得到了企业忠诚客户预测模型。该模型可以帮助企业发现和培养忠诚客户。文献对烟草企业客户忠诚度指标极造分类决策树模型,通过改进的K-means算法,按客户的价值贡献度对客户进行聚类分析,以此划分了客户营销等级。对不同等级客户制定相应的营销策略,实现精细化营销。采用马尔柯夫预测法实现客户等级变化预测,并根据预测结果调整营销策略。文献提出基于企业的客户盈利能力数据,用聚类方法预测企业未来的盈利能力,并将企业资源有效投入到能为公司带来更大利润的客户上。文献使用市场值函数的方法,建立了红塔集团促销活动相应模型,预测客户的市场值并以此为依据将客户排序,从而帮助促销活动策划人员制定有针对性的促销方案。中国的制造业主要是以产业集群的形式存在,文献针对传统制造业集群,引入行业作为控制变量对全部样本进行回归分析,发现集群企业规模和创新能力与服务需求之间的关系。
 
  4.3 配送优化
  配送是销售阶段乃至整个供应链中至关重要的环节,是企业竞争中不可或缺的一环。制造业的物流系统以射频识别(ratio frequencyidentification,RFID)技术为核心。文献给出配送优化的思路:通过路由算法,对一系列特定位置和需求量的客户点,安排一定数量的运输车辆,在特定约束条件下达到配送速度最快、配送成本最低。文献提出针对RFID产生的海量数据,基于深度优先搜索(DFS)挖掘频繁路径,并以此为基础根据物品路径历史数据预测物品达到的下一位置及时间,以辅助企业进行物流配送管理和优化。文献基于遗传算法和免疫算法,分析了配送中心选址和配送路径优化的问题,设计了以最小化成本为目的的数学模型,并以某渔业企业的配送优化问题证实了研究结果的可用性;文献针对物流配送优化中聚类分析,旅行商问题和车辆路径问题这三个最基本的子问题,在顾客需求存在性随机和需求量随机的背景下,给出各子问题的数学模型和相应算法,并通过仿真实验验证了算法的有效性;文献对供应链中分销配送优化模型及其求解算法展开研究,重点进行了供应链多级分销系统优化模型及其多目标混合遗传算法和物流配送优化模型及其多目标遗传算法两方面的研究。
 
  5 售后阶段
 
  售后阶段主要为已售商品提供配套的服务,其内容有服务类型识别和产品运行状态监控等。
 
  5.1 服务类型识别
  服务类型识别在以汽车行业为代表的消费型产品制造业中具有举足轻重的地位。在汽车行业中,40%~60%的利润在服务、维修等售后服务领域。传统的售后服务模式是在客户遇到问题时主动联系企业,企业被动提供服务,这种模式会使企业损失许多潜在客户价值。随着信息技术的发展,许多企业尝试将信息技术运用到客户服务中,由此出现了客户关系管理(CRM)的概念。在CRM中引入大数据分析,能够帮助企业进行客户群分析,发掘潜在客户,预测流失客户,细分客户群,使企业能够主动地、有针对性的制定客户服务策略。文献提出围绕客户细分、客户支持、交叉营销、客户流失预警等方面,采用关联规则、聚类、决策树、神经网络等模型,挖掘客户潜在服务需求,主动为客户提供相应服务,以创造更大的客户价值。文献提出用序列模式挖掘的方法分析汽车用户的使用、保养与维修情况,找到其中的特殊规律,实现为汽车用户提供个性化的服务。文献提出在制造业售后服务中用ID3决策树算法分析客户评价信息,得到产品指标综合满意度结果,为企业质量功能展开(QFD)的实现奠定基础。文献提出在CRM中应用关联规则和序列分析等方法预测客户行为,用分类和聚类方法进行客户分。文献提出用聚类分析对企业的客户群进行细分,以针对不同客户群制定相应的管理策略。文献提出在制造业客户关系管理(CRM)中引入聚类分析和ID3决策树算法,对客户历史数据进行分析,预测潜在流失客户,以帮助企业提早采取措施挽留客户。文献针对通信设备制造业,用关联规则(FP-Growth)分析不同地区的销售特征,以预测流失客户;针对C4.5算法处理大量数据时耗时长的问题,提出自适应匹配和交叉验证的改进方法,并用改进算法判断会购买增值服务的客户,以发掘潜在客户。
  随着用户生成内容的大量增长,在线评论成为挖掘客户对产品和服务的意见的极有价值的来源。然而,大多数传统的意见挖掘方法是粗粒度的,不能理解自然语言。文献提出一种无监督的方法,从评论中提取评价表达模式(AEP),它代表了人们对产品或服务表达意见的方式,并且可以被视为方面和情感词之间的句法关系的精简表示。设计基于AEP的潜在狄利光雷分配模型(AEP-LDA),用于层面和情绪词的识别。
  如今与Web交互的主要方式是通过浏览器通过以人类可读的方式呈现信息来操纵信息。然而,向Web上的许多进程的自动化的演进可能导致计算机到计算机的交互在当前的人到计算机交互中变得占优势。文献提出基于规划的服务组合算法,其与潜在的大规模服务广告目录动态交互,以便用户按需检索匹配的服务广告。
 
  5.2 运行状态监控
  对产品的运行状态进行监控,可以帮助企业掌握产品的运行状态,及时发现问题,以便快速制定有针对性的服务策略。文献将聚类算法和关联规则算法相结合,实现依据大量数据对挖掘机故障关联关系的概率预测,从而进行有效地预防,并为生产商提供数据支持;文献采用基于逻辑数据仓库的数据挖掘模式,运用BP神经网络、K-means聚类分析算法和FP-Growth关联规则算法对汽车售后的潜在故障进行分析;文献将维护工人在进行提升机各个系统维护行为之前的监控数据进行删减和去噪,用所得数据训练C4.5决策树模型,表征故障隐患;文献基于模糊神经网络的智能诊断算法,根据实时获取的工程起重车运行参数,实现对起重车进程实时故障诊断。
  随着设备故障复杂程度的不断加深,具有隐蔽性、突发性、诱因多、复杂性和不确定性等特征的隐形故障成为复杂设备突发故障的主要诱因。文献采用增量更新算法使Ariori关联规则算法能够实时快速随故障数据库的更新而更新,以更好地对设备故障进行在线预警和诊断,然后引入BP神经网络的方法解决隐形故障这类不确定性因素较多的非线性问题。
 
  6 结束语
 
  本文介绍了制造业大数据的概念,讨论了制造业大数据的特点、制造业大数据分析的特点与挑战。本文按制造业的通用流程将制造业划分为设计、生产、采购、销售和售后五个环节,阐述了各个环节中主要业务场景的任务需求,并总结了大数据分析模型在这些场景中的应用的研究进展。可以看到,在制造业的诸多业务场景中均面临着复杂的预测、优化问题,传统的人工经验和统计分析方法解决这些问题的效果有待提高。而大数据分析为这些问题的解决提供了新的思路,并取得了较为满意的实验结果。
  然而,大数据技术在制造业中的应用,还面临着诸多挑战。在技术方面,文中涉及的研究成果多处于实验阶段,其实验数据多为人工筛选和审查的高质量数据,而实际生产环境中面临着许多数据质量问题。此外,将上述模型和算法部署于实际场景,还需考虑诸多因素,如模型的通用性、灵活性和鲁棒性,以及算法的实际性能等;在管理方面,研究者和企业管理人员还需考虑如何将大数据分析方案合理整合到企业的业务逻辑中,以使其真正发挥作用。
 
http://www.mpmpc.org/file/upload/201611/18/12-07-44-23-1.jpg
 
关注"中国肉类机械网"微信公众平台
[ ]  [ 打印 ]  [ 投稿 ]  [ 关闭 ]  [ 评论 ]  [ 返回顶部
 
 
免责与声明:

1.凡转载本网内容,请注明信息来源“中国肉类机械网”,或与本网联系,违者将追究法律责任。

2.凡本网编辑转载的信息内容,其版权均由原作者和资料提供方所拥有,并不代表本网赞同其观点和对其真实性负责。

3.如涉及作品内容、版权和其它问题,请在15日内与本网联系,我们将在第一时间作出回应或删除相关内容并致歉!

4.投稿热线:电话:010-88133989, 邮箱:mpmpcweb#126.com(注#换成@)


 
 
 
热点推荐
新闻排行
图文资讯
 
×关闭
×关闭