联想毕巍:大数据本质场景未变 突破在于底层技术
比如说举个例子,大的这种金属扳头插在后裤带上面,然后爬到上面去施工,这个时候这种是典型的不安全行为,因为这个扳头很有可能掉下来,就会酿成一些潜在的重大安全事故。这样的一些场景,当然我们现在目前还在拍的阶段,基本上是挑了十个场景,每个场景提供了典型的20张图片,这20张图片拿过来以后,他们有经验的安全员作为一个行业专家,跟我们的算法科学家一块共同针对这十种典型场景去建模。其实没有这么简单的,因为举个例子,不戴安全帽在工地行走,这是一个标准的不安全行为,但是你怎么去判断哪块区域叫做工地、哪块区域叫办公地?建模当中,光是这么一个东西,最后你会发现你可能要上千个参数配合起来,才能有效地去判断这件事,难是难在这些地方。这个地方他们提供了大概两个PB的流媒体的数据,在这当中我们做了深度的算法chaning,然后在它的实时的视频流当中做了一些尝试,现在目前来看,我们还是能够有效地从它的视频当中,他们也做了一些配合,他们也找了一些工地的工人,帮我们模拟了这些非规的行为,然后我们也从实时的视频当中有效地去检测到了一些不安全的行为模式。所以这方面,我觉得确实是一个在现实当中的应用场景,它就是一个听上去很简单,但其实真正要做到还是很难的。 刚才我简单地跟大家汇报了两个城市的应用场景,接下来跟大家汇报一下我们在企业这边的一些应用场景。 联想这边现在目前在过去的两年,其实我们已经在整个的企业这边已经做了比较多的实践,其实比较多的还是制造业,制造业里面包括钢铁、汽车,这来个行业是我们现在目前案例比较丰富的,也包括医疗、金融。在这当中,金融可能是不太一样,金融、医疗不太一样,后面我也会讲到,对于制造业来说,其实它本质上是这五个环节:智能化研发、智能化采购、智慧化生产和智能化销售以及智能化服务,接下来我分别跟大家做一些阐述。 对不起,这个顺序有点乱了,我先讲医药的案例。这是全球最大的医药流通公司康德乐,在上海的,他们这边的诉求其实也蛮简单的,他们针对全国各地的代理机构,它的药店、它的分销商,每个月都会汇聚所有的订单,订单上来以后由于人工填写的,所以对于医院名称、对于药品名称、对最终用户的名称,其实存在相当多的不规范情况,它要去花大量的人力把这个东西理清楚,理完以后才能够对它的分销体系进行一个奖金分发和计算。为什么这么做我们不用去关心,但是它实践的情况是每个月大概要花150个人,然后大概是15天半个月的时间去做这个工作,到月底的时候才能把奖金计算清楚去分发。 在这当中,我们帮他们做了,其实讲起来也蛮简单的,我们在这里边主要帮他做了两件事,效果我等会儿讲一下,我们本质上做了两件事,第一个是模式识别,各种各样的订单拍完了照片然后去做模式识别;第二是做自然语言的识别,订单里边其实都是各种各样的描述,我们要把这种描述里边抽取出来,包括我们结合网上的信息,要综合判断它整个的用户、药品等等这些方面的信息,然后帮它能够去规范化这个信息,其实最终做的就是规范化这个信息,每条记录都要规范化。 实际的效果,现在目前的情况是,我们让它整个人力成本目前降低了80%,它现在目前大概每个月只要投入30个人左右,主要是做复核、做抽检。因为这个是刚刚开始这样一个用机器算法来执行的过程,所以他们目前还不太放心,所以还是花了30个人在抽检,我相信如果再过一段时间,可能这个人员会大规模再次缩减。它准确率从原来手工复核准确率92%提升到了99%左右。这里边的效率原来基本上要花15天150个人,现在目前基本上机器去做这件事的话,大批量前期的人工把这些订单扫描进去以后,后面基本上四小时就可以把原来150人15天的工作做完了,它的准确率还比原来的人工提升七个点。这就是在行业当中的一个非常经典的另外一种应用场景,其实它背后的基理也很简单,自然语言识别、图像识别,然后做机器的匹配,帮它去做整个的,包括互联网上的数据进行精准的匹配。 这个是钢铁企业的、这个是制造业的,钢铁企业里边,我们现在目前其实除了联想自身实践以外,我们在外面输出主要做了两方面的工作,一方面的工作我们做的是精准预测,这个主要在宝钢去做的,主要针对它现在目前某一类型的汽车钢板对它前面市场上面的汽车销量的预测,以及带动对宝钢这边的,各个汽车厂对宝钢的订单的预测,加上后面它供应链的预测。这个精准预测度大概是我们提升了十个点,因此给它去年节省了差不多一个亿左右的采购金额。 另外一个比较典型的案例,也是模式识别,这个模式识别主要是对于它整个产线上面的质量的检测,这个我们主要在太钢。太钢它主要是流水线上面的钢板出厂的时候,原来它是人工抽检,现在目前我们是用搞清的摄像头拍完以后,在后端实时地去做模式识别,对它的瑕疵进行识别。现在目前的做法我们达到的效果是什么?它可以做到从原来五分钟检测一个钢板,现在做到了十毫秒可以完成一次检测;原来是抽检,现在可以做到全面检测,而且它的用工也大大降低了。 这个另外场景我就不讲了,这主要是数据弧的,这是比较传统的,只是传统的BI。前面讲的其实是有AI的结合,这个是一个传统的BI,但只是用大数据的方式去实现它原来的BI。这边我们可以看到,它的分析周期从原来的BI平台里面的一周,现在目前能做到几乎是秒级的分析场景,这个联想支撑时间也是差不多的。我们从ACP的orcal环境牵移到了ACP的哈那环境,提升了大概15倍左右的分析效率,进一步提升到了大数据平台,大概又提升了20倍左右的效率。到目前为止,在联想资金里边,现在元庆在办公室里边想要看什么数据,基本上一分钟左右就可以看到准实时的数据。确实,它的应用场景没有太大变化,但它确实是技术手段实现了我们原来大家在BI年代我们就希望做到的效果。 (编辑:威海站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |