这些年,智游变成了,旅游行业里的热门话题,从景区门票预约开始,到客流实时监控,这背后都离不开大数据的支持。
好多人觉得只要搜集充足多的数据,系统便能够自动变得“智慧”,然而在实际落地的情况里,真正造成阻碍的常常是数据挖掘这一环节。
接下来,将智游应用里的实际情形与之相结合,探讨一下大数据挖掘与普通数据分析究竟存在何种差异,还有目前最为令人头疼的几个问题是什么。
信息化平台建了,数据却挖不动
众多景区以及旅游部门,已投放诸多资金去构建 Wi—Fi 覆盖面,打造物联网感知器件,设立旅游大数据中心,甚至于搭建可视化平台。
这些设施确实能够协助管理者把控游客数量,掌控车流情况,把握酒店入住率等宏观指标。
但是,要是仅仅运用这些平台去做单纯的统计以及进行预警,那么,那样的情形仍旧是处于“数据分析”的层面之上。
需达成的真正的大数据挖掘是,于海量且杂乱以及多来源的数据之中自动发觉隐藏规律。举例而言,借助游客在景区里的移动轨迹来预测下一个热力拥堵点,联合天气数据与社交媒体评价适时调试推荐路线。然而在现实情形里,大部分平台仅仅做到了数据收集以及基础统计。因涉及气象部门、交通部门、旅行社、电商平台等多个数据源,打通这些“数据孤岛”的工作量极为巨大,致使挖掘工作根本没办法开展。没有可用的挖掘数据,再大的数据中心也只能算是个高级仓库。
挖掘方法跟不上旅游数据的复杂性
不少人错误地认为,一旦有了云计算,便能够轻易地处理全部数据,然而,旅游行业的数据形态,要比人们所想象的复杂得多。
除去订单记录、门票销量这般的结构化数据,更多的是图片、文字评论、天气变化这类非结构化数据。
含有实际拥挤程度潜在可能的,是一张由游客上传的风景图,影响接下来几天客流趋势走向的,或许是一条含有情绪的差评。
平日里常用的关联分析那类方法,还有聚类分析以及相似度分析等办法,在碰到旅游数据这种情况的时候,通常会显得力不从心。具体是由于旅游数据当中冗余信息实在太多,一位游客完整的行为链条常常分散于多个平台,比如说行前搜索这个平台,还有行中打卡那个平台,以及行后评价这个平台。要在实时状态下把此番数据串联起来,并且挖掘出有实用价值的东西,这对于算法以及算力而言,都是极大的一种考验。好多景区实际存贮了海量的数据,然而真正能够用起来的挖掘结果却少得十分可怜。这与普通的企业销售数据分析全然不一样,后者的数据是干净的,其维度能够被控制,然而旅游数据挖掘却更类似于在杂乱喧嚣的集市之中听明白每一个人的故事。

数据安全和挖掘深度成了死对头
于智游应用之中,游客的“吃、住、行、游、娱、购”这些方面的数据,一旦被予以充分挖掘,的确是能够提供个性化推荐以及精准服务的。
但是副作用明显程度也是很高的,这些数据一旦出现被滥用的情况,或者遭遇到泄露的状况,那么游客的人身安全以及财产安全,都会受到相应的威胁。
2017 年频繁发生的数据安全事件已经敲响警钟。
现实里进行操作时,数据共享的程度与挖掘的深度常常呈现出相反的比例关系。为了对隐私加以保护,众多单位会选择把数据锁在各自的系统之中,彼此之间不进行打通。如此以来就致使挖掘算法仅仅能够获取到残缺不全的数据片段,非常难以得出高质量的结论。当下行业倡导“可用不可见”这样的技术方案,然而在旅游领域的落地情况还极为有限。数据安全管理成为了所有挖掘工作的前置条件,不进行操作是不行的,可是做得过头又会使得挖掘工作无从着手。这种矛盾在传统数据分析的时代并不显著,是因为以往数据量较少、来源单一,能够通过脱敏进行简单处理。时下,于大数据量级状况之中,每一个隐私方面的细节,皆具备着能够被通过关联分析予以拼凑呈现出来的可能性,其难度,全然并非处于同一个级别之上。
既懂旅游又懂挖掘的人才太少
旅游业,是个综合性颇强、信息依存度颇高的行业,负责智游数据挖掘的人,不但得懂算法、统计学,还必须了解游客心理、景区运营、交通调度等业务。
现实当中,大数据方面的人才原本就是缺乏的,往后的三到五年里,全球的各个地方都面临着人才不足的状况,能够寻找到那种同时对旅游以及数据挖掘都精通的人更是困难无比。
好些景区购置了价格高昂的存储以及分析设备,然而却没人清楚该运用何种模型去挖掘哪些数据。众多从业人员仅仅会操作现成的报表工具,一旦碰到非结构化数据或者实时流数据处理便毫无办法。再加上创新型人才易于流向互联网大厂或者金融行业,乐意留在旅游领域的更为稀少。人才培养并非短期内能够解决的,高校里旅游管理专业和大数据专业之间的差距还非常大。如此一来,便致使智游项目极易呈现出“重硬件、轻算法”的状况,——那即是楼已然建成,设备也已安装妥当,然而,真正能够使数据生成智慧的人持续处于缺失状态。
在智游应用里,大数据挖掘的核心挑战并非是收集数据,而是在于要怎样于复杂的环境下,在安全的状况中,在人才短缺的条件下,真正地将数据价值给“挖”出来。
单单信息化平台不过是地基罢了,挖掘方法以及数据安全才属于承重墙,复合型人才则是施工队呀。
当前,这三块均存在显著的不足之处,致使诸多智游项目,表面上显得热热闹闹,然而实际上其智慧的含量是有限的。
在要想达成 2011 年所提出的十年智游目标的期许下,接下来的重点应当从“建平台”转变至“挖价值”方面,与此同时,还要加快数据安全立法以及跨部门协作,如此才能使大数据真正地成为智游的智慧源头。

Comments NOTHING