实体服务资源的联网化抢夺战

[摘要]

过去的20年,互联网公司抢夺用户,运用连接用户的成果进行业务创新乃至行业整合。而在人联网已经趋于饱和的今天,运用物联网技术连接服务场所,将一切互联网还没有渗透到的地方连接起来,俨然成为新的抢夺阵地。本文从几个案例出发分析如何运用物联网技术,赋能服务业,发现新机会。


服务业重塑,比想象中来得更快一些

服务,是指以劳动的形式为他人做事,使对方能从中受益的一种活动。零售、餐饮、金融、医疗、教育、租赁等等都是我们日常生活中所熟悉的服务业。零售业在过去10多年里已经被互联网深入改造,商品陈列、询价、交易等环节被搬到了线上。而很多其他服务业,比如小超市、餐厅、酒店、停车场、理发店、美容院等等,因为联网不便而得以幸免。对于这些“服务场所”,以往我们称之为线下场景。然而,现在这个局面正在迅速被改变。

阿里零售通和小超市

阿里有个业务,叫零售通。它的策略是给街头的夫妻店小超市赋能,帮助他们提供全套的小超市运营工具,提供进货渠道,客户引流以及店面的装修;但需要在装修后的店面招牌上,将“天猫”的Logo放到了原来小店店名之前。夫妻店面对阿里并没有议价权利,会乖乖拱手送出所有的经营数据,如此一来,阿里便可将千千万万夫妻便利店纳入自己品牌之下,一如当年的淘宝网店小卖家。

(阿里零售通模式)

ECTP和停车场

在跑马圈地抢占线下服务资源的不止阿里一家。ECTP是一家停车场解决方案供应商。停车场运营者在购买他们的解决方案后,就可以实现对停车场的自动化管理,比如自动车牌识别,自动计费。为了能够加快推广速度,ETCP免费给停车场提供设备。在使用其设备的停车场达到一定规模后,ECTP推出了直接面向车主的APP渠道,从设备供应商摇身一变成了停车服务品牌商。

美团点评和餐厅

还有美团点评。在安装了美团的智慧餐厅解决方案的餐厅里,食客从找餐馆到预约、取号、点单、支付再到评价,都可以在这套平台的支持下得到非常顺畅的体验。同时,美团点评能够非常方便地得到这家店每天实时的运营数据和各个消费者的就餐数据。

华住数字化平台和线下酒店

当不仅仅是互联网公司,传统企业也加入了这场服务资源抢夺战。在全季、汉庭、CitiGo等华住旗下的酒店里,会员在下单后可以直接选择住哪间房子。办理入住时,住客可以选择在自助机器上直接办理Checkin。很多酒店已经实现了房内的红外人体检测,住客进房后不需要刷卡房间就会自动供电。在华住的布局里,互联网APP负责建立为住客服务的渠道,而联网化的酒店负责为客户提供优质的现代服务体验。

服务业重塑,比想象中来得更快,更猛烈。无论是互联网公司、还是传统企业都在试图将互联网的控制力延伸出液晶屏,渗透到种种服务场所中。

从人联网,到物联网

在互联网过去的20年发展史里,互联网公司抢夺的是用户,是人联网。而在人联网已经趋于饱和的今天,下一波蓝海其实是运用物联网技术连接服务场所,将一切互联网还没有渗透到的地方连接起来。在我们看来,物联网的优势有4个:

  • 随时随地:当用户任何时候位于任何地方,产生了想要操作身边或者相隔万里的事物时,都可以直接通过互联网链接来接入互联网,建立连接。
  • 随心所欲:在与想要操作的对象建立链接后,用户不光是可以用传感器去感知对象,而且可以远程控制设备,施加对物理世界的直接影响。
  • 设备/场所:用户接入物联网链接即可以直接控制/感知一个设备,更重要的是借助这些设备去控制/感知设备所在的场所。
  • 自动化:一旦将设备联网,对设备所产生的数据以及对设备的管理控制即可以由用户自己来负责,也可以委托给服务器和AI。

以往,我们会将这些“服务场所”称之为线下场景,脱离互联网,但现在借助物联网技术的逐步成熟,这些服务场所已经很容易实现联网化,不再有线上线下之分。谁能够将更多的服务场所联网,谁能够控制这些实体空间里的服务,获取其中的运营数据,包装服务价值给消费者,谁就是这其中的胜者。比如,滴滴已经成功地将绝大部分私家车资源圈到了自家门下,成了全国最大的出行服务公司。

这是必然的趋势,无法逆转。

服务的核心逻辑

加入这场争夺战,必须了解服务的本质。典型的服务过程包含4个环节:响应需求请求,获取客户需求,分析规划服务,实施服务。物联网技术和应用的兴起,帮助服务提供者在这四个环节发现新的机会。

1. 响应需求请求

企业与个人提供服务的第一步是让客户可以方便地发起服务请求。为了迅速响应这些请求,企业往往在全世界设立门店,招募员工。但是,受限于人力、房屋租赁等成本,企业能够铺设的服务网点是有限的。客户必须在企业有限的营业时间自己跑到服务点才能享受服务。有限的服务人员又会让客户排起长队。为了提升服务的高响应性,企业必须开更多的门店,雇更多的服务人员,运营成本节节高升。

受益于蜂窝网络的成熟,企业现在得以在任意空间部署可以响应客户提供服务的联网设备。这些联网设备帮助企业彻底突破了服务的空间和时间限制,使得顾客可以随时随地享受企业所带来的服务。每一辆智能单车其实都是摩拜公司派出的服务终端。小区楼下的快递柜24小时都在待命,随时响应你的快递投递需求。

2. 获取客户需求

为了能够为客户提供适合的服务,企业需要收集客户的需求信息,不同定位的企业往往会采用不同的需求调研策略。定位高端服务的企业会对每一位高净值顾客都投入精力,详尽地了解其需求,然后为其量身定做最适合其个人状况的服务。中低端服务企业则不会对每一位顾客如此上心,而是对客户群体进行抽样调查,设计服务流程,再交由一线服务者去实施。每个客户接受到的服务都是无差别的,丧失了服务的移情性。比如,对于大多数慢性病病人,医院完全没办法为每一位病人都配备齐全的检查设备,长时间地持续收集其病情数据。但是富人就可以雇佣私人医生,持续分析自己的病情,获得长期康复调理建议。

在智能物联网时代,传感器在变得不断低功耗化、微型化、联网化。这些技术使得收集客户需求数据的成本急剧下降,并且突破了空间的限制。腾讯糖大夫的血糖仪可以帮助糖尿病人方便地测量血糖指数,并且把这些数据交给医生来做远程诊断,及早发现病情恶化的征召。通过对血压/睡眠/皮肤电等数据的持续测量,老人们就可以住在自己家里,同时享受医生的远程监护服务。

收集客户需求不仅可以用血糖仪这样的专用传感器,在人工智能的帮助下,摄像头和麦克风这样的通用传感器也可以变成收集顾客需求信息的利器。

在学而思网校的双师课堂里,摄像头配上人脸表情识别引擎能够帮老师持续分析各个学生的学习状态,是困惑时的眉头紧缩,还是学会知识后的笑逐颜开。基于语音识别/语义理解构建的服务机器人,能够能与顾客直接对话,来判断客户想要订购哪些商品。低成本、自动化的传感器+AI将能够帮助企业大大加快扩张业务的速度。相信不远的未来,就会有机器人在肯德基/奶茶店/电影院/海底捞里问你想要点些什么。

3. 分析规划服务

区分高端和中低端服务的一个最简单的依据就是企业是否知道来享受服务的顾客叫什么。在高端服务业里,服务人员会投入大量精力,对尊贵的客户做非常深入的分析,努力为其提供最完美的服务。但是在中低端服务中,受限于成本,企业并不会为每一位客户做服务的分析规划。这种情况下,服务方式其实都是事先由总部来设计好,再由一线服务人员做标准化的执行。服务人员甚至并不在意你叫什么,你是男是女是老是少。顾客在服务网点只能从这些标准化服务的菜单中选择,没有太多定制的自由空间。

(Waston可以检查X光中的癌症征兆)

当企业通过智能物联网高效地收集客户数据,就迈出了为每个人提供个性化定制服务的第一步。为了分析这些数据,企业还需要付出高昂的成本来雇佣具备诊断能力的专家,这就限制了企业的服务带宽。而现在,机器学习能够解决这个矛盾。在向电脑提供经过专家预先标记的训练集数据之后,电脑就可以使用监督学习来自动寻找自变量和因变量之间的关系,训练出人工智能模型。训练完成的模型就可以根据输出的原始数据自动做出分类判断。现在,IBM的Waston已经实现了基于X光片的影像来识别患者是否患有恶性肿瘤。保险公司也可以基于每个人的基因图谱测绘数据来判断客户患各类疾病的风险,从而为顾客提供精准的定制保险服务。

4. 实施服务

以往,为客户提供服务实施的载体往往是员工和设备。但现在,这些工作已经被越来越多样的联网设备实现。现在随处可见的共享汽车、共享充电宝、共享借伞机、自助榨汁机、无人按摩椅、迷你K歌房,以前都曾只是企业的白日梦。借助于智能物联网技术的逐步成熟,这些梦想都变成了现实。这些设备体积更加小巧,可以放置在任何地方,在为客户提供服务的同时也时刻保持着与服务器的连接,接受企业的统一管理。雇员从台前转向幕后,变成了这些设备的维护者。

除了部署方便的优势外,这些设备还可以在服务器的调度下自动完成服务实施,这使得企业提供定制化服务变得更加方便。比如,现在你在酒店房间里点餐,机器人就可以将餐送到你的门口。在你入住酒店之前,服务器就可以识别你的身份,自动将房间的温度、湿度、亮度调整到最适合你的状态。

(提供房间服务的机器人)

即便现在有一些服务太过于复杂,还无法全交给设备来执行,企业也可以将服务计划推动到服务人员的随身联网设备上。这些随身设备其实就是服务人员的网关,将人接入了互联网,变成了connected human。我们现在已经非常熟悉的专车服务,就是通过将服务计划下发给司机的手机来实现的。如此看来,联网设备只是把人类这样一种服务载体拓展成无数种专业设备,为客户提供榨果汁、按摩、充电的服务。

运用物联网重塑服务业的关键路径物

联网只是一种技术,本身并不直接产生业务价值。为了能够用物联网技术改造你所在的服务业,就需要发现应用物联网的合适机会。第一步就是:分析目标用户在各个需求场景中的用户旅程,找到适合的需求痛点。

基于物联网的优势和服务的本质,我们可以获得一个公式。所有能够套入这个公式的用户痛点都是应用物联网技术的机会:

(某类用户)在(某时某地)希望(自己/AI)能够(感知/控制/分析)位于(异地/旁边)的(设备/场所)

套用这个公式,我们可以举几个例子:

  • 爸爸妈妈在上班时希望自己能够方便地看到位于家里的宝宝在做什么
  • 超市顾客在逛超市时希望自己能够方便地使用超市的称重机给水果称重
  • 车主周末在小区停车场希望自己能够方便地使用位于停车场的洗车机来洗车
  • 食客在餐位上吃饭时希望自己能够方便地知道位于后厨的菜做到什么进度了

通过这些例子,我们可以看到,物联网技术的应用可以直接改变我们每天的衣食住行、吃喝拉撒。恰当地应用物联网技术真的可以让用户随时随地、眼观六路、耳听八方、为所欲为。

互联网远远没有饱和,一个新的时代已经拉开帷幕。


更多精彩商业洞见,请关注微信公众号:ThoughtWorks商业洞见

Share

当Subdomain遇见Bounded Context

《实现领域驱动设计》的作者Vernon根据过去几年DDD的实战经验又写了一本《领域驱动设计精粹》,日前已经在中国翻译出版。去年底出版社找到我时,读完英文原著最终还是放弃了翻译,推荐给了其他同事,并告诉他们出版后准备接受炮火洗礼。

不得不承认Vernon的新书在构建DDD落地体系方面较之上一本有了很大的进步,全书读起来很连贯,有一定实践基础的团队或个人均可直接上手书中很多的实践。并且通过一个案例完整叙述了从需求分析开始到最后的团队迭代开发。当然迭代运作过程中的工作量估计方式,在我看来过于简单粗暴,虽然强化了架构的最终代码落地,但却可能造成一系列的僵化。

本文主要针对Vernon一直以来对Subdomain和Bounded Context的一对一映射关系进行讨论。目标是让更多同学意识到这个方面的不同声音,从而能够加深对这两个概念存在意义的理解,并建立自己的判断。

区分问题和解决方案是个老大难问题

问题和解决方案总是像一对难以分辨的孪生兄弟,一个人看到的哥哥可能就是另一个人认为的弟弟。好像程序员在开发Story时,Story成了我们要解决的问题,具体的代码实现成了解决方案;但当BA在分析同样一个Story时,问题就成了对应的业务需求,Story只是分析出的解决方案的描述。

当然这个区分有时候可能并没有那么重要,Story到底是一个问题,还是一个解决方案,其实我们在迭代过程中并不是很关心。但有时候不做问题和解决方案的区分确是十分危险的,甚至会造成整个产品的失败。这样的例子当然是一抓一大把的,比如我经常提及的为税务审计人员提供屏幕上多记录的翻页功能,就是我职业生涯中记忆最深刻的一次失误,想当然地采用了“通用”解决方案。

Eric Evan在构建DDD的体系时显然是思考了问题和解决方案这两个维度的,我相信这个过程也是十分痛苦的,以至于最后呈现在书里的实践并没有做非常明确地划分。对于后面的实践者,包括我们自己,都存在着不一样的解读。我们曾经讨论过一个DDD实践的象限划分,但由于这样的划分太过主观,结果是一组很长的邮件讨论。

象限如下图所示,这是一个如同“PHP是世界上最好语言”般的讨论,建议大家慎入,以免上火。

(从问题/解决方案和战略/战术 维度分析DDD元模型的元素)

这样的象限分类确实有点简单粗暴,但Subdomain和Bounded Context却是Eric明确定义的两个核心模型概念。Subdomain是对问题域的分解,而Bounded Context是对解决方案域的分解。这两个核心概念构建起了DDD处理真实世界复杂度的根基。

建模过程中很多同学其实是忽略Subdomain的,反正目标是Bounded Context。当问题相对简单时,Subdomain的划分确实给人感觉是自寻烦恼,划出Bounded Context后反过来推Subdomain视乎更容易上手。读《领域驱动设计精粹》时你会发现相似的逻辑,配合书中敏捷项目管理工具的案例(问题也挺简单)还是挺好用的。

那么为什么我们还要关注Subdomain,还要去区分什么Core Domain、Support Domain和Generic Domain呢?是否和Story一样,留给业务和BA就好,程序员还是应该抓紧搞完Bounded Context,然后开写微服务比较务实呢?

区分Subdomain的必要性

在帮助一个长期合作伙伴构建大规模DDD应用时,我写了一个“xx阶xx步”的体系。也成了很多咱们同事体系性学习DDD的开始。

一年半以后这个团队组织了所有的技术专家和主管让我又讲了一次这个体系。这次我花了一天时间让大家体会问题和解决方案的区别,加入了Subdomain的概念。参加团建时,我问了几个专家和主管他们怎么看之前的设计,得到更多是务实的“赞赏”。其实我并不在意具体落地时的裁剪,但希望白纸黑字时应该明确原委,这也是我为什么拒绝了《领域驱动设计精要》翻译的原因。

我经常用电商的案例让大家快速认识到Subdomain划分的重要性。大浪淘沙之后我们发现淘宝和京东依然是霸主。当年马爸爸嘲笑强哥构建人肉物流网的寓言也并没有发生,反而很多人爱上了京东自有物流的速度。当然站在马爸爸当年对电商问题的认知角度,自建物流是可笑的,毕竟他要解决的核心问题是如何让琳琅满目的中小供应商能够直接对接千千万万的用户,让用户能够更容易的发现适合的商品。

所以从一开始淘宝和京东定义的Core Subdomain就是不一样的,正是问题认知的区别让两家都活了下来,并且活得很好。我们可以看到在线物品展示,吸引消费者方面淘宝一直在引领;而行业里如果你有机会接触电商领域,会发现京东物流系统还是蛮厉害的。

这是我们多年后的今天看到的结果呈现,但其实真正决定命运和格局的确是多年前两家电商对自身核心问题的理解。这个认知驱动出了两家完全不同的成功电商。

很多同学会说这玩意儿是商业模式,也轮不到我们搞研发的参与。我们拿到的都是既定问题了,再识别Subdomain也没啥意义了。这个论断有两方面问题:

  • 作为产品和服务的实现者,如果都不参与和关注问题本身的划分及核心子问题的认知,那么你很可能在浪费自己的时间,开发出未来被边缘化,甚至淘汰的系统。这不是危言耸听,在我的最近咨询过程中已经鉴证了很多次,比如在这个移动优先的时代去强化PC应用的技术架构。
  • 其次在这个软件应用空前发展的时代,始终抱着所有模块都必须是“自研”,所有代码都必须自己写的思想,毫无疑问只能成为“小作坊”。构建现代的复杂系统已经逐步成为一个生态工程,随着数字化服务的普及,识别哪些领域应该直接外购使用也成为了开发团队的重要能力,构建一个典型的移动应用应该没有人再会去重头写一个二维码扫描模块,而是学会从市场上选择适合的软件包。

那么什么地方应该建,什么地方应该买,应该如何决定呢?这时候我们会发现Subdomain的划分就非常有指导意义了。类似二维码扫描这样的Generic领域显然应该是外购的,而当年京东对电商的理解来看物流系统是要自建的。同样道理还有上次DDD China大会来分享的盒马生鲜,半年时间已经重写了三次核心ERP系统。不去思考问题划分的同学们会觉得盒马疯了,ERP在外部看来是多么成熟的软件包啊~ 但事实上盒马生鲜的本质就在如何解决生鲜食品的高效配送上,也可以说是一家特殊的物流公司。

小结一下,即使区分问题和解决方案很抽象,划分子问题很烧脑,我们还是必须认识到分析问题本身的重要性和必要性。借用雷布斯的成名句“不要用战术上的勤奋掩盖战略上的懒惰”!

Subdomain和Bounded Context的对应关系?

探讨了Subdomain的必要性,自然我们需要分析和解决方案这边Bounded Context分解的关系。第一次看Eric构建的DDD模型脑图(如下)时,我一直认为少画了Subdomain和Bounded Context的对应关系。最早采用DDD时,个人认知是一个Subdomain下应该有多个Bounded Context,即当我们分析出了一个子问题后在针对建模的解决方案进行分解,成为多个Bounded Context。所以Subdomain:Bounded Context应该是1:N的关系。

(Eric构建的DDD模型脑图)

然而Vernon一直以来的实践方式隐含着1:1的对应关系。这样的对应关系并非没有道理,如果咱们从一个Bounded Context出发,我们会发现每个Bounded Context必然应该是“解决”部分问题的,而这个部分问题是否就应该是一个Subdomain呢?

当我们拿着这个差异去跟Event Storming的发明者Alberto Brandolini讨论时,发现对方委婉地表达了N:N的理解。简而言之没有直接的对应关系。当然这种理解隐含了一个Bounded Context是可以服务于多个Subdomain子问题的。比如“产品展示”Bounded Context的模型可能服务于产品销售和产品评论两个Subdomain子问题。

这三个对应关系的理解暴露出了大家对问题和解决方案这个老大难问题的纠结~ 当然最简单的是能够建立一对一的映射,作为解决方案高手的程序员们显然是非常喜欢这个模式的。以至于很多用DDD建模的程序员直接就跳过Subdomain搞起了Bounded Context。当然这也是我坚决反对这样简单化映射关系的重要原因。

出于对方法实操性的考虑,我仍然认为一对多的映射是最优的选择。诚然在我们的现实世界里,问题和解决方案是没有必然对应关系的,他山之石可以攻玉也是古来有之的。但软件设计本身就是一个问题抽象的过程,这个抽象一定会选取一个视角,也就会放弃部分信息。在这样的认知下,其实我并不介意在不同子问题的解决方案里存在一定的重复。

所以,如果让我来站队Subdomain和Bounded Context的对应关系,我仍然会选择一对多。在准确性和易用性之间寻求一个平衡,并保证大家能够更多的关注问题本身。

坚持持续认知问题

Subdomain和Bounded Context的讨论随着DDD实践的深入会进一步被大家所讨论,不论大家是否能够共识,这样的讨论都是有好处的。作为软件开发的从业者,在面对这个越来越多不确定性的数字化时代,认知问题本身将越来越重要。

Subdomain和Bounded Context在实际认知过程中一定也是相辅相成,逐步清晰的两个概念。Bounded Context建立一定是针对Subdomain的;而Subdomain的划分又会通过Bounded Context的模型得到持续地验证。


更多精彩洞见,请关注微信公众号:思特沃克

Share

数据质量管理的一些思考

背景

在近期的项目当中,我们为客户落地实施了数据资产平台。随后,在数据平台中接入了客户子公司的一个业务系统的明细数据。客户希望在我们的数据平台上通过数据探索和数据分析,来挖掘一些业务价值和业务创新点。

当我们拿到数据开始进行一些初步探索的时候,发现导入平台的数据质量存在一定的问题:例如一些用于数据分析的关键字段的值为空、一些本应该有主从关系的数据对应不上、数据分类混乱等。这些问题直接影响到了对业务数据的分析和价值挖掘。因此,我们决定先对这份业务数据进行一次质量评估。如果评估的结果太差,不能做太多有价值的数据分析,那么我们的工作方向可能就需要转变为帮助客户制定整改数据质量的计划和方案。

数据质量问题

什么是质量

关于质量是有个一个标准定义的:一组固有特性满足明示的、通常隐含的或必须履行的需求或期望(要求)的​程度。这里面包含了两层意思,一个是说质量其实是一组特性,另一个是说质量需要满足需求或期望。所以如果从数据分析的角度来说数据质量,就是看当前数据的特性能否满足我们做数据分析或挖掘这个需求。

质量问题的来源

数据问题的来源可能产生于从数据源头到数据存储介质的各个环节。在数据采集阶段,数据的真实性、准确性、完整性、时效性都会影响数据质量。除此之外,数据的加工、存储过程都有可能涉及对原始数据的修改,从而引发数据的质量问题。所以,技术、流程、管理等多方面的因素都有可能会影响到数据质量。

在企业中,随着企业业务的增长,数据也是一个增量积累的过程。随着数据类型、数据来源的不断丰富以及数据数量的快速增长,企业在数据管理工作和数据流程中面临越来越多的数据质量问题。而且数据质量的管理并没有被企业重视起来,其根本原因还是ROI并没有那么明显。

数据质量管理相对来说成本比较高。因为它涉及到企业数据标准的制定、规范的落地、生命周期的管理等多个环节。从收益上来说,数据质量的效益和结果并不是十分明显,大部分企业不会把数据质量作为KPI。在企业的不同系统中,业务领域的关键指标不一致,数据无法共享导致出现数据孤岛,大量数据无法关联,并且有明显的数据冗余等问题,还有数据的维护需要投入大量的人员、时间、软硬件成本。所以数据的质量管理往往被会边缘化甚至趋向于无。

数据质量评估

那么我们如何对一份数据进行质量评估呢?这是一个比较难以回答的问题。因为数据质量本身有这么几个问题。首先是数据质量定义不一致,人们对数据质量的理解并没有一个参考标准或者标准的定义,所以人们理解的数据质量就会呈现出多样性,而无论是数据评估体系还是数据质量控制体系,都离不开关于数据质量的清晰定义。其次,没有权威性的数据质量标准模型或参考模型。再者,没有系统化的数据质量评估指标,也没有对数据质量评估的指标形成一个量化的标准。所以现在多数对于数据质量的研究都是针对特定领域或特定问题的研究,并不具有普适性,很难推广成为标准化的体系或模型。

那我们能不能像CMMI(能力成熟度模型, Capability Maturity Model Integration)和 AMM(敏捷成熟度模型,Agile Maturity Model)一样对数据质量建立一个模型,我们暂且称之为DQAM(数据质量评估模型,Data Quality Assessment Model)。

首先思考一下,在进行数据质量评估时我们会选取多个指标,所以很自然会想到借用一下模糊综合评价理论。搜集了一下资料,这里选取以下若干个指标来作为我们的数据质量评价指标(当然,可以根据实际需要选取其他指标,指标的数量也可多可少):

  • Completeness:完整性,用于度量哪些数据丢失了或者哪些数据不可用
  • Conformity:规范性,用于度量哪些数据未按统一格式存储
  • Consistency:一致性,用于度量哪些数据的值在信息含义上是冲突的
  • Accuracy:准确性,用于度量哪些数据和信息是不正确的,或者数据是超期的
  • Uniqueness:唯一性,用于度量哪些数据是重复数据或者数据的哪些属性是重复的
  • Integration:关联性,用于度量哪些关联的数据缺失或者未建立索引

那么评估模型应该有这么几个要素:

  • Dataset:被评估的数据集,对于关系型数据库来说就是一张表
  • Indicators:评估指标,就是上面列出来的6个指标
  • Rule:评估规则,与上面的评估指标对应,后续会根据规则的描述来编写脚本。
  • Weight:权重,此处的权重是每一条评估规则在全部规则的所占比重
  • Expectation:期望,根据每个评估规则给出一个评估前的期望值(0-100)
  • Score:结果,每个评估规则应用到数据集后计算出来的结果值(0-100)

那么构造整个模型的过程基本就可以确定下来,首先根据需要选取数据集当中要进行评估的数据视图,再选取所需要的评估指标。下一步需要制定规则集,根据所选的评估指标来制定相应的数据质量评估规则,并确定它们相应的权值和期望值。最后一步就是根据规则集来计算结果得分。

对于数据集的N个规则计算出来的得分,最后计算其加权平均值,得到质量评估的绝对量化值。用该量化值和期望进行差值比较,可以得出该数据集是比预期的好,还是不如预期。

以上是一个简单的评估模型,目前并没有在实际的场景中应用,当然这个模型的精度并不会很高,也没有处理误差。仅仅提供一个思路,或许质量的评估可以朝着这个方向来进行。

数据质量管理

数据工作流质量管理

下面来谈谈数据质量管理。质量管理前面提到了,涉及到数据工作流的各个环节。数据的工作流可以分为以下几部分:数据产生、加工处理、存储、挖掘和应用。质量管理的前提是在每一个环节建立质量标准。数据的来源包括:业务系统产生的数据、外部系统的数据、手动录入的数据等,从这些源头采集数据,然后经过数据通道进行加工处理(ETL,Extract-Transform-Load),数据进入到数据仓库或数据集市当中。然后业务人员、数据科学家、数据工程师等,会在数据平台对数据进行探索和挖掘,这个过程可能发生在数据仓库,也可能是在数据沙箱中进行,最后对数据探索分析挖掘的产出结果,会以数据应用的方式发布出来,具体的形式包括:数据报表、数据门户、OLAP、数据产品、数据服务、智能模型等等。

数据质量监督

除了制定质量标准外,还需要对系统中的数据本身和数据工作流进行监督管理。

对数据系统进行实时监控,监测数据工作环境的服务器软硬件运行状态、性能、磁盘空间、数据库事务、锁、缓冲、会话量、备份等等一系列指标,实施预警机制,并监测一些异常情况的发生。

对数据进行定期校验,除了对数据系统进行实施监控外,还需要对数据进行校验:日常校验、数据抽检、全面校验等。

审核制度也是保证质量的一个重要措施,特别是对于敏感数据和敏感操作。建立数据变更时候的分级审核制度,尤其是一些影响较大或者权限较高的操作。建立审批制度,对于数据的读取,如果涉及到敏感数据,必要时,也需要数据审批或者是数据脱敏。

数据生命周期管理

数据的生命周期从数据规划开始,中间是一个包括产生、处理、部署、应用、监控、存档、销毁这几个步骤并不断循环的过程。随着业务的发展,系统的业务数据类型和业务规范不断变化,一个完备的数据生命周期管理方案还应当包括对系统的优化调整,根据业务系统实际运行情况、新的业务类型和规范、技术改进等调整原有的数据存储迁移策略和访问方式,以满足业务系统发展及新的业务规范需求。数据生命周期管理的目的是对不同阶段的数据采取不同的管理策略用来降低数据管理运营成本,并提高数据质量度,实现数据价值最大化的终极目的。

总结

数据质量在任何系统当中都是十分重要却容易被忽视的一部分。构建完整的数据质量管理体系,既是支持企业系统稳定运行的基本保障,同时也是企业进行数字化转型、创新的必备条件。


更多精彩洞见,请关注微信公众号:思特沃克

Share

ThoughtWorks的下一个春天在哪里?

过去,很多人是因为敏捷、因为Martin Fowler知道ThoughtWorks的。今天,敏捷已经渐渐融入软件开发的主流话语体系。这让我不得不努力思考,我们凭借什么样的优势能在下一个5年里持续地领先于竞争对手呢?

当考虑竞争优势的时候,各家顾问和大师们总能祭出林林总总的分析框架,大体可分为“自外而内”和“自内而外”两类。作为一个过气咨询师,我也不可免俗地选了一个框架。我没用常见的“自外而内”,如著名的波特五力法,而是挑了一种较少人知的“自内而外”法 – 基于资源的竞争优势(Resource-Based Theory of Competitive Advantage)。

ThoughtWorks有一句口号叫 “Technology at the Core”。这里Technology的解读可以延伸到设计、分析、数据等各项专业领域。ThoughtWorks的资源,其实就是ThoughtWorker的技能和积累在组织中的know-how。这些资源让我们在完成各种客户任务时,展现出超越竞争对手的能力。

分析我们近10年的历史,ThoughtWorks展现出的是两种优势。一个是发挥领先经验的经济价值,ThoughtWorks能比其它公司更快地学习和采纳新的方法和技术,敏捷和RoR的掌握和运用就是这样的例子;另一个是让高复杂度的能力成为阻击竞争对手的壁垒。能力的形成,源于个体之间复杂的交互和学习网络,这个网络则依赖于组织结构、氛围和业务模式等要素。比如跨界而关联的能力就是一种复杂度,正如我们所说,“ThoughtWorks是软件开发公司里设计最好的,能做设计的公司里软件开发最好的”,这种复杂度使得模仿变得非常困难。

明天,我们的资源和能力能在什么领域产生重大的价值并取得优势的呢?

著名的创新机构DARPA(Defence Advanced Research Projects Agency)有两个选择创新的标准,其中一个是识别已经发展到拐点的科学领域,用新的方法解决一个实际的问题。这个标准对我们也有借鉴意义,只是我们的目标不是科学领域,而是技术领域和商业领域。

以商业领域为例,哪些方面正面临着拐点,商业的运作正在被哪些技术,特别是我们比较擅长的技术所颠覆呢?回过头来看看我们已经选择的两个领域:金融(参见Mckinsey report:The rise of the digital bank )和零售(参见Mckinsey report: How digital is transforming retail )。最新的互联网、移动技术和模式对这两个行业产生了天翻地覆的冲击,各大主要玩家都在积极求变,而这正是ThoughtWorks的机会所在。

然而,虽然我们在上述这些领域或许有点这样那样的优势,却远远不足以让我们占据领先的位置和建立竞争壁垒。除了业务领域知识的欠缺外,我们在技术上的差距又在哪里?如何才能跨越这些差距?

安全:在互联网金融领域,安全会是我们的一个短板。“自2014年3月16日起,网贷之家官网持续多日受到黑客的严重恶意攻击,持续十分钟的30G流量攻击,同时数万IP的CC攻击,短短几小时内6亿次的连续攻击。”( http://www.csdn.net/article/a/2014-04-02/302486)大家也知道,从ThoughtWorks内部孵化产品 – 金数据也曾遭遇类似的攻击,并且因此中断服务近12个小时。这还不是最糟的,如果安全做得不好,还可能泄露用户隐私信息,甚至给客户造成财务上的巨大损失。我们虽然正在学习和提升安全方面的能力,并且也在招聘相关方向的专家,但能力的积累不是一天两天能做到的。我们如何能够尽快补齐这个短板?

移动与硬件:在零售领域,我们的突破方向是数字和实体世界的体验融合,而移动和硬件将是体验的关键。这是一个创新层出不穷的领域,却又是缺乏前人成功经验的领域(DARPA另一个选择创新的标准:识别一个现有技术所还不能解决的发展中问题),我们的路在何方?IoT(Internet of Things)还是增强现实(Augmented reality)的商业应用场景?

数据驱动:我们不能仅关注交易和体验的界面,如果要让运营者获取超越对手的价值,则不得不提到数据。数据驱动的体验设计,数据驱动的市场定位,数据驱动的营销,数据驱动的风险控制,要做到这些,需要我们不仅能够帮助客户搭建大数据基础设施,还要能够娴熟运用不同商业场景下所需的分析方法和工具。对我们来说这又是一个跨界的能力,如何取得?

MD心声

我们有很多其它的差距,我还不清楚;还有很多其它的问题,我还没有答案;除了金融和零售,是否其它的领域也面临类似的拐点,我也不知道。不过,我却并不是特别着急,ThoughtWorks聪明者众,我们并不缺乏有热情,愿意投入的人,他们会是提供上述问题最佳答案的人。

作为我个人而言,最重要的就是发现这些愿意提出问题、探索答案,并愿意付出努力的“内部创业者”,为他们创造合适的平台和足够的空间,积极实现他们个人和ThoughtWorks的成功。如果你也是这其中一员,请不要犹豫,向前一步!


作者注:ThoughtWorks在2016年选择了IoT和数据驱动的智能服务作为重点投入的技术战略方向,探索创新的客户商业场景。

编者按:MD为寻求TW未来的探索和焦虑跃然纸上。


更多精彩洞见,请关注微信公众号:思特沃克

Share

可以不是拼多多用户,但不妨学习拼多多的道法术

拼多多无疑是当前新零售中不可忽视的一股力量。抛开各种吸引眼球的话题,朴素地探讨下拼多多的商业逻辑、核心场景、运营模式、挑战及启示,希望能为扎扎实实做零售的企业提供一些参考。

自九十年代电子商务在中国萌芽,2003年淘宝成立,中国电商进入到了快速发展时期。阿里京东在综合电商领域争强称霸,传统企业如苏宁、国美等通过数字化的发展不断在电商领域开疆拓土,垂直电商如聚美优品、蜜芽宝贝等在细分领域凭着深耕细作割据一方。在现有电商格局下,几乎每一个领域都是饱和的。同时,伴随互联网人口红利逐渐触顶和流量获取越来越贵,电商领域竞争突围越来越难,似乎完全没有蹊径。

2017年,当整个行业聚焦新零售还在探讨各种可能的突破模式时,才成立2年的拼多多以迅速崛起之姿出现在大众的视野中:2017年12月拼多多用户突破3亿位居第3,仅次于淘宝和京东;2018年1月,拼多多GMV超过400亿;2018年6月30日,拼多多正式申请IPO。虽起于无声,听闻之时已是不容忽视的巨头。

拼多多称自己是C2B模式的社交电商平台:一方面将“电商“与“社交”进行深度融合,用户通过参与或者发起和家人、朋友等的拼团,用优惠的价格购买商品;另一方面平台通过迅速聚合的大量需求,反向推动上游供给侧生产流通。在拼多多构建的拼团世界里,社交分享是其核心。当一个用户选择了一款商品后向好友发送拼单邀请,拼单成功后主动发起者能以低价购买到商品,被动参与到拼单的人增加了非目的性购物的机会。 在这样的模式下,拼多多借助于微信海量活跃用户和低价爆款产品的吸引,实现了快速的传播与裂变。

(图1:C2B社交电商模式)

传统电商逻辑

  • 通过营销和促销获得新用户,将流量转化为订单;
  • 建立流畅的购物体验和提供优质商品与服务,实现用户留存和复购;
  • 运用商品和内容的推荐和搜索机制,方便用户快速找到心仪的商品;
  • 吸引商家入驻,提供新的渠道销售商品,实现多方共赢(针对平台类电商);
  • 构建/提升仓储物流能力;
  • 通过数据运营反复验证并优化以上几点。

在这样的逻辑下,两个问题凸显:一是电商平台的获客成本越来越高;二是由于服务范围的需要品类不断扩充,这在某种程度上使用户迷失在海量商品的搜索和选择中,购买决策时间延长。

拼多多的逻辑

拼多多则另辟蹊径:

  • 以分享为主要切入口,通过“拼团”的形式在社交平台上迅速扩散;
  • 社交属性和高性价比激发了非刚性购物需求;
  • 以商品分享推荐为主,推出低价和爆款商品,用商品去寻找合适的人;
  • 在传统的购物流程中增加互动性和趣味性,形成一种共享式购物体验;
  • 通过拼团打造规模效应,将有大量货物的商家/厂商与用户连接,实现资源均衡。

拼多多更加注重对“人”的理解,依托于微信的海量用户,通过“人”分享和推荐商品,再通过商品找到合适的“人”,既用低成本快速获取大量用户,又减少了用户做决策的时间。

(图2:拼多多的商业逻辑分析)

拼多多的核心场景

拼多多的核心用户场景可以分为以下四类:

  • 直接去拼单:发现符合心意的商品后,发起拼单;
  • 参与拼单:通过分享或浏览信息发现合适商品后,参与拼单;
  • 砍价免费拿:邀请微信好友帮忙砍价;
  • 单独购买:不参与拼团单独购买,单独购买价格高于拼团价格。

在大部分应用场景下,拼多多都包含着邀请或分享的环节,做到了对微信用户数量和用户关系的深度挖掘。

(图3:拼单流程)

虽然低价和拼团是电商常用方式,但拼多多在此基础上选择了更有针对性的用户群体,并且关注用户的体验和感受。

  • 通过低价模式瞄准三、四线城市的已婚女性,洞察到她们需要更高性价比的商品,让她们在碎片时间里完成了一次又一次拼团;
  • 营造“小确幸”的感觉,并将这种“小确幸”的感觉分享给她们的亲人和朋友,一起购买低价适用的商品;
  • 超低价降低了用户的心里预期,形成了“买到就是赚到”的感觉,并且由于低价的吸引,一部分用户还会继续在拼多多上购物。

拼多多的运营模式

拼多多从2015年9月成立至今,平台已经从探索期过渡到了增长期,在探索期和增长期采用了不同的运营模式。

(图4:平台生命周期,数据来自拼多多官网和电子商务研究中心)

1. 平台探索期

  • 战略定位:锁定 “社交电商”,并将目标人群定位为对价格敏感的人群,解决用户如何购买到高性价比商品的问题;
  • 品类:此阶段推出的商品以生鲜和用户高频购买的生活性必需品为主,商品本身性价比的重要性大于品牌内容;
  • 运营:运营广告和营销投入集中于招商入驻和后端产业链上;用户端主要借势于微信小程序的影响和微信海量活跃用户,通过微信推荐分享和低价爆款不断为平台引流,并借助围绕低价与分享展开的营销留存用户。

2. 平台增长期

经过探索期对于“社交电商”的验证和蓄力后,逐渐将目标人群范围扩大到全网对价格敏感的用户并实现了全品类运营,满足用户“想要的都可以拼着买”的需求。

在用户端的运营策略也开始转变,一方面在营销推广方面不断发力,在一线城市的地铁和公交站投放广告、赞助热播的综艺和影视剧,与此同时 “神曲”《拼多多》也变得耳熟能详,自此拼多多不仅仅是只存在家人/朋友聊天里的商品分享和一起砍价,而是彻底走进了大众视野。另一方面,拼多多开始更加注重用户口碑和树立正面的平台形象,持续增大商品打假力度和优化售后服务,并逐渐将从微信获得的用户导流到自身App端。

拼多多的挑战

尽管拼多多一路高歌,但在其快速发展的背后,也存在着明显的问题和挑战。

  1. 备受诟病的货品质量、物流速度、售后服务和商家维权等问题;拼多多以便宜作为切入点,快速成长的同时一直面临着诸多争议,如何进一步提升平台的品质感、提高消费者满意度是拼多多进一步跃升的关键。拼多多势必要走上与淘宝当年相似的先发展、后治理的漫长道路。
  2. 重社交的业务模式对腾讯系渠道产生的重度依赖;这可能是其最大的“阿基琉斯之踵”,就跟App Store控制了iOS生态一样,未来拼多多需要更多考虑如何通过自身“造血”,形成持续稳定的增长。
  3. 是否有被阿里京东或其他传统电商直接复制,抢回用户?拼多多的模式并不复杂,淘宝、京东或是其他传统电商都有力量孵化出另外一个“拼多多”,面对这些零售力量的不断夹击,拼多多如何更有效的应对挑战,继续保持增长并留存已有用户是其必须要面对并解决的问题。对于拼多多而言,未来的路布满荆棘。

那么,拼多多到底有哪些地方是值得学习的呢?

拼多多的启示

(图5:拼多多的明道、优术与取势)

明道:回归零售本质,关注“人” 的体验,激发潜在需求

在零售三要素“人”、“货”、“场”中,传统零售通常更加关注“货”和“场”,主要围绕着如何扩大生产力生产更多的产品,如何找到更多的渠道进行销售,而往往忽略了实际消费者的真正需求。关注“人”的体验,激发潜在需求,意味着:

  • 深刻洞察用户的需求以及需求背后的情感体验。例如拼多多瞄准了对价格敏感的人群,既满足了他们低价购买商品的需求,又满足了用很便宜的价格购买到实用商品的“小确幸” 和“买到就赚到”的感觉。
  • 借助数字化技术建立多元和高效的连接用户方式,及时捕捉用户信息和感知消费需求,并建立起跨越空间和时间限制的消费场景,不断激发和满足用户的消费需求。例如苏宁推出的“智能小biu”产品,它是一款人工智能音响,用户通过语音指示即可直接在苏宁易购电商网站上下订单和查询快递。苏宁利用物联网技术和人工智能技术,将用户与其强大的零售资源相连通,既简化了用户的购物流程,又为苏宁自身提供了更多零售入口。

取势:消费升级趋势下,打造精细化运营

中国社会的多元化状态,造成了消费的结构化分层:或从“无处可买”到“价格敏感”、或从“价格敏感”到追求“品质与体验”、或从追求“品质与体验” 到追求“简约健康”等等,针对不同的消费群体需要采取不同的运营策略。

从整体上看,高线级城市居民追求高品质、注重消费体验,愿意为建立在产品本身价值之上的品牌溢价和情感价值买单,低线级城市仍处在价格敏感和“够用就行“阶段,这部分人群的需求往往被主流企业和平台忽略。拼多多正好抓住了契机,在阿里、京东、网易等电商龙头近年来纷纷向中高端消费市场发力时,拼多多以价格优势强占了低线级城市市场,同时也满足了低线级城市居民的“消费升级”。

消费的结构化分级带来了同一领域更多的细分用户群体,传统零售企业需要审时度势,在用户运营端深耕细作:

  • 从宏观策略层面,根据平台定位甄选目标用户群体,并持续监测和评估平台定位与目标用户群体的匹配程度,不断审视和优化连接用户的方式,以期达到将最有效和最具吸引力的信息传递给最需要或最有可能购买的用户;
  • 从具体执行层面,通过数据赋能用户运营,将用户的决策节点(认知-兴趣-购买-复购)与用户自身的特点(用户信息、兴趣偏好、购买能力等)进行关联,最终以更高效、更智能化的方式连接用户并帮助用户做决策 。相似的还有沃尔玛的WMX(Walmart Exchange)广告平台,既可以在用户通过各个渠道进入沃尔玛时,借助对用户的背景信息、消费习惯等的分析,提供精准的商品广告;也可以在特定商品的推广中,根据用户背景信息选取合适的用户作为受众,制作广告并投放到选定的渠道上。

优术: 广泛融合与创新,打通商业链路

通过不断革新的数字化技术,驱动融合与创新,零售企业一方面可以在消费前端最大限度地触达、理解、服务用户,另一方面深入到供应链后端,提升产业链整体的资源整合和协调能力。

  • 渠道与资源整合,将不同渠道(线上、线下)、不同终端(PC、移动端、智能终端、VR等)深度融合与打通,在捕捉用户信息 、商品和内容、营销与促销、订单与支付等环节协同配合,构造数字化全渠道体验,比如盒马鲜生、永辉超级物种等;
  • 深入到供应链后端,通过对用户的洞察和对需求的大量汇集,反向推动生产环节,使生产不再是批量化闭门设计,而是以需求为驱动力并且可以快速响应市场的有计划生产,在拼多多上一部分商品通过“定制化生产+压缩供应链”来降低成本,既为用户提供了低价商品,又提升了整个供应链效率。

在瞬息万变的商业环境里,还有很多像拼多多一样的企业借助商业模式的不断创新和数字化技术在产业链上的赋能,实现在时代浪潮中的脱颖而出。而真正经得起时间和用户考验的还是那些能抓住商业本质的企业——提供优质的商品和服务,提升整个产业链服务能力。


更多精彩商业洞见,请关注微信公众号:ThoughtWorks商业洞见

Share