洞察数据分析趋势 构建业务价值新等式
“我们认为数据分析会成为企业的创新源泉,企业会利用越来越多基于数据的价值实现降本增效,获得更好的盈利增长。可以看到,数据分析所带来的决策能力已成为一家有韧性的企业的核心竞争力之一。”Gartner高级研究总监孙鑫谈到,“数据分析不只存在于技术的选型上,员工的培养、人才的竞争同样重要,每家企业都想用最新的数据科学能力帮助企业做出更符合业务情境的决策。同时,数据分析也给我们带来了更多业务模式的思考,帮助企业去实现更优化的数字化转型。”
今年3月,Gartner发布了2022年十二大数据和分析趋势,涵盖三大主题,分别是:激发企业活力和多样性、增强人员能力和决策,以及信任的制度化,每个主题又呈现出四个趋势,每一个趋势之间环环相扣,相互影响和增强。
Gartner提出的业务价值新等式
随着数据规模的指数级增长,数据类型的愈发复杂,很多企业并没有足够的技术能力将这些数据有效利用起来,因此,激发企业多样性的创新活力就变得非常重要。由此,也引申出了要成为一家更动态、更丰富、更具有韧性的企业——一是要具备自适应人工智能系统(Adaptive AI Systems),到2026年,企业应用AI工程化的手段实现该系统后会比没有采取此措施的企业多运营出25%的AI模型。之后,Gartner建议企业借助DevOps、DataOps、ModelOps等“Ops”更有效的建立这些模型,持续迭代相应的功能,以组装式的思路完成数字化建设和智能决策。
构建以数据为中心的人工智能对上述系统至关重要。AI模型是否有效使用很大程度上取决于数据可用性、数据质量和数据的管理,而多数企业在引入AI时并未考虑过以怎样的数据管理模式治理AI模型。事实上,数据管理能力可以大幅提升AI的开发和部署效率。对此,业界提出了Data Fabric,Gartner称之为基于“元数据”驱动的数据编织(Metadata-Driven Data Fabric)。所谓元数据,就是描绘数据的数据,会从被动使用转向高效利用,把数据行为结合机器学习实现更好的数据管理和数据洞察。期间,还可以融入知识图谱等技术挖掘更多的关联性。
数据管理能力对AI非常关键
借助数据编织,企业可以建立增强型的数据目录,关联各种各样的数据源,相当于在传统的“数仓、数据湖”之上建立了一张虚拟的网。结合采集到的数据和元数据,为数据管理加入更多的自动化能力。孙鑫认为,很多企业都不具备基于元数据、知识图谱的数据管理能力,在中国的普及率甚至要低于1%,“很多中国的企业都是被动式的管理元数据,对于业务侧或是社交侧的元数据并未有效采集,对数据编织的使用停留在建立数据目录或数据资产上。尽管一些中国企业推广了低代码、无代码技术,但数据消费的行为和元数据的管理工具并没有打通,而元数据就是数据编织的原料,也直接影响了数据管理的水平。”
有了完善的数据编织能力,就能够搭建“始终分享的数据(Always Share Data)”,这一趋势加强了数据共享作为一项面向业务的关键绩效指标的作用,表明企业机构为了创造公共价值,正在与利益相关方进行有效的互动并让更多人能够获得正确的数据。新冠疫情和其他近期的大规模全球事件令企业机构迫切地想要通过共享数据来加快独立和相互关联的公共和商业数字业务价值。Gartner预测,到2026年,大多数外部中间商将被应用于内部和外部数据生态系统的自动化信任度指标取代,这将使数据共享风险降低一半。
为了提供与决策者相关的洞察,数据和分析领导者需要提供语境丰富、使用业务模块组件创建的分析,包括将数据素养作为优先事项,以及制定应对数据和分析人才稀缺问题的策略。到2025年,情境驱动/背景驱动的数据分析和人工智能模型会取代60%建立在传统数据上的现有模型,其背后的一个趋势是知识图谱的广泛应用,与越来越多的“元数据”管理工具、预测分析工具相结合,挖掘到了更多的情景或背景信息,并且连接了更多的结构化和非结构化数据。有了知识图谱作为情境分析的基础,就能更好的完成特征数据的收集,结合机器学习做出更准确的判断。
业务模块组装式数据和分析(From IT-Embedded to Business-Composed D&A)是帮助企业提升数据洞察力的一种直接方式。Gartner预测,到2025年50%的嵌入式的分析型内容,将由业务人员利用低代码、无代码工具,通过组装式、模块化的方式完成。孙鑫称:“我们可以通过一些价值链管理的工具,自上而下的设计在每个业务流程中应该嵌入哪些数据分析能力。针对这些业务流程可能每天都会去做决策,如果这时候可以把数据分析能力像积木一样快速搭建,就能赋能业务迅速做出决策。”
业务模块组装式数据和分析
以决策为中心的数据和分析,意味着业务情境/决策将更直观的影响企业的数据行为,需要业务人员和IT人员合作得更为紧密,成为“融合团队”。例如在决策智能模型中,会帮助企业从顶层设计的角度管理决策链。业务与IT的融合团队可以改善组织决策的方式,所形成的决策框架会让更多的人站在更高的位置上,基于数据分析给出建议和规划。此时,就要解决另一个问题——数据和分析人员的技能和素养的不足(Data and Analytics Skills and Literacy Shortfall)。
到2025年,大多数首席数据官(CDO)将无法培养实现战略数据驱动的既定业务目标所必需的员工数据素养。Gartner的研究显示,在数据和分析中考虑人员因素的企业机构比只考虑技术的企业机构更加成功。这种以人为本的理念能够推动更大范围的数字化学习,而不仅仅是提供核心技术平台、数据集和工具。对此,Gartner给出了一套解决方案,分为人才获取、人才培养、人才留存三个方面。其中,人才获取要通过成果激励让他们了解到数据分析可以解决更多的实际问题;人才培养是要建立数据分析社区,营造良好的数据文化;人才留存是与人力资源部门协作,通过在日常工作中加入数据分析的内容,给予一定的激励来促使其使用数据能力。
有了无处不在的数据分析能力,各个参与方之间的相互信任同样重要。只有通过管理AI风险并实施跨分布式系统、边缘环境和新兴生态系统的互联治理,才能大规模地实现数据和分析的价值。其中,互联治理(Connected Governance)更多体现为一个框架,用于建立跨组织、跨业务职能、跨地域的虚拟数据和分析治理层,实现跨企业的治理效果。在中国,数据治理更要考虑本地的合规要求,还要兼顾数据质量、数据安全、数据隐私、数据道德、数据定义模型等全生命周期。为此,一些企业会设立“首席数据官”的办公室,下面会有数据治理委员会,该组织可能还会与法律部门或安全部门协作,更加系统性的实现“互联治理”。
提到数据治理中的安全和隐私,就不能不讨论人们对于AI发展的担忧。虽然AI正在变得日益普遍,但大多数企业机构仍因无法解释或说明其模型的用途而失去人员对其的信任和透明度。Gartner预测,到2026年,开发出可信赖的目标导向型AI的企业机构将实现75%以上的AI创新成功率,而未能做到这一点的企业机构只有40%的成功率。此时,就要解决AI风险管理(AI Trust Risk and Security Management)。
由于安全和隐私等方面的阻碍,导致半数的AI模型从未进入到生产环境,可以说信任风险和安全管理方面的缺陷直接影响了使用AI的效益。例如,相关的处罚会让ROI降低、AI模型过多加大运维难度、缺乏标准治理工具、数据模型质量参差不齐引发偏见、缺少主动管控等。因此,Gartner希望企业可以更加主动的关注AI领域的信任风险和安全管理。当然,这也离不开厂商和地区生态系统(Vendor and Region Ecosystems)的互信。
随着越来越多的企业开始建立本土化或国产化的数据分析能力,它们也开始遇到区域性的合规和治理问题,需要与各方生态携手完善数据分析和运营能力。孙鑫透露,如果不考虑供应商锁定的问题,更多企业还是会选择一家云厂商供应数据分析产品,因此建议服务商在提供数据分析产品时可以考虑在一朵云上完成。同时,还要重视不同厂商之间的兼容性。
如今,数据价值在边缘环境同样重要,数据和分析正在向边缘扩展(Data and Analytics Expansion to The Edge)。孙鑫认为,在边缘平台完成数据分析更加符合数据主权和监管的诉求,所以建议采用分布式的技术架构。同时,边缘与云、数据中心是相互关联的,要根据业务所需来部署数据分析工具。
联想(Lenovo)SR658/SR650 2U机架服务器主机(至强银牌4210*2/2*32G/4*1.2TB SAS/R530-8i/1*750W)改配
进入购买
西部数据(Western Digital) 8TB 企业级硬盘 HC320 SATA6Gb/s 7200转256M (HUS728T8TALE6L4)
进入购买
戴尔(DELL)R740服务器主机/2*至强银牌4210R十核2.4GHz/16G*4/4TSAS*3/H730P-2G/750W双电/导轨/三年保修
进入购买