数据驱动业务发展的关键是数据质量和数据分析的合理性
作者:互联网
越来越多公司重视IT系统在企业经营管理中的重要性,所以,“数据驱动”企业经营管理成为一个热门的话题。
举个例子,数据驱动的风控管理体系,建立一个风控管理模型,根据输入的数据来自动进行风险决策。从而代替人工决策,一方面保障了风险决策的客观性,另一方面可以大大提高风险决策的高效性。这看起来是一个理想的风险管控方式,但是,这里有一个很重要的问题不容忽视,一旦数据质量出现问题,这一切就会变成无效的,甚至出现决策失误。所以,数据质量的保障就显得尤为重要。
数据质量的故障难以像程序故障一样快速定位和修复,它会持续蔓延,对下游产生影响。
而且,数据作为智能决策的输入,数据本身是动态变化的。它不像代码一样可以做静态分析。
数据分析的合理性。有一种现象,数据分析工作者只具有数据分析的能力,掌握了数据分析的方法和工具,但并不具备行业基本知识。这时,数据分析工作者得出的数据指标的相关性到底是不是真的相关? 这个相关性是真的存在,还是偶然的巧合?这是一个很容易被大家忽略的问题。如果这个相关性本身经不起推敲,它有如何来指导我们的工作呢?
数据指标的相关性,并不能得出结论说他们之间互为因果。我们需要通过因果分析的方法,为数据之间的相关性提出符合业务逻辑和商业逻辑的解释,甚至要借助科学实验,来验证数据分析的结论。
数据预测不是万能的。有些人把一些很难预见或很难判断的问题,幻想通过预测算法来解决。比如,新型冠状病毒COVID-19的出现是很多人始料未及,对它的危害程度和影响范围,也没有做出很好的判断和预警。有人就想,是不是有算法可以预测下一次类似传染病到来的时间和危害程度。这里面存在太多的不确定性因素,是很难通过算法来预测的。
算法的成功落地应用,不仅需要合适的模型,还需要大量多维度的数据,更关键的是要有一个算法工程体系。
samuelwang_ccnu 发布了17 篇原创文章 · 获赞 1 · 访问量 1万+ 私信 关注标签:数据分析,决策,风控,算法,相关性,数据,合理性 来源: https://blog.csdn.net/samuelwang_ccnu/article/details/104510614