行业纵横
你秃了但数据质量变好了!—「市场部聊数据」之浅谈数据质量
作者:Yaoyao
阅读时长:4分钟2020年03月13日
书到用时方恨少,“数”到用时却方恨“多”!望着茫茫用户数据海洋,大部分市场部同仁可能和最初的小编一样,只能兴叹而不知如何回头是岸。这时候,你就需要营销自动化中的数据整合平台来帮你的忙。
你可能遇到过以下场景:
- 场景一:你想更新邮件营销名单,要整合 10份“考古出土”的来自各种活动的高意向潜客名单,却惊奇的发现各类信息参差不齐,还有未标注的各色高亮标记、最新的意向状态居然是半年前更新的—— 小朋友,你是不是有很多问号?
- 场景二:你想要总结各渠道获客数据,发现每个渠道的用户数据没有存在统一字段下,要写无数个vlookup来帮你匹配无数个phone number、Shouji、手机、手机号、Name、姓名、Xingming、最新姓名、姓名-用这个,更有甚者,来个乱码的PNY2gGWVcQa3shUhAiB2Mg渠道名让你“哭问”客从何处来。
无论你是在B2B或是B2C公司的市场部搬砖,处理的数据大或小,以上都是你可能会遇到的数据质量挑战。在数据分析中有句俗话:垃圾进,垃圾出。再完美的数据模型、再全面的分析解释,都无法将垃圾数据变成有价值的商业洞察。 本期「市场部聊数据」我们就来聊聊用户数据分析中的数据质量。
数据质量定义
数据质量指的是数据的质量水平,定义是“应用适用性”,由数据使用者来评判。若适用于运营、决策、规划的使用目的,则被认为是高质量的数据。美国数据科学国家机构制定的数据质量准则是:
- 数据是产品(有成本和价值)
- 数据有质量
- 数据质量取决于多种因素(如数据使用目的、用户、时间等)
数据质量挑战
从零售、旅游到制造业,各行业的商业数据都将在大数据趋势下迎接数据质量的挑战,呈现以下四大特征:Volume(大量)、Velocity(高速)、Variety(多样性)、Veracity(真实性)。
这带来了相应的数据质量挑战:
- 大量数据种类以及复杂的数据结构使数据整合的困难程度上升;
- 数据体量大以致无法在短时间内判断数据质量水平;
- 数据变化太快而且数据的“及时性”很短,因此要求更高的处理技术;
- 目前没有统一和经过实践的数据质量标准,对于数据质量的研究才刚刚开始。
提高数据质量的四大策略
- 为全公司创建一个实用及有价值的数据收集和清洗过程
- 可视化
- 将数据切片(Slice)以查看细节
- 了解数据错误
- 发动群众力量来修复数据
- 让过程变得机动
- 让数据易于被修正
- 中心化地创建规则及清理元数据
- 如何分类及打标签(如男、男性、Male、0或1……)
应用以上策略来规划数据生命周期的四个阶段
- 计划阶段:数据定义、收集手段等;
- 收集阶段(数据获取):标准化数据收集表单、全面的员工培训以及良好搭建的数据库;
- 管理阶段(数据结构):缺失数据管理及非结构化数据;
- 分析阶段(数据传递):数据模型。
好了,本期我们大致了解了市场部数据质量的理论。Stay tuned,且听小编「市场部聊数据」下回的实例分解!