
在【rainbowzhou 面试13/101】技术提问--说说你了解的大数据应用产品?中,聊了聊用户画像是什么、如何用、前置条件以及它与大数据的关系。今天想详细聊聊关于用户画像平台的构成,希望对大家有所帮助。
前言:用户画像平台通过对用户数据的采集、计算、存储、查询和分析,挖掘有价值的信息,以帮助产品人员、运营人员进行优化。
在【rainbowzhou 面试3/101】技术提问--大数据测试是什么,你如何测?中,描述了关于用户画像数据存储方面的基础设施,除此之外还有:

如上图虚线框中为常见的数据仓库ETL加工流程,也就是将每日的业务数据、日志数据、埋点数据等经过ETL过程,加工到数据仓库对应的ODS层、Dw层、DM层中。
中间的虚线框即为用户画像建模的主要环节,用户画像不是产生数据的源头,而是对基于数据仓库ODS层、DW层、DM层中与用户相关数据的二次建模加工。在ETL过程中将用户标签计算结果写入Hive,由于不同数据库有不同的应用场景,后续需要进一步将数据同步到MySQL、 HBase、Elasticsearch等数据库中。
用户画像的构成

以上详细描述了用户画像的构成。用户画像平台数据处理链路长,涉及的数据质量问题多。它的质量保障是一个巨大的挑战,那么我们应该如何测它呢?在之后的面试系列的文章中,我将进一步讲解数据处理链路的全流程测试的相关内容。最后恰逢中秋节与教师节,祝大家双节快乐~
参考资源:
看完今天的分享对你是不是有所启发呢,有任何想法都欢迎大家后台私信我,一起探讨交流。
本文分享自 rainbowzhou的成长足迹 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!