1.在定义用户肖像之前,用户肖像是什么,让我们首先了解建议系统是什么
场景:
在当前的互联网时代,在线购物被称为正常状态。当我们在主要的电子商务平台上购物时,不难找到这种现象。当您搜索某个浏览时,单击目标产品,然后返回主页。您可以发现您刚刚搜索的相关产品已经在主页的推荐列中。护理产品。例如,当您搜索用户肖像书籍时,建议列将出现有关用户肖像的书籍。这些功能称为建议,而完成这些行为的人则是推荐的系统。
自然:
推荐系统是记录和分析用户的浏览行为,并根据这些行为预测他们将购买的产品。Pharaoh购买了用户肖像的书,因此法老与此书有联系。Xiaoli购买了皮肤护理产品,因此xiaoli so xiaoli促进了这种皮肤护理产品之间的联系。推荐系统是根据某些算法来预测用户与产品之间的联系。
看一个简单的用户肖像:
00122广东20000821男士电子产品00222北京20000908男士技术书籍00323 HEBEI 19991201女性化妆品用户肖像的定义:
2.存储中用户肖像的要求3. 1号播放器:MySQL
每个人都应该熟悉MySQL的此数据库。在这里,我们从该数据库的基础结构开始。由MySQL底层选择的数据结构是B+树。当涉及到B+树时,我们必须提及另一个数据结构B树。
B树简介:
上图是B树的形式。每个节点都有两个数据元素,每个节点具有三个子节点,每个节点有两个数据元素
无论B树哪种形式,都有以下定理。这四个定理也是确保B树插入和删除可以平衡的原因。
B树插入规则:
树木存在的问题:
基于B树中存在的这些问题,B+树出现
B+树:
B+树特征:
B+数字的优点:
B+树和Mysql之间的关系:
聚集索引:
非收集索引:
MySQL索引类型:
总体而言,无论您是否收集,MySQL中的索引是B+树结构
MySQL功能摘要:
mysql问题:
4.播放器第2号:HBASEHBASE是一个高度可靠的,高性能的,列,面向列的,可扩展的分布式数据库。引用Google的Boogtable是用Java语言实现的。它也是Apache Software Foundation的Hadoop项目的一部分,该项目可以在HDFS文件系统中运行大量稀疏数据。
让我们谈谈LSM-Tree
LSM-Tree的全名是日志结构合并树。它是一个分层,有序和面向磁盘的数据结构。它的核心想法是充分使用它。磁盘批次写作的顺序远高于随机写作表现。
如图所示,LSM-TREE日志合并树
当我们的日志以这种格式编写时,所有它们都会在附加模型中添加,并且没有删除和修改。尽管这种结构极大地增强了编写数据的能力,但它基于阅读表现的牺牲部分作为阅读表现的牺牲部分。在成本上,索引的结构通常适合编写更多场景。因此,LSM旨在与传统的B+树或Isam相比,提供更好的写作操作和吞吐量。
HBase和LSM-Tree
HBase的一只手表具有多个区域分布在多个区域服务器,一个区域服务器有多个区域
每个区域都分为Memstore和Diskstore,实际上是LSM树
HBase的存储结构是键值
尽管HBase为外界提供了一张表,但实际上,在该地区,数据以KV的形式存在
第一级缓存:blockcache
第二级缓存:找到数据时,您将首先检查内存,检查磁盘,然后汇总返回
总之:
5.用户肖像存储选择将总结上述数据库:
mysql
HBase
mysql vs hbase
总结:
最终选定的解决方案是HBase。实际上,大数据的生态系统中有许多数据存储工具,例如Hive,ES等。在特定情况下,这些输出存储工具也是可取的。