基于用户画像的推荐算法实现

随笔 2016-04-26

  接上文,现代社交网站常常需要根据用户身份和偏好向他们推荐相似用户,比如微博,并且这些数据常常数据量常常十分巨大,简单的协同过滤算法已经不能满足需求了,那么该如何应用mahout更好地解决呢?当然要根据场景和数据具体分析,同时Mahout中的算法十分丰富(查看),并且依托于hadoop,可以充分发挥云端的力量。这里只是抛砖引玉,尝试用组合推荐的方法进行用户社会化推荐。   首先来看看假定的数据构成:

  1.jpg

  具体情况下属性更多,量更大,并且需要结合用户偏好进行推荐,或者结合各种推荐方法进行加权变换等操作。

  因此计划组合FP Growth关联算法和slope-one推荐算法进行好友推荐。

  还是要进行数据清洗,将每个地名和职业进行编号,并且直接根据年龄进行推荐是不合理地,为了提高准确度,可以划分年龄段,11-20,代号为1,21-30为2,31-40为3,41-50为4,这样最终数据变为了:    1,3,2,2,11    2,2,2,1,5    3,1,3,8,4    4,3,2,7,3    5,6,4,7,8    6,1,1,6,9    7,9,2,3,6    8,11,2,4,3    9,11,2,2,9    10,3,3,3,10

  然后开始编写代码进行测试(代码之后补上)


本文由 Tony 创作,采用 知识共享署名 3.0,可自由转载、引用,但需署名作者且注明文章出处。

如果对您有用,您的支持将鼓励我继续创作!