当前位置:主页 > 财经 >

【深度解密】今日头条个性化资讯推荐技术(5)

发布时间: 2017-12-03 04:07 来源:网络整理

微软还发表了《A Multi-View Deep Learning Approach for Cross Domain User Modeling in Recommendation Systems》,文章提出了一种有趣的得到user vector的方法,这是一个典型的multi-view learning的方法。现在很多公司都不仅仅只有一个产品,而是有多个产品线。比如微软可能就有搜索、新闻、appstore、xbox等产品,如果将用户在这些产品上的行为(反馈)统一在一起训练一个深度学习网络,就能很好的解决单个产品上(用户)冷启动、稀疏等问题。具体网络结构如下,总体的优化目标是保证在所有视图上user和正向反馈的item的相似度大于随机选取的无反馈或者负向反馈的相似度,并且越大越好。用数学公式形式化出来是:

对应的神经网络结构如下图所示。

今日头条

作为国内当红的个性化推荐产品,今日头条技术经历了三个阶段:

1)早期以非个性化推荐为主,重点解决热文推荐和新文推荐,这个阶段对于用户和新闻的刻画粒度也比较粗,并没有大规模运用推荐算法。

2)中期以个性化推荐算法为主,主要基于协同过滤和内容推荐两种方式。协同过滤技术和前面介绍的大同小异,不再赘述。基于内容推荐的方式,则借助传统的NLP、word2vec和LDA对新闻有了更多的刻画,然后利用用户的正反馈(如点击,阅读时长、分享、收藏、评论等)和负反馈(如不感兴趣等)建立用户和新闻标签之间的联系,从而来进行统计建模。

3)当前以大规模实时机器学习算法为主,用到的特征达千亿级别,能做到分钟级更新模型。 架构分为两层(图来自头条架构师的分享):

检索层,有多个检索分支,拉出用户感兴趣的新闻候选;

打分层,基于用户特征、新闻特征、环境特征三大类特征使用实时学习进行建模打分。值得一提的是,实际排序时候并不完全按照模型打分排序,会有一些特定的业务逻辑综合在一起进行最终排序并吐给用户。

任何一种算法都有其局限性,业务要结合自己产品的特点,选择合适的算法解决特定的小问题,融合各种算法解决一个大问题。另外要设计合理的实验和放量机制,以在有限的影响内,最大程度地利用真实的用户行为来修正算法判定的结果。比如,可以先放5%的流量来试探用户对新闻的兴趣,并用模型进行建模;再用15%的流量来修正模型的效果,进行优胜劣汰;最后将真正置信的推荐结果推送到全量用户。

个性化资讯推荐的未来

个资讯消费是人的基本需求,个性化资讯推荐让我们能更好地消费资讯,享受生活的快乐。个性化资讯推荐还有很长的路要走,目前面世的产品仅仅迈出了第一步,看起来有模有样,实际上问题多多。例如被吐槽最多的一个问题:用户一天看了很多,但睡前闭目一想,记住的很少,对自己有用的更是凤毛麟角。这只是一个表象,背后其实暴露了很多现有推荐的问题。

要做好一个资讯推荐产品,不单单精准推荐技术需要演进,呈现形式、交互方式、产品形态、内容生态等等都需要去探索,最最重要的要想清楚以下几个本质问题:

1.人为什么需要阅读?

2.人为什么会消费资讯?

3.用户为什么需要到你这阅读资讯?

4.好的阅读体验到底是什么,如何量化?

5.产品推荐的基因是什么?

加油吧,个性化资讯推荐!

参考文献:

1. 桑赓陶,《 把握市场、产品和技术的动态匹配——韩国三星电子公司产品开发战略演变的基本原则及其对中国企业的启示》

2. Personalized Recommendation on Dynamic Content Using Predictive Bilinear Models[www, 2009]

3. Google News Personalization: Scalable Online Collaborative Filtering [www,2007]

4. [slideshare, 2016]

5. A Survey on Challenges and Methods in News Recommendation[WEBIST, 2014]

6. Personalized News Recommendation Based on Click Behavior[www, 2010]

7. A Contextual-Bandit Approach to Personalized News Article Recommendation[www, 2010]

8. Learning Deep Structured Semantic Models for Web Search using Clickthrough Data

9. A Multi-View Deep Learning Approach for Cross Domain User Modeling in Recommendation Systems [MS Research]

10.

11. https://zhuanlan.zhihu.com/p/21404922

12.

另:如何看待头条的成功?





搜索