北京中科聚网信息技术有限公司
大数据服务
AI人工智能服务
标准大数据服务
汽车大数据服务
融媒体大数据服务

今日头条的快速发展离不开其对数据源的以来,在资讯个性化推荐中,数据源可以分为文章资源和用户行为两个方面,

其一是文章资源。

文章资源除了自己去各大网站上爬下来各种信息资源,实现对全网内容的覆盖,新浪、凤凰、网易等头部网站内容非常重要。另外就是引入了头条号,引入大量UGC的内容,实现有效的文章资源生态圈,通过用户创作,并设定打赏模式,保证写手对内容的优化,从而获得一批深度的内容。

其二是用户行为。

  1. 用户行为狭义上是用户对文章的点击数据,通过对今日头条的功能分析,可以用到的用户行为如下:

  2. 用户曝光数据:用户曝光了的文章;

  3. 用户点击数据:用户点击了的文章;

  4. 用户不喜欢数据,用户可以选择特定的原因来解释用户为什么对这篇文章不感兴趣,例如:不感兴趣的理由有重复、内容质量差、来源、文章主题分布以及从标题中抽取出来的关键词。

  5.  用户搜索行为,在搜索行为中,添加了对用户感兴趣的话题的关心,在体验上貌似并未有效的产生作用,但是对于关键词的基础能力来看,极大的增强了标题内容的重要程度,但是也考虑到文章内容本身和关键词的关系上。

  6. 头条号订阅行为,头条号相关的文章下面,让用户选择订阅特定的头条号,形成有效的用户定向内容推送。

  7. 文章打赏行为,用户可以对特定文章付费。

  8. 用户收藏、评论和分享行为,让用户对特定文章进行收藏和评论。

  9. 用户登录行为。今日头条让用户登录新浪微博,从而或者用户在网站外部的信息。

  10. 其他行为:爆料、好友行为、话题内容等。


北京总部
  • 北京市海淀区大钟寺13号华杰大厦B座3层306-310室
  • 010-56181910
郑州子公司
  • 郑州市金水区紫荆山路5号
  • 0371-60921991
石家庄办事处
  • 石家庄市新华路294号盛安大厦5楼
  • 18633018987
Copyright 2011-2021 All Rights Reserved | 京ICP备13013562号

微信号

抖音号