首页 / 新媒体运营 / 今日头条文章、视频、图片、问答等内容算法推荐机制解读

今日头条文章、视频、图片、问答等内容算法推荐机制解读

一、推荐原理解析

头条推荐算法的本质:就是从一个巨大的内容池里给当前用户匹配出最感兴趣的一些文章。

内容池有几十万上百万的内容,包含文章、图片、小视频、问答等各种各样的题材,在给用户匹配内容的时候,主要依据三个要素:内容、用户以及用户对内容感兴趣的程度。

系统如何内容?

内容刻画

系统在做内容刻画的时候,主要会依托于关键词识别技术。系统会先提取文章中的关键词,然后根据关键词将内容进行粗分类,接下来根据细分领域的关键词对分类进行细化(细分领域细化分类)

内容刻画:比如关键词是罗纳尔多、足球、世界杯,大部分关键词都属于体育类词汇,就会先把文章分类到体育大类,然后根据具体的关键词细分到“足球”“国际足球”等二三级类目。

关键词提取原则

1、高频词规则

系统会提取文章中高频出现的词汇(某些词汇在标题和正文中出现的频次都非常高,系统会将这些高频词作为一篇文章的关键词备选)。

2、独特性原则

在大部分文章中经常出现的词,不会被认为是文章的关键词(虚词:的、地、得、而、对于、关于、吗等;转折词:虽然、但是、因为、所以、可是、然而等)。

三个小技巧

如何写文章才能让算法模型更好识别我们的关键词

1、避免使用非常规词(腿玩儿年、活见久、城会玩、DBQ、BHYS等)

2、人名地名用全称,不用缩写或外号

3、标题中露出具有代表性的实体词(名词、代词:人名地名公司名等)

4、我自己加一条,时效性社会热点(独立解读角度)

用户刻画

系统怎么理解我们用户?根据浏览历史、身份标签、环境特征、搜索内容等做成用户标签。

用户标签主要分为三大类:一是用户基本信息;二是行为信息;三是阅读兴趣。

系统是怎么精准的把内容推荐给兴趣用户的?

推荐算法的本质是利用文章的特征、用户喜好特征以及环境因素,拟合一个用户对内容满意度的函数,估算用户对每一篇文章的点击概率,然后从内容池里将所有的文章按照兴趣由高到低排序,前十名的文章会在此时脱颖而出,被推荐到用户的手机上进行展现。

二、一篇文章的推荐历程

创作者生产出一个内容,会经历以下几个步骤:

内容初审-<冷启动-<正常推荐-<复审(继续推荐/打压处理)

初审结束后系统会进行一些加权推荐,将这些篇文章首先推荐给几千名用户。这个环节头条称之为“冷启动”。冷启动完成后,系统对文章做正常推荐,在这个过程中,文章就会被展示出来。同时系统还在不断收集用户反馈(点击、评论甚至是举报)。基于这些行为信息,进而触发系统复审流程,会直接影响文章的后续推荐。

初审目的:判断文章是否违反相关法律法规的风险,算法模型会优先判断它的风险级别,然后根据风险级别分发给不同的审核人员进行处理(系统+人工)

冷启动:目的在于创造“火”的可能性,新文章在发布初期会提高分发权重(推荐给几千人),系统会根据相关数据设置推荐的时间段。在这个时间段内观察用户的这几千次点击、分享、点赞等,从而判断哪些人群会喜欢这篇文章,哪些人群绝对不会喜欢。完成“冷启动”系统会撤销文章的加权,后续这篇文章能不能火起来,就要靠这篇文章本身的创作实力了。

正常推荐:通过了冷启动阶段的文章,系统收集到最基础的推荐效果,如果一篇文章推荐效果很好,系统就会认为这篇文章是有潜质的,会进一步扩量推荐给更多的用户(1或10万);如果一篇文章的用户阅读兴趣不是特别大,系统会收紧推荐,继续观察文章的表现。在正常推荐的过程中,系统也会收集各种异常数据(如点击率特别高但负面评价和举报又特别多),这时文章就会再次进入审核流程。

复审:如发现标题党、封面党、低俗、虚假等问题,系统会停止文章推荐。(①、标题党:过度夸张、故意营造悬念、无中生有、歪曲事实、题文不符、低俗引导等;②、封面党&低俗:图不清晰或涉及低俗色情,存在恶意引导等情况;③、虚假:违背科学常理,描述未被证实或与已发生事实相悖的事件情节;④、包含推广信息:各种联系方式、黑五类、交友等)

三、推荐中的常见问题

相似的文章为什么别人的火了,我的没火?

文章消重策略:多篇相似的文章,系统优先推送其中的原创文章

怎么避免被消重?一是坚持原创;二是谨慎追逐热点;三是体现鲜明的个人特色

同类文章挤压:同样的热点内容,系统会从中选取一篇最适合的推送给用户

每一篇文章的推荐量既取决于当时具体的环境,也取决于当时整个内容池里面其他文章的表现,还有文章本身的质量。

如果一篇文章推荐效果不好,很有可能是以下几个原因导致的:

一创作内容质量不稳定(系统会对作者的创作能力进行评估,如果文章质量不稳定就会导致系统无法很好的评估作者的创作能力,进而影响文章的最终推荐效果);

二创作内容不够垂直(系统对作者的专业度进行评估,并优先推送专业度高的作者的文章,经常换创作领域则无法评估,推荐效果也就不好);

三创作的内容受众较少(小众领域文章目标人群是有限的);

四创作内容时效短(如体育赛事报道等)。

冷启动阶段文章会优先推荐给粉丝,粉丝数量质量以及对文章的喜好度都会影响推荐效果。

外部环境对文章的影响:如当前热点已过时,对应的受众就会减少。

四、如何获得更高的推荐

1、面向用户需求创作

写高质量文章,注重内容的价值。头条用户非常喜欢视角新颖、观点鲜明、有态度、有深度的文章;希望文章足够充实,能让用户学习到新的知识;坚持原创首发,平台对原创首发有一定的资源倾斜,在同类文章中可以获得更多的推荐量。

2、注重文章视觉体验

优化文章展现形式,从视觉上吸引用户的目光。首先确保标题和封面图对用户有足够吸引力,有一定代表性,可以表达文章的主要内容。其次是图文并茂、配图清晰。

本文来自网络,本站仅提供信息存储空间服务。文中观点不代表网推实训营立场,转载请注明出处:https://www.shixunying.com/2161.html
上一篇
下一篇

为您推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注

返回顶部