当前位置:首页 » 操作系统 » 用户标签算法

用户标签算法

发布时间: 2022-11-27 04:45:22

❶ 用户画像的标签体系

一、为什么需要标签?

随着互联网的兴起,每天有大量的内容以视频等形式被生产并上传到各大平台,面对海量的内容,如何提升这些内容的智能分发效率是各大平台面临的重要课题。

而要实现这一目标,第一步就是更好地认识我们的用户。构建用户画像的过程的本质就是对用户信息进行标签化管理的过程。通过标签体系的建设,一方面让数据变得可阅读、易理解,方便业务使用;另一方面通过标签类目体系将标签组织排布,以一种适用性更好的组织方式来匹配未来变化的业务场景需求。如何合理规划标签体系对产品的运营影响非常大,因此,标签是产品策略中特别关键的一环。

二、标签是什么?

对于标签的定义在不同场景中往往是不同的,太纠结或执着于单一概念定义,会无法推进实际的业务和工作。我们所有的技术和业务层面的工作是为了业务目标,并且要实用和适用,并不是纯学术层面的研讨。

一般来说,我们认为标签是指 “利用原始数据,通过一定的加工逻辑产出,能够为业务所直接使用的可阅读、易理解、有业务价值的数据。”

标签体系有两种组织方式:结构化标签和半结构化/非结构化标签。

所谓结构化标签是按照某个分类法制定一个层次标签体系,其中上层的标签是下一层的父节点,在人群覆盖上是包含关系。一些面向品牌广告的受众定向往往采用这种结构化较强的标签体系。需要指出,这一体系中的标签是根据需求方的逻辑而制定,某些在媒体方意义很大的分类标签,如军事等,由于没有明确的需求对应,不宜出现在标签体系中。

另外一种兴趣标签的组织方式,是根据具体需求设置相应的标签,所有的标签并不能为同一个分类体系中所描述,也不存在明确的父子关系。这种半结构化或非结构化的标签体系往往包含一些比较精准的标签的集合,因而主要适用于多种目标,特别是效果目标并存的对内容精准投放的诉求。

选择结构化兴趣标签体系还是非结构化的兴趣标签体系更多地是基于业务场景的决策,当标签仅仅是投放系统需要的中间变量,作为CTR预测或者其他模块的变量输入时,那么结构化的标签体系其实是没有必要的,应该完全按照效果驱动的方式来规划或挖掘标签,而各个标签之间也不太需要层次关系的约束。

还有一种特殊的标签形式,关键词。直接按照搜索或浏览内容的关键词划分人群和投放广告,往往可以达到比较精准的效果。关键词这种标签体系是无层级关系、完全非结构化的,它虽然很容易理解,但并不太容易操作。不过由于搜索在互联网中的重要地位,选择和优化投放关键词这样一项专门技术已经发展得相当充分,因此这种标签也是实践中常用的。

三、如何构建标签体系?

1.确定对象

进行标签建设,首先要清楚对哪类对象建设标签,也就是确定对象。对象是客观世界中研究目标的抽象,有实体的对象,也有虚拟的对象。在企业经营过程中可以抽象出非常多的对象,这些对象在不同业务场景下交叉产生联系,是企业的重要资产,需要全面刻画了解。

经过对多个行业、多个标签体系建设经验的总结,可把对象分为 “人”“物”“关系”三大类 。三种对象是不一样的,“人”往往具有主动性和智慧,能主动参与社会活动,主动发挥推动作用,往往是关系的发出者。“物”往往是被动的,包括原料、设备、建筑物、简单操作的工具或功能集合等,是关系的接收者。当常规意义上的设备具有了充分的人工智能,变成了机器人,那么它就属于“人”这一类对象。“人”和“物”是实体类的对象,即看得到、摸得着的对象,而“关系”属于一种虚拟对象,是对两两实物实体间的联系的定义。因为关系很重要,企业大多数情况下反而是在对关系进行定义、反复发生、记录、分析、优化,因此需要“关系”这种对象存在,对关系进行属性描述和研究。关系按照产生的动因不同,又分为事实关系和归属关系,事实关系会产生可量化的事实度量,归属关系只是一种归属属性。

明确了对象的定义和分类,就可以根据业务的需要确定要对哪些对象建立标签体系。 基于内容的对象非常多,不可能对所有对象都建立独立的标签体系,一般我们会根据业务流量的需求,稿件数量的多少,类目的相似性,类目间的关系进行排名,确定标签的优先级和必要性。

2.设计框架

一般来说,互联网产品需要使用的标签类目数量非常庞大,当标签项超过一定数量时,业务人员要使用或查找标签就开始变得麻烦,管理标签也会变得困难。因此笔者借鉴了图书管理学中的经典方法:海量图书需要有专门的图书分类体系对书本进行编号并按照编号分柜排放,阅读者在查阅图书时只需要按编号索引即可快速找到自己所需图书,图书管理员也可以方便、有效地理清所有图书状况。

构建标签类目体系首先需要确定根目录。根目录就是上文提到的对象,因此有三大类根目录:人、物、关系。根目录就像树根一样直接确定这是一棵什么树。

如果根目录是人,即这个标签类目体系就是人的标签类目体系,每个根目录都有一个识别列来唯一识别具体对象。人这种大类下包括自然人和企业法人两种亚根,同时自然人群体或企业法人群体也可以认为属于人的对象范畴内,也是亚根。自然人实例可以有消费者、员工、加盟商等,因此可以形成消费者的标签类目体系、员工的标签类目体系、加盟商的标签类目体系。同样法人也可以细分为实体公司、营销公司、运输公司等。从最大的“人”根目录、到“自然人/法人/自然人群体/法人群体”亚根,再到实例“用户/员工/加盟商”,都属于根目录的范畴。

根据类似的方式,也可以将物细分为“物品”“物体”“物品集合”“物体集合”等亚类,各亚类下也可以细分根;关系也可以细分“关系记录”“关系集合”。

标签类目体系是对业务所需标签采用类目体系的方法进行设计、归属、分类。类目体系本身是对某一类目标物进行分类、架构组织,分类通常使用一级类目、二级类目、三级类目等作为分类名。

类目结构可以用树状结构来比拟,根上长出的第一级分支,称为一级类目;从第一级分支中长出的第二级分支,称为二级类目;从第二级分支中长出的第三级分支,称为三级类目。一般类目结构设为三级分层结构即可。没有下一级分类的类目叫叶类目,挂在叶类目上的具体叶子就是标签。

需要注意的是,类目框架的建设一般是基于业务展开的,因为类目体系存在的核心意义即为帮用户快速查找、管理数据/标签。

下图为某银行构建的客户标签类目体系,其中客户是根目录,会由custom_id来进行唯一识别,根目录下有“基本特征”“资产特征”“行为特征”“偏好特征”“价值特征”“风险特征”“营销特征”等一级类目。“基本特征”一级类目下又分“ID信息”“人口统计”“地址信息”“职业信息”等二级类目。“地址信息”二级类目下再细分为“账单地址”“家庭地址”“工作地址”“手机地址”等三级类目。“账单地址”三级类目下挂有“账单详细地址”“账单地址邮编”“账单地址所在省”等标签。

标签类目设计完成,整个标签体系的框架就有了,接下来要做的就是往每个叶类目下填充有业务价值并且可以加工出来的标签,进而完成整个标签体系的设计。

3.填充内容

通过标签类目设计,已经有了某类对象的标签体系框架,只是还没有具体的标签内容。标签设计就是设计合适的标签并将其挂载到标签类目。 在这一部分,笔者将尽量脱离技术视角,从产品视角出发,剖析如何“制作标签”。

首先,是如何拆解内容。对内容的拆解首先还是分为三个部分:“用户”“内容”“关系”,作为根目录。接下来,关于“人”这个部分,我们可以拆分为:人口属性、兴趣属性、行为偏好、发表时间等;同理,关于内容,我们可以拆分成“统计类”、“质量类”、“向量类”。接着,我们再对二级类目进行拆分,比如“统计类”中包含“点击率”“时长”“完播率”“转评赞”“跳出率”等。

要特别注意的是,往常习惯给别人打标签、贴标签的动作,其实不是在设计标签,而是在设计特征值。例如对某个人的定义“女、20~30岁、白领、活泼开朗”,分别是性别、年龄段、职业、性格标签的具体特征值。

这些特征会进行一定的交叉,赋予这个特征更多的含义。比如说使用用户画像和内容画像做交叉,可以得到用户的长短期的兴趣匹配、Session兴趣泛化匹配、用户年龄对于某些内容类别的偏好、用户性别对于某些内容类别的偏好等。如果拿用户特征与请求的上下文进行特征的交叉,则会得到用户常驻地在什么地方、用户的兴趣随时间的变化,比如有的用户会在早上看新闻,而在晚上看一些娱乐类的资讯;还有一些场景的刻画,如用户喜欢在地铁上看视频,而在办公的时候喜欢看图文。通过这些特征值组合,我们可以尽可能高效地对用户群进行划分,从而实现内容的精准分发。

现在,我们知道了如何建设标签体系以及如何通过标签体系对用户群进行划分,但想要做好标签,我们不仅要从需要解构技术,还要立足于“好的内容”。在这一部分,笔者将通过运营&创作者的视角简单分析如何制作“好的标签”。

要想制定能够打动人心的标签,首先要了解用户,切中他们的痛点。

如何才能了解用户?一种办法是角色转换,换位思考,把自己看作用户,而且是什么都不懂的“小白用户”,以这样的视角去看问题、去思考。

举个例子,你作为一个UP主,接了一份宣传“降噪耳机”的营销单,你的任务是让用户下单,完成内容的价值转化。思考一下,该怎么设计这个故事?

下面的一段参考文案:你在银行做经理,维护客户关系很艰难,你的职位不上不下。你有房贷和车贷,每月按揭五千元。你孩子的数学成绩不好。你老婆在市人民医院做护士,她母亲有尿毒症并透析多年,她不爱你。你年轻的时候觉得能成一番事业,但现在也就这样,朋友们混得都比你好。生活太糟了,你需要一个独立的环境抒发情绪,这时候你戴上了降噪耳机。

这就是一个典型的“用户视角”,它描述的是一个场景,它让你一边看一边产生强烈的代入感,不由自主受到内容的感染,产生情绪波动,在情绪的驱使下完成下单的行为,实现价值转化。

除了上面这种基于内容体验的打标方法,还有另一种方式,也就是我们之前提过的“特征值”,基于算法生成的高精度内容标签,一般是基于视频帧、标题、作者、内容属性、地理属性、时间等。这些由算法生成的内容标签可以替换人工标注,从而节省人力成本,提高内容标签生产效率。目前的内容标签技术,其精度已经达到了90%以上,通过算法对内容的分析自动生成一些标签值。

比如上面这个视频,所生成的标签值就可能是“中华田园犬”“农村”“百万播放”“狗”“华农兄弟”“萌宠”“动物”等。

经过对象确定、框架设计、类目设计、标签设计、打标这几个步骤,我们就完成了整个标签体系的建设,文章写得比较简单,全当抛砖引玉。

四、一些问题

在标签体系落地的过程中我们还会遇到很多问题,以下几个问题也是笔者一直在思考的。如果有任何好的建议可以加笔者微信一起交流:shmusk

内容的时效性: 任何一个内容,包括视频或者图文,是有生命周期在里面的,内容有长有短,其中预测一个内容的生命周期是一个挺难的事情,不论通过算法也好或者其它技术也好;假设我们已经知道内容的生命周期,如何在有效的周期内给予内容有效的曝光量,也是个很难的问题。如何Balance这两个问题,时效性是非常重要的,因为过了内容的生命周期,再给用户推荐,是没有意义的,用户体验会非常差。

内容质量的判定: 怎样判定一个内容质量到底是好还是坏,好的标准到底是什么,以及我们如何去建模,如果可以建模,特征是什么,以及我们的模型如何有效的利用特征去判别?

冷启动问题: 分为内容冷启动与用户冷启动。内容冷启动就是一个新内容进入平台,没有被分发出来;而用户冷启动就是一个新的用户,交互数据和行为非常的稀疏,如何做比较好的推荐、能够引导进行后续更加稠密的交互,增加粘性,以此来提升用户体验,更好的满足用户的需求?

❷ 07_推荐系统算法详解

     基于人口统计学的推荐与用户画像、基于内容的推荐、基于协同过滤的推荐。

1、基于人口统计学的推荐机制( Demographic-based Recommendation)是一种最易于实现的推荐方法,它只是简单的根据系统用户的基本信息发现用户的相关程度,然后将相似用户喜爱的其他物品推荐给当前用户。

2、对于没有明确含义的用户信息(比如登录时间、地域等上下文信息),可以通过聚类等手段,给用户打上分类标签。

3、对于特定标签的用户,又可以根据预设的规则(知识)或者模型,推荐出对应的物品。

4、用户信息标签化的过程一般又称为 用户画像 ( User Profiling)。

(1)用户画像( User Profile)就是企业通过收集与分析消费者社会属性、生活习惯、消费行为等主要信息的数据之后,完美地抽象出一个用户的商业全貌作是企业应用大数据技术的基本方式。

(2)用户画像为企业提供了足够的信息基础,能够帮助企业快速找到精准用户群体以及用户需求等更为广泛的反馈信息。

(3)作为大数据的根基,它完美地抽象出一个用户的信息全貌,为进一步精准、快速地分析用户行为习惯、消费习惯等重要信息,提供了足够的数据基础。

1、 Content- based Recommendations(CB)根据推荐物品或内容的元数据,发现物品的相关性,再基于用户过去的喜好记录,为用户推荐相似的物品。

2、通过抽取物品内在或者外在的特征值,实现相似度计算。比如一个电影,有导演、演员、用户标签UGC、用户评论、时长、风格等等,都可以算是特征。

3、将用户(user)个人信息的特征(基于喜好记录或是预设兴趣标签),和物品(item)的特征相匹配,就能得到用户对物品感兴趣的程度。在一些电影、音乐、图书的社交网站有很成功的应用,有些网站还请专业的人员对物品进行基因编码/打标签(PGC)。

4、 相似度计算:

5、对于物品的特征提取——打标签(tag)

        - 专家标签(PGC)

        - 用户自定义标签(UGC)

        - 降维分析数据,提取隐语义标签(LFM)

     对于文本信息的特征提取——关键词

        - 分词、语义处理和情感分析(NLP)

        - 潜在语义分析(LSA)

6、 基于内容推荐系统的高层次结构

7、 特征工程

(1)特征( feature):数据中抽取出来的对结果预测有用的信息。

         特征的个数就是数据的观测维度。

         特征工程是使用专业背景知识和技巧处理数据,使得特征能在机器学习算法上发挥更好的作用的过程。

         特征工程一般包括特征清洗(采样、清洗异常样本),特征处理和特征选择。

         特征按照不同的数据类型分类,有不同的特征处理方法:数值型、类别型、时间型、统计型。

(2)数值型特征处理

        用连续数值表示当前维度特征,通常会对数值型特征进行数学上的处理,主要的做法是归一化和离散化。

        * 幅度调整归一化:

            特征与特征之间应该是平等的,区别应该体现在 特征内部 。

            例如房屋价格和住房面积的幅度是不同的,房屋价格可能在3000000~15000000(万)之间,而住房面积在40-300(平方米)之间,那么明明是平等的两个特征,输入到相同的模型中后由于本身的幅值不同导致产生的效果不同,这是不合理的

                        

        * 数值型特征处理——离散化

        离散化的两种方式:等步长——简单但不一定有效;等频——min -> 25% -> 75% -> max

        两种方法对比:

            等频的离散化方法很精准,但需要每次都对数据分布进行一遍从新计算,因为昨天用户在淘宝上买东西的价格分布和今天不一定相同,因此昨天做等频的切分点可能并不适用,而线上最需要避免的就是不固定,需要现场计算,所以昨天训练出的模型今天不一定能使用。

            等频不固定,但很精准,等步长是固定的,非常简单,因此两者在工业上都有应用。

(3) 类别型特征处理

        类别型数据本身没有大小关系,需要将它们编码为数字,但它们之间不能有预先设定的大小关系,因此既要做到公平,又要区分开它们,那么直接开辟多个空间。

        One-Hot编码/哑变量:One-Hot编码/哑变量所做的就是将类别型数据平行地展开,也就是说,经过One-Hot编码哑变量后,这个特征的空间会膨胀。

(4) 时间型特征处理

        时间型特征既可以做连续值,又可以看做离散值。

        连续值:持续时间(网页浏览时长);间隔时间(上一次购买/点击离现在的时间间隔)。

        离散值:一天中哪个时间段;一周中的星期几;一年中哪个月/星期;工作日/周末。

(5) 统计型特征处理

        加减平均:商品价格高于平均价格多少,用户在某个品类下消费超过多少。

        分位线:商品属于售出商品价格的分位线处。

        次序性:商品处于热门商品第几位。

        比例类:电商中商品的好/中/差评比例。

8、 推荐系统常见反馈数据 :

9、 基于UGC的推荐

     用户用标签来描述对物品的看法,所以用户生成标签(UGC)是联系用户和物品的纽带,也是反应用户兴趣的重要数据源。

    一个用户标签行为的数据集一般由一个三元组(用户,物品,标签)的集合表示,其中一条记录(u,i,b)表示用户u给物品打上了标签b。

    一个最简单的算法:

        - 统计每个用户最常用的标签

        - 对于每个标签,统计被打过这个标签次数最多的物品

        - 对于一个用户,首先找到他常用的标签,然后找到具有这些标签的最热门的物品,推荐给他

        - 所以用户u对物品i的兴趣公式为 ,其中 使用户u打过标签b的次数, 是物品i被打过标签b的次数。

    简单算法中直接将用户打出标签的次数和物品得到的标签次数相乘,可以简单地表现出用户对物品某个特征的兴趣。

    这种方法倾向于给热门标签(谁都会给的标签,如“大片”、“搞笑”等)、热门物品(打标签人数最多)比较大的权重,如果一个热门物品同时对应着热门标签,那它就会“霸榜”,推荐的个性化、新颖度就会降低。

    类似的问题,出现在新闻内容的关键字提取中。比如以下新闻中,哪个关键字应该获得更高的权重?

10、 TF-IDF:词频逆文档频率 ( Term Frequency- -Inverse Document Frequency,TF-DF)是一种用于资讯检索与文本挖掘的常用加权技术。

        TFDF是一种统计方法,用以评估一个字词对于一个文件集或一个语料库中的其中份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。

                    TFIDF=TF IDF

         TF-IDF的主要思想是 :如果某个词或短语在一篇文章中出现的频率TF高,并且在其他文章中很少出现,则认为此词或者短语具有很好的类别区分能力,适合用来分类。

        TF-DF加权的各种形式常被搜索引擎应用,作为文件与用户查询之间相关程度的度量或评级。

         词频( Term Frequency,TF) :指的是某一个给定的词语在该文件中出现的频率。这个数字是对词数的归一化,以防止偏向更长的文件。(同一个词语在长文件里可能会比短文件有更高的词数,而不管该词语重要与否。) ,其中 表示词语 i 在文档 j 中出现的频率, 表示 i 在 j 中出现的次数, 表示文档 j 的总词数。

         逆向文件频率( Inverse Document Frequency,IDF) :是一个词语普遍重要性的度量,某一特定词语的IDF,可以由总文档数目除以包含该词语之文档的数目,再将得到的商取对数得到 ,其中 表示词语 i 在文档集中的逆文档频率,N表示文档集中的文档总数, 表示文档集中包含了词语 i 的文档数。

(11) TF-IDF对基于UGC推荐的改进 : ,为了避免热门标签和热门物品获得更多的权重,我们需要对“热门进行惩罚。

          借鉴TF-IDF的思想,以一个物品的所有标签作为“文档”,标签作为“词语”,从而计算标签的“词频”(在物品所有标签中的频率)和“逆文档频率”(在其它物品标签中普遍出现的频率)。

           由于“物品i的所有标签” 应该对标签权重没有影响,而 “所有标签总数” N 对于所有标签是一定的,所以这两项可以略去。在简单算法的基础上,直接加入对热门标签和热门物品的惩罚项: ,其中, 记录了标签 b 被多少个不同的用户使用过, 记录了物品 i 被多少个不同的用户打过标签。

(一)协同过滤(Collaborative Filtering, CF)

1、基于协同过滤(CF)的推荐:基于内容( Content based,CB)主要利用的是用户评价过的物品的内容特征,而CF方法还可以利用其他用户评分过的物品内容。

    CF可以解决CB的一些局限:

         - 物品内容不完全或者难以获得时,依然可以通过其他用户的反馈给出推荐。

        - CF基于用户之间对物品的评价质量,避免了CB仅依赖内容可能造成的对物品质量判断的干。

        - CF推荐不受内容限制,只要其他类似用户给出了对不同物品的兴趣,CF就可以给用户推荐出内容差异很大的物品(但有某种内在联系)

    分为两类:基于近邻和基于模型。

2、基于近邻的推荐系统:根据的是相同“口碑”准则。是否应该给Cary推荐《泰坦尼克号》?

(二)基于近邻的协同过滤

1、 基于用户(User-CF): 基于用户的协同过滤推荐的基本原理是,根据所有用户对物品的偏好,发现与当前用户口味和偏好相似的“邻居”用户群,并推荐近邻所偏好的物品。

     在一般的应用中是采用计算“K-近邻”的算法;基于这K个邻居的历史偏好信息,为当前用户进行推荐。

    User-CF和基于人口统计学的推荐机制:

        - 两者都是计算用户的相似度,并基于相似的“邻居”用户群计算推荐。

        - 它们所不同的是如何计算用户的相似度:基于人口统计学的机制只考虑用户本身的特征,而基于用户的协同过滤机制可是在用户的历史偏好的数据上计算用户的相似度,它的基本假设是,喜欢类似物品的用户可能有相同或者相似的口味和偏好。

2、基于物品(Item-CF):基于项目的协同过滤推荐的基本原理与基于用户的类似,只是使用所有用户对物品的偏好,发现物品和物品之间的相似度,然后根据用户的历史偏好信息,将类似的物品推荐给用户。

    Item-CF和基于内容(CB)的推荐

       - 其实都是基于物品相似度预测推荐,只是相似度计算的方法不一样,前者是从用户历史的偏好推断,而后者是基于物品本身的属性特征信息。

   同样是协同过滤,在基于用户和基于项目两个策略中应该如何选择呢?

        - 电商、电影、音乐网站,用户数量远大于物品数量。

        - 新闻网站,物品(新闻文本)数量可能大于用户数量。

3、 User-CF和Item-CF的比较

     同样是协同过滤,在User-CF和ltem-CF两个策略中应该如何选择呢?

     Item-CF应用场景

       -  基于物品的协同过滤( Item-CF ) 推荐机制是 Amazon在基于用户的机制上改良的一种策略因为在大部分的Web站点中,物品的个数是远远小于用户的数量的,而且物品的个数和相似度相对比较稳定,同时基于物品的机制比基于用户的实时性更好一些,所以 Item-CF 成为了目前推荐策略的主流。

     User-CF应用场景

        - 设想一下在一些新闻推荐系统中,也许物品一一也就是新闻的个数可能大于用户的个数,而且新闻的更新程度也有很快,所以它的相似度依然不稳定,这时用 User-cf可能效果更好。

    所以,推荐策略的选择其实和具体的应用场景有很大的关系。

4、 基于协同过滤的推荐优缺点

 (1)基于协同过滤的推荐机制的优点:

        它不需要对物品或者用户进行严格的建模,而且不要求对物品特征的描述是机器可理解的,所以这种方法也是领域无关的。

       这种方法计算出来的推荐是开放的,可以共用他人的经验,很好的支持用户发现潜在的兴趣偏好。

(2)存在的问题

        方法的核心是基于历史数据,所以对新物品和新用户都有“冷启动”的问题。

        推荐的效果依赖于用户历史好数据的多少和准确性。

        在大部分的实现中,用户历史偏好是用稀疏矩阵进行存储的,而稀疏矩阵上的计算有些明显的问题,包括可能少部分人的错误偏好会对推荐的准确度有很大的影响等等。

        对于一些特殊品味的用户不能给予很好的推荐。

(三)基于模型的协同过滤

1、基本思想

(1)用户具有一定的特征,决定着他的偏好选择

(2)物品具有一定的特征,影响着用户需是否选择它。

(3)用户之所以选择某一个商品,是因为用户特征与物品特征相互匹配。

    基于这种思想,模型的建立相当于从行为数据中提取特征,给用户和物品同时打上“标签”;这和基于人口统计学的用户标签、基于内容方法的物品标签本质是一样的,都是特征的提取和匹配。

    有显性特征时(比如用户标签、物品分类标签)我们可以直接匹配做出推荐;没有时,可以根据已有的偏好数据,去发据出隐藏的特征,这需要用到隐语义模型(LFM)。

2、基于模型的协同过滤推荐,就是基于样本的用户偏好信息,训练一个推荐模型,然后根据实时的用户喜好的信息进行预测新物品的得分,计算推荐

    基于近邻的推荐和基于模型的推荐

        - 基于近邻的推荐是在预测时直接使用已有的用户偏好数据,通过近邻数据来预测对新物品的偏好(类似分类)

        - 而基于模型的方法,是要使用这些偏好数据来训练模型,找到内在规律,再用模型来做预测(类似回归)

    训练模型时,可以基于标签内容来提取物品特征,也可以让模型去发据物品的潜在特征;这样的模型被称为 隐语义模型 ( Latent Factor Model,LFM)。

(1)隐语义模型(LFM):用隐语义模型来进行协同过滤的目标:

            - 揭示隐藏的特征,这些特征能够解释为什么给出对应的预测评分

            - 这类特征可能是无法直接用语言解释描述的,事实上我们并不需要知道,类似“玄学”

        通过矩阵分解进行降维分析

            - 协同过滤算法非常依赖历史数据,而一般的推荐系统中,偏好数据又往往是稀疏的;这就需要对原始数据做降维处理。

            - 分解之后的矩阵,就代表了用户和物品的隐藏特征

        隐语义模型的实例:基于概率的隐语义分析(pLSA)、隐式迪利克雷分布模型(LDA)、矩阵因子分解模型(基于奇异值分解的模型,SVD)

(2)LFM降维方法——矩阵因子分解

(3)LFM的进一步理解

    我们可以认为,用户之所以给电影打出这样的分数,是有内在原因的,我们可以挖掘出影响用户打分的隐藏因素,进而根据未评分电影与这些隐藏因素的关联度,决定此未评分电影的预测评分。

    应该有一些隐藏的因素,影响用户的打分,比如电影:演员、题材、年代…甚至不定是人直接可以理解的隐藏因子。

    找到隐藏因子,可以对user和Iiem进行关联(找到是由于什么使得user喜欢/不喜欢此Item,什么会决定user喜欢/不喜欢此item),就可以推测用户是否会喜欢某一部未看过的电影。

(4)矩阵因子分解

(5)模型的求解——损失函数

(6)模型的求解算法——ALS

    现在,矩阵因子分解的问题已经转化成了一个标准的优化问题,需要求解P、Q,使目标损失函数取最小值。

    最小化过程的求解,一般采用随机梯度下降算法或者交替最小二乘法来实现交替最小二乘法( Alternating Least Squares,ALS)

    ALS的思想是,由于两个矩阵P和Q都未知,且通过矩阵乘法耦合在一起,为了使它们解耦,可以先固定Q,把P当作变量,通过损失函数最小化求出P,这就是一个经典的最小二乘问题;再反过来固定求得的P,把Q当作变量,求解出Q:如此交替执行,直到误差满足阅值条件,或者到达迭代上限。

(7)梯度下降算法

❸ 抖音的算法2021-11-07

视频上热门的底层逻辑--抖音的算法

创作者和用户直接连接,中间的抖音不予干涉,完全由算法决定,这种算法完全取决于你视频的质量。

1 流量池算法 :500流量开始拼数据,好的进入下一个3000的流量池,在继续拼数据好的再进入下一个10000的流量池。同样的逻辑继续进入十万流量池,百万流量池,千万流量池,热门流量池。

具体拼那些数据呢? 播放时长 + 完播率+转粉率+评论率+转粉率+先赞率 , 播放时长 起着最金额UI的那个的因素。如果播放都没有完成,那其他的指标几乎没用。

2 标签算法 :标签存在与抖音账号上的,你自己的各种维度抖音算后给你打标。你的视频是那些标签呢?来源于用户的观看, 它会自动根据算法推送给你同类标签的人。

3 实时算法 :不同的时间地点环境下的视频。

1 热门算法 :当下的热门事件分发给每个人,比如所西安的奔驰女时间,河南发洪水等等。不管你是什么标签,全网推送人人都能看到。

2 协同算法 :两个标签类似的账号的互相影响的算法,比如所,A和B都是钓鱼的大叔,A刷到一个东北大妈美食账号,有了停留时长并关注,那抖音也会推荐给B。这是破除信息茧房最有效的办法。

3 战略算法 :这是平台不同的时期根据其战略目标的算法。当平台需要增减用户和停留时长时,就会自动给你推送流量。比如说2020年,平台扶持影视号,就会给影视号推送大量的流量,就成就了很多的影视大号。所以看清楚平台的近期战略,就可以事半功倍。现在平台战略是什么?你想想?

1 按照目前的算法,不可能客户,就是通过付费买来用户的浏览,付费只能让用户刷到你的视频,具体看多久,是否点赞,是否转发关注,完全取决于你的内容和用户标签

2 付费算法的额前提是-- 内容优质+人群精准

❹ 用户画像:标签化就是数据的抽象能力 | 产品运营与数字游戏

<<<前言>>>
跟数据打交道已经上十年了,在管理业务、产品运营、风险识别、数据产品等方面有过一些实践经验,爱总结的逻辑Go决定把日常的文本总结短文化,整理成体系,欢迎拍砖,更欢迎一起研讨:

系列一:风险与数据的逻辑

系列二:业务管理背后的数据故事

系列三:产品运营与数字游戏

系列四:如何打造数据产品

文 | 爱总结的逻辑Go

阅 | 完整阅读需要8分钟

议 | [email protected]

都说进入中国人口红利已经在消失,我们已经进入到互联网的下半场。在上半场,流量爆发助长了互联网公司的快速发展,你甚至不需要知道网络另一端是个什么样的人;下半场,互联网公司已经不新鲜了,大部分公司已经互联网化,每个消费者都正在被数字化,标签化~~

这两年引领下半场发展的是那些在讲“大数据”“赋能”的企业,有数据有用户的企业。

通过大数据告诉政府该如何智慧地管理交通,规划地铁站,做城市发展规划。

通过消费数据分析,告诉企业该在什么时间生产什么产品,以最大化地满足用户的需求。

通过生活大数据告诉我们餐饮企业,甚至房地产企业该如何选址。

如果说互联网的上半场是粗旷运营,因为有流量红利不需要考虑细节。那么下半场, 精细化运营将是长久的主题 。有数据,有数据分析能力才能让用户得到更好的体验。

所以,用户是根本,也是数据分析的出发点。产品设计用户在线的交互方式,也是数据生产的方式。

<<<用户画像的准则>>>

假如你受雇一家卖羊肉串的公司,老板担心现在竞争越来越激烈了,要想做好得知道顾客喜欢什么。于是上班第一天,老板问你:“你能不能分析一下用户数据,给咱们公司的羊肉串业务赋能啊?”

“老板啊, 咱们卖羊肉串的,做数据挖掘没用啊。“ 估计老板听后,晚上就把你开了!

那应该怎么做呢?

首先就是将自己企业的用户画像做个白描,分析用户“都是谁”“从哪来”“要去哪”。

换一种回答:“老板,您需要的是用户画像,画像建模是个系统的工程,我们需要解决三个问题。第一呢,就是用户从哪里来,这里我们 需要统一标识用户ID ,方便我们对用户后续行为进行追踪。我们要了解这些羊肉串的用户从哪里来,他们是为了聚餐,还是自己吃宵夜,这些场景我们都要做统计分析。第二呢,这些用户是谁?我们需要对这些 用户进行标签化 ,方便我们对用户行为进行理解。第三呢,就是用户要到哪里去?我们要将这些 用户画像与我们的业务相关联,提升我们的转化率,或者降低我们的流失率 。”

相信你的老板听到这里,一定会给你竖起大拇指,说:“不错,需要什么资源,随时找我就行。”

就像上图手绘的内容,我们再做一个梳理:

首先,为什么要设计唯一标识?

用户唯一标识是整个用户画像的核心 。一个APP,把“从用户开始使用APP到下单到售后整个所有的用户行为”进行串联,这样就可以更好地去跟踪和分析一个用户的特征。

设计唯一标识可以是:用户编码、用户名、注册手机号、邮箱、设备号、CookieID等。

其次,给用户打标签。

标签并不是越多越好,不同的产品,标签的选择范围也不同,如果以电商企业为例,可以区分四个维度进行标签划分,进行“ 用户消费行为分析 ”:

1、 用户标签 :它包括了性别、年龄、地域、收入、学历、职业等,这些包括了用户的基础属性。

2、 消费标签 :消费习惯、购买意向、是否对促销敏感。这些统计分析用户的消费习惯,有利于了解用户消费偏好,针对性地推荐商品。

3、 行为标签 :时间段、频次、时长、访问路径。这些是通过分析用户行为,来得到他们使用APP的习惯。

4、 内容分析 :对用户平时浏览的内容,尤其是停留时间长、浏览次数多的内容进行分析,分析出用户对哪些内容感兴趣,比如,金融、娱乐、教育、体育、时尚、科技等。

<<<标签体系的建立>>>

用户画像是现实世界中的用户数学建模 ,我们正是将海量数据进行 标签化 ,来得到精准的用户画像,从而为用户经营更精准地解决问题。

想想,当你有了用户画像,可以为用户经营带来什么业务价值呢?

可以从用户生命周期的三个阶段来划分画像价值: 获客、粘客、留客

1、 获客 :如何进行拉新,通过更精准的营销获取客户。

2、 粘客 :个性化推荐,搜索排序,场景运营等。

3、 留客 :流失率预测,分析关键节点降低流失率。

如果按照数据流处理的阶段来划分用户画像建模的过程,可以分为 数据层、算法层和业务层 。你会发现在不同的层,都需要打上不同的标签。

数据层指的是用户消费行为里的标签。也是“ 事实标签 ”,作为数据客观的记录。

算法层指的是透过这些行为算出的用户建模。可以打上“ 模型标签 ”,作为用户画像的分类标识。

业务层指的是获客、粘客、留客的手段。可以打上“ 预测标签” ,作为业务关联的结果。

标签化的流程,就是通过数据层的“事实标签”,在算法层进行计算,打上“模型标签”的分类结果,最后指导业务层,得出“预测标签”。

随着现在用户交互的海量增长,数据的体量也在不断扩大,“事实标签”基于数据层做记录和管理,也需要根据数据粒度和应用场景做分层:

1、 明细层 数据:以“日”为数据粒度,直接从各个业务数据表、日志数据表、埋点数据表抽取用户每天的每一次行为,按固定表结构插入相关表中,在此过程中不对数据做任何汇总、统计类的处理。可视为数据仓库中ODS层数据。

2、 统计中间层 数据:以“用户”为数据粒度,对明细层的全量历史数据进行统计加工、汇总计算,可视为数据仓库中DW层数据。

3、 应用层 数据:以“用户”为数据粒度,对统计中间层数据做进一步挖掘处理,处理过程中要考虑业务应用场景,关联行为权重、标签权重等。应用层数据输出后可支持产品应用。应用层数据可视为数据仓库中DM层数据。

开发出的用户画像相关宽表及明细标签表,按应用场景一般分为用户人口属性画像、用户个性化标签、各业务线用户画像、用户偏好画像和用户群体属性画像等。现在各数据公司高度重视的关系网络图谱,也是基于此基础上建立风险库关系网络、欺诈度关系网络以及高价值关系网络、高成长性群体网络等。

<<<用户标签化的应用>>>

当有了“用户消费行为分析”的标签之后,就可以更好地理解业务了。

比如一个经常购买沙拉的人,一般很少吃夜宵;同样,一个经常吃夜宵的人,吃小龙虾的概率可能远高于其他人。这些结果都是通过数据挖掘中的关联分析得出的。

有了这些数据,就可以 预测用户的行为

比如,一个用户购买了“月子餐”后,购买婴儿用品的概率也会增大。

具体在业务层上,可以基于标签产生哪些业务价值呢?

1、在 获客 上,可以找到优势的宣传渠道,如何通过个性化的宣传手段,吸引有潜力需求的用户,并刺激其转化。

2、在 粘客 上,如何提升用户的单价和消费频次,方法可以包括购买后的个性化推荐、针对优质用户进行优质高价商品的推荐、以及重复购买,比如通过红包、优惠等方式激励对优惠敏感的人群,提升购买频次。

3、在 留客 上,预测用户是否可能会从平台上流失。在营销领域,关于用户留存有一个观点——如果将客户流失率降低5%,公司利润将提升25%-85%。可以看出留存率是多么的重要。用户流失可能会包括多种情况,比如用户体验、竞争对手、需求变化等,通过预测用户的流失率可以大幅降低用户留存的运营成本。

<<<抽象思维的重要性>>>

锻炼自己的 抽象能力,将繁杂的事务简单化

上面讲了很多一般情况考虑的,也不能忽略特殊情况,用户行为也会随着营销的节奏产生异常值。比如双十一,激增的大量订单,要考虑异常值的处理。

总之,数据量是庞大的,会存在各种各样的使用情况,光是分析EB级别的大数据,就要花很长的时间。

但最终目的不是处理这些数据,而是理解、使用这些数据挖掘的结果。对数据的标签化能让我们快速理解一个用户,一个商品,乃至一个爆款文案内容的特征,从而方便理解和使用数据。

用户画像最终的目的是了解产品用户是谁?是怎样的?有什么共性的特征?他们需要什么? 产品的潜在用户在哪里?

带着问题,进行抽象化的提炼,通过标签组合算法的运用和挖掘,在互联网下半场后流量时代是至关重要的。

今天就用户画像标签化的话题先讲到这里吧,这几天在忙着整理课件,把数据运营的方法体系进行梳理,归纳总结应用到产品价值提升上,是件很有意思的事情。 从十年前的Deck Data讲起,到今天全生命周期数据化的演变升级,会有很多可以分享的故事点~~

❺ 那些可以用做用户的特征标识

您好,一般来说,用户的特征标识就是指用户标签。设置用户标签的角度有很多,可以按照用户的基本属性,用户兴趣爱好等条件设置标签。为了方便洞察移动互联网用户的特征,个推独创了冷、热、温数据维度,您可以了解一下。

1、冷数据标签,如用户基本属性。这类标签改变的概率小,如性别、年龄层次、兴趣、常驻地、职业、消费水平等相对稳定的用户属性特征。

2、温数据标签,是具有一定时效性的特征,比如用户近期活跃的应用和场景。

3、热数据标签,是指当前区域、使用应用等场景化明显的,稍纵即逝的营销机会,比如用户当下的场景。

用户特征标识

❻ 用户画像标签体系流程介绍

企业搭建用户标签体系可以选择自建或使用第三方用户标签体系。企业自建用户画像标签体系的过程可以拆解为4步:

①梳理数据

数据是用户画像的基因。我们需要提前列出画像标签列表,根据标签列表确认所需数据维度。数据可能来源于自有数据或第三方外部数据。

②标签完善

由于APP自有数据有限,在构建全面、多维的用户画像标签体系时,需要来自第三方的数据源作为补充。可以选择个推这样的第三方数据智能服务商,使用个推的用户运营产品进行标签完善,建立更加完整的用户画像,满足对用户进行全面洞察的需求。

③数据进行清洗、治理,将自有数据和第三方数据进行关联,并将原始数据进行特征化,为每个用户创建标签。

④画像创建

通过聚类分析找到用户共性特征,生成用户画像。在实际使用过程中,可随着数据的积累(比如核心用户画像发生变化)或者运营经验的发展(在运营过程中得到对用户画像的正反馈)对算法模型进行迭代调整。


以上是用户画像构建全流程,工作量非常庞大。企业可以直接选择个推·用户运营这样的第三方用户画像工具。个推·用户运营SDK支持结合APP自有数据和个推海量数据,全面洞察目标用户,助力APP构建完整立体的用户画像,同时提供标签管理平台及行业标签模板库,让用户洞察更深入、更便捷,做到毫秒级输出标签,帮助完善各领域用户画像,满足APP在不同场景下对用户画像的特定需求。个推·用户运营现在限时免费中,注册/登录个推开发者中心,即可免费开通。

用户运营

❼ 抖音快速给账号打标签的方法

作为创作者,只需要根据底层逻辑,去创作算法喜欢的内容,就能得到更多用户的喜欢。

对于一个新账号来说,想要快速给账号打上标签,可以试一下这种方法: 内容垂直到极致。

如果对自媒体有一些基础了解的话,就会知道,平台更喜欢垂直类账号,比如只发娱乐领域、体育领域、影视领域等某一具体领域内容的账号。

可是对于一个新号来说,这时候账号是没有标签的,而且 视频播放量很大程度取决于初始流量池的精准程度 ,我们能做的,就是让自己的视频,找到更精准的用户。

根据算法的底层逻辑,用户有一系列兴趣标签,内容有一系列相关标签,算法要做的,是把内容和用户进行匹配。

比如说 X用户 有A、2 、3三种兴趣,而我们的 Y内容 有A、B、C三个标签,那么算法就会根据A标签,把我们的 Y内容 匹配给 X用户 。

可是,X用户对A、2 、3的兴趣权重是不一样的,比如A兴趣可能就占了50%,而我们的内容标签权重也是不一样的,可能A标签只占到10%。

举个具体的例子。

X用户是一名大学生,他喜欢内容标签,50%的考公,30%的音乐,20%的影视。

而我们的Y内容,70%的生活,20%的工作,10%的考公。

系统会根据X用户和Y内容都有【考公】这个标签去进行匹配,但是如果此时X用户恰好想要放松一下,或者我们恰好发的是生活内容,播放量就不会太好。

根据标签匹配的规律,我们想要初始获得更高的播放量,就需要让自己账号主要标签占比足够高,这样系统给我们账号的标签会更准确,推荐用户也会更准确。

比如影视领域,内容太宽泛,喜欢A作品的人不一定喜欢B作品,如果一个新号一开始就什么都发,那可能很难匹配到足够精准的用户,也就会一直在初级流量池。

所以想要快速打标签,最好的方法,是在初期只发同一部作品的内容,这样系统就会逐渐为我们的内容匹配精准用户,等到粉丝数多起来之后,再去发其他作品的内容。

我上周用这种方法测试了3个新抖音账号,第一个视频全是个位数播放,到第三个视频,基本播放量就可以达到2000+,并且保持稳定。

其中一个账号测试过在中间发布同领域不同作品的内容,播放量是个位数,换回原来内容之后,播放量又开始回归4位数。

其实一开始是打算发10个同一作品的视频,然后用豆荚投对标账号直接拉标签的,结果没想到字节的算法已经这么成熟了,倒是省下了不少钱~

账号目前播放量比较稳定,但是还没有爆款,这一周会尝试加入一些梗和趣味点,引发用户吐槽或共鸣,引导用户参与互动,增加用户的停留时间。

希望本文能够给你做抖音一些启发。

❽ 给1个用户打上200万个标签,7分钟搞懂信息流广告

信息流广告其实离我们并不远,我们先看一个场景:

某一天,为了打一瓶酱油,你走进了超市。然后……

结账的时候,推车里也许有酱油,可能还有包纸尿片,或者其他商品。

请别动辄将这个场景和大数据最常用的“啤酒+尿片”案例混为一谈,因为这个场景,在我们每一个人身上都发生过。

文/张书乐

TMT行业观察者、游戏产业时评人,人民网、人民邮电报专栏作者

换位思考下,把超市看成是内容平台,我们跳过各色信息走向需要的内容(酱油)时,可能会途经尿片这个内容区,然后突然想到,孩子尿片快断货了……

两者之间没有必然联系,而在传统商超里,实现这样的“增值”消费的方式往往就是根据销售量的情况合理搭配货架的摆放方式。

比如将爆款放在靠里一点的位置,让客人途经更多的商品区;比如下楼电梯在另一边;比如买赠或买促活动混搭……

这是传统商业模式下的考量,而在互联网内容分发之上,我们可以把所有的内容都当做是“广告”,而你绝不能让用户绕远路来偶遇他可能会买的东西。

而且,内容分发状态下,用户对内容的需求不断进行选择,后台算法会更加精准,绕远路更加不现实。大家来看内容的目的,本身也是越快获取到自己所需求的为好。

这时候,我们会发现一个有趣的状况,即在信息爆炸的互联网之上,用户信息获取方式变成了两种状态:

一是最为传统的搜索模式,用户带着目的去网络上寻找某类信息,即打酱油。但有个问题,很多人并不是时时刻刻都有打酱油的明确想法。

二是盲目遇上信息流,即超市货架,结果自己模糊的需求变成了购买。这已经成为时下的一个主流,即网络信息流广告的诉求点。

网络搜索公司总裁向海龙对此有过一个很精辟的论述,即“用户不仅需要更便捷智能的找到信息,也需要个性化针对性的信息主动推荐”。

从“人找信息”,升级到“信息找人”,说起来就这么简单。做呢,一点都不简单。

广告也能读懂你的心

随着网络百家号、今日头条等内容分发平台的崛起,信息流广告也有了更多承载平台,不再只是过去类似网络搜索或淘宝购物时,在侧边栏出现的和你搜索项或之前浏览项有关的商品广告。

网络、微博、微信和今日头条都推出了信息流广告,可这个广告类型,到底有多强?

数据说话更能说明问题。2014年,信息流广告在美国已达54亿美元,facebook和推特的广告收入中分别有超过50%和70%来自于此。而在中国却只有区区60亿元,而2017年,预计将增长480%,达到340亿元。

但预计的增长,并不代表在内容分发中简单植入相关广告就能完成目标。

信息流广告要做的不是简单根据你的内容喜好而提供相关商品,比如看汽车,送车品广告。

其实,这还算好的。更多的时候,我们在买了车之后,往往还会看车子的介绍,而随后而来的信息流广告尽管很精准,但往往可能是一款车。

啥感觉,和网络搜索推广差不多,而且网络搜索推广现在走的更远。

举个例子:

一家名为土巴兔的家装O2O公司,是网络推广的常客,在很多人看来,业绩好有一部分原因是搜索引擎优化的好,广告营销做得好。土巴兔通过在网络投放广告,用最少的广告费获取了最大的广告收益。

而且推广付费是一个引子,而在网络进行搜索过程中,网络的生态体系中大量的内容呈现,如问答、新闻和用户体验,乃至论坛等信息里的口碑,都会形成强有力叠加,最终变成巨大流量,这些流量都在会帮助广告主的营销推广走得更远。

说这个案例并非要说如何做搜索,而是把握用户心理:

使用网络查找东西,本身带有明确的目的性,搜西瓜给西瓜店,就这么直截了当,挺好。

而在信息流里获取内容,很多时候可能只是喜好,设想一个场景:

你在看家装信息,结果碰到了个包装成“这样的家装会让女友百分百心动”、其实是装修公司的信息流广告,或许会被点击,然后你发现是广告就毫不留情关掉了。

因为你不是来找装修的,只是来看美图的,最多是回家后打算挪下家具和摆件。

真正的信息流广告是在搜索的精准性和信息流推荐的基础上读懂用户意图,情景可能应该这样:

在看到酱油和其他调味品的烹调心法时,插播一个纸尿裤的信息流广告。尽管这样的感觉,可能很酸爽。

怎么做到?大招其实就是通过用户的选择,发现更多连用户自己都未必很清楚的需求,或许我们可以将其称之为“待办事项提醒”。

200万个标签=1个人?解决潜在痛点的刚需画像

必须有一个“工具”,能够比用户自身,更加了解它,通常我们称之为用户画像。

“通过搜索数据、地理位置、知识图谱、交易数据等等上百个维度的行为动作,今天我们可以对单个用户最多打上200万个标签。通过精准的用户画像建模,我们可以在6亿用户中精准的识别每个人、了解每个人”在 2016年网络Moments商业峰会上,向海龙公布了网络拥有的惊人用户标签数据。

200万个标签=1个人,这是一个什么状态?

10年前,我们在QQ上给朋友贴标签,往往靠谱的就十来个。

5年前,为了更好的吸粉,我们在微博上给自己贴上标签,结果许多人就填了三五个。

我们对自己的认知、加上朋友对我们的认知,大体也就是这个情况,而200万的标签,等于从所有的侧面画出了一个放大镜都未必能看清的自己。

怎么画出?或许仅仅是多年前搜索过“剖腹产的风险”,在问答上了解了“新生儿如何消黄疸”,在母婴贴吧激烈争辩过早教话题……

在PC时代,这样的画像往往都是一次性的,只能变成一个个cookie,每次针对性的营销,也只能做到看车送车品广告而已。

而在移动端,每个App都会要求登录账号,结果就能让散落各处的标签落在一个账号上。理论上产品矩阵越大、形式越多,标签的侧面就越丰满。再通过信息流广告,投放给正在懒懒的从喜好的内容方向里挑选信息的你。

因为有用而实际,其实它也就不再是广告,而是解决痛点的所在了。

换言之,如果没有强大的产品矩阵,从各个方向、不同角度,获得各种不经意留下的标签,并通过人工智能来进行有效管理,那么这个用户的画像,要么是P出来的大长腿,要么就是满满的标签无从下手。画像失真的结果,就是信息流广告失准。为什么说网络信息流广告精准?正是因为有多元产品矩阵、多年积累的大数据、强大的技术实力做支撑。

谢绝虚假广告和无效阅读 转换率实现倍增突破

河南烘你欢心烘焙是创业者中在信息流广告中获益的一个代表。

这家企业2014年创业时不过是50平米小店里的私房蛋糕定制,但通过有效地网络信息流广告分发,迅速曝光在了全国烘焙爱好者的视线,并很快发展成上千平米、20人团队的专业服务公司。

这个案例价值体现在:

对于企业主来说,更加切入用户内心需求的信息流广告(纸尿片),如果和直接体现需求的搜索推广(打酱油)配合使用,则可以更好地挖掘到用户。

网络搜索+推荐的意义,其实除了精准以外,更多的体现在转换率的提高之上。较之只有内容分发的平台而言,因为网络搜索、网络地图、网络糯米等平台,能实现多侧面的用户标签留存,最终在为网络信息流广告创造更加精准的投放可能。

同时,搜索的力量依然强大,尤其是应对迫切需要解决的刚需之上,搜索和推荐双剑合璧的优势是网络广告较之其他平台更为精准有效的重要原因。

与此同时,借助人工智能技术,信息流广告也在进行着迭代。

以诺心蛋糕为例,早期信息流广告的形式为“诺心蛋糕LECAKE—情人节为爱发声,定制专属情话”这样颇为常见硬广形式,点击转换率只有1.86%;而当其形式变成“情人节表白神器,给女朋友一万点浪漫暴击”时,而在融合场景中,则依据人群定向、内容定向等常见场景,以及网络独有的意向定位方式,自然融入到与之有潜在需求的人群面前,最终促使转换率提升至3.24%,暴增近一倍。

“我本来是去超市打油酱的,结果出来时背着一堆纸尿片”这个场景,或许现在还无法完全在信息流广告中彻底实现,但至少机会浪潮已经呈现,而网络正在引领这种浪潮。

❾ 电商平台如何更好地构建用户标签体系

电商平台需结合用户在历史时间内的网购行为记录、端内浏览访问加购收藏记录、用户地域年龄层次性别等属性值,打通多端多源数据,构建用户标签体系。电商平台也可以使用个推·用户运营平台来构建用户标签体系。

个推·用户运营平台支持APP自有标签导入、构建APP自定义标签、个推标签数据补充,帮助APP快速搭建数据标签体系,深入了解用户,助力APP用户分层运营。

①APP自有标签导入,原标签复用。

个推·用户运营标签管理功能支持APP自有标签导入,帮助APP将自有标签直接同步标签数据库。例如用户渠道、会员等级、用户类别(新、老用户)、活跃用户、消费水平等标签。

②APP自定义标签,快速创建动态标签。

个推·用户运营标签管理功能支持规则标签、模板标签、SQL标签等形式创建标签,通过埋点属性、事件属性、个推标签、APP标签等多维度数据,帮助运营人员快速构建最新动态标签。运营人员通过APP运营场景结合用户行为偏好、兴趣偏好进行用户洞察分析,深入了解用户特征后,实时构建动态的用户标签。

③个推标签体系,多维度标签补充。

APP在自有标签的基础上,可以基于个推标签体系,补充APP用户画像标签(例如年龄段、兴趣偏好等),构建更为全面的数据标签体系。

现在个推·用户运营正限时免费中,点击即刻体验

用户洞察

❿ 抖音账号种草标签怎么打

摘要 抖音所谓的标签,其实分为用户标签和创作者标签两种。

热点内容
windows7python 发布:2024-04-28 19:59:22 浏览:616
文件夹2寸 发布:2024-04-28 19:42:48 浏览:657
怎么用服务器的ip做内网穿透 发布:2024-04-28 19:28:52 浏览:925
常用的单向哈希算法有 发布:2024-04-28 19:16:04 浏览:116
牛贝微信淘客源码 发布:2024-04-28 19:09:16 浏览:34
传奇装备强化脚本 发布:2024-04-28 18:34:29 浏览:329
QQ如何撤销以储存的密码 发布:2024-04-28 18:32:13 浏览:322
ttsandroid中文 发布:2024-04-28 18:30:38 浏览:767
修改密码后为什么连接不了 发布:2024-04-28 18:16:48 浏览:743
cfm安卓转苹果在哪个买 发布:2024-04-28 18:07:15 浏览:161