算法的现象

发布时间: 2023-04-28 02:52:16

1. 最懂你的“算法”，如何不沦为“算计”

来源摘编自《平台治理2.0：共同富裕时代数字经济治理转型》，电子工业出版社，2022年4月出版。

文于凤霞国家信息中心信息化和产业发展部处长

随着互联网、大数据、算法与人工智能等的发展日新月异，平台经济的崛起使得追求物美价廉、方便快捷的消费者与世界各地的商品和服务之间的距离只是点击几下鼠标而已。网络世界、新兴技术正在使我们更加便利、舒适，我们每天都在享受平台经济繁荣发展带来的福利。大数据和算法等技术功不可没。

克里斯托弗·斯坦纳在其着作《算法帝国》里对算法推崇备至，认为构建算法模仿、超越并最终取代人类，是21世纪最重要的能力，未来属于算法及其创造者。科技哲学家凯文·凯利在其着作《失控》中提到：“人们在将自然逻辑输入机器的同时，也把技术逻辑带到了生命之中……机器人、经济体、计算机程序等人造物也越来越具有生命属性。”

随着平台经济在人类经济社会各领域的快速渗透，我们的生活已经悄悄地被算法和数据控制，算法与数据接管了整个社会。算法为人类行为赋能，但受所输入数据的质量及算法模型本身的限制，内在地嵌入了人类正面或负面的价值观，并能动地制造着各种风险。

阿里尔·扎拉奇在其《算法的陷阱：超级平台、算法垄断与场景欺骗》一书中写道，精妙的算法与数据运算改变了市场竞争的本质，复杂多变的市场现实已在悄无声息中将权力移交到少数人的手中，因此，必须由监管机构及时采取可行的方法和政策，有效化解算法带来的各种风险，促使创新能够真正为社会带来正面意义。

经过长期的数据沉淀和算法优化，你的手机、你的常用App在某些方面确实会比你的家人、好友甚至你本人更了解你。这就意味着，当我们在利用算法的时候，也不自觉地成了被算法计算的对象。

“大数据杀熟”意指同样的产品或者服务，老客户看到的价格反倒比新客户所看到的更高。而且还存在同一用户信息在不同网络平台之间被共享的问题，许多用户都遇到过这样的情形：在一个网站浏览或搜索的内容很快会被另一个网站进行推荐或成为其广告客户。

在传统销售模式下，通常是老客户能够享受到更多的优惠，这些优惠往往通过会员卡、积分制等不同形式来实现，也广为大众所接受。

然而，通过网络平台开展的许多销售活动，却出现了相反的情况：随着用户在某个平台上消费次数的增加、消费金额的不断提高，其最开始能够享受到的各种优惠却会逐渐消失，甚至变成老用户可能要付出更高的价钱获得服务，而新用户则能够享受到各类优惠。

这种问题在美国早就引起过热议，2000年亚马逊曾对68款盘片进行类似的定价机制。新顾客购买价格为22.74美元，老顾客却需要26.24美元。在引起消费者广泛质疑后，亚马逊CEO贝佐斯回应这只是随机价格的一种测试，并向高价客户退还差价，这次风波才得以平息。2012年《华尔街日报》又爆料一家名为Staples的文具店的“差别定价”事件。

从某种意义上说，“大数据杀熟”属于大数据营销，部分平台在有了大数据这个强大的用户画像工具后，实现了千人千面的定价机制。利用大数据技术对用户资料进行细分，根据用户习惯建立用户画像，然后通过画像给用户推荐相应的产品与服务，并且进行差异化定价。

根据《中华人民共和国价格法》第十四条规定，经营者提供相同商品或者服务，不得对具有同等交易条件的其他经营者实行价格歧视。由于该法未针对“同等交易条件”进行详细解释，严格说来，网络平台依据大数据分析所做的“差别定价”并不能完全和“价格歧视”画等号。

人们之所以会对“大数据杀熟”产生怀疑甚至愤怒，根本上是因为平台定价机制和供需匹配规则不透明。

基于用户注册及个人信息、地理位置、消费记录、搜索习惯等行为数据，平台能够针对不同的用户形成独特的用户画像。这一画像有助于平台为用户提供精准的个性化服务，但也埋下了“大数据杀熟”的潜在风险。

针对新老用户或不同消费习惯的用户，一些平台提供的同一产品或服务，存在较为严重的价格歧视现象，引发广泛争议。平台定价机制和供需匹配规则的不透明，还使得消费者在权益遭到损害时陷入举证难、维权难的境地。

算法引发的第二个问题可以被称为“信息茧房”和“回声室效应”。

“信息茧房”可能带来的后果是，长期被禁锢在其中的个人，其思维甚至是生活可能呈现出一种定式化、程序化的状态，失去了解不同事物的能力和接触机会；另外，还可能加剧人与人的差异性、分化，甚至很有可能带来一大批社会极端分子，从而带来安全威胁，影响社会的稳定。

经济学家安东尼·唐恩斯认为，人们容易从观点相似的人那里获取信息，从而减少信息成本。网络虚拟社群一方面使爱好相似的人们聚集到一起，但高度同质化的聚集也减少了他们接受多元化声音的可能，从而形成封闭的“回声室”。

算法给用户推荐的信息内容，如新闻标题、内容、图片、评论等，都会影响用户的情绪，甚至改变用户的思想和观点。在这些场景中，算法本身只是从优化业务的角度出发进行推荐和内容分发，这些算法的长期高频率使用，在客观上深刻地影响着用户的思想和行为，甚至影响整个社会的价值传播。

因此，算法作为一种技术工具，或许是中立的无所谓正向或负向价值观，但如果算法技术与商业利益密切联系，或者被应用于与人和社会相关的场景时，必然会引发一系列社会问题，不容回避。

算法引发的第三个主要问题是流量造假和流量劫持。

一些平台或商家通过人为或机器操作手段提高关键词搜索量、平台用户数、广告点击量、视频播放量、产品购买量、服务评论数等，还有部分平台通过强制跳转、妨碍破坏等技术手段，或者使用定向引流、广告混淆等非技术手段劫持本应属于竞争对手的流量，诱导用户使用己方的产品或服务。

在直播电商领域中，2020年新华社曾报道，山东临沂电商从业者孙玲玲，在某电商平台经营一家销售糖果类产品的店铺，一个月内，孙玲玲找了多位带货主播，这些主播粉丝数量都超过百万，但几乎每场带货都以赔钱收场，流量造假问题也相当突出。

当前关于规范恶意流量竞争的制度尚不健全。一是法律规定较为模糊，尤其是对于流量不正当竞争行为的构成要件与法律责任缺乏明确界定；二是平台企业流量竞争手段越来越隐蔽和复杂，导致不正当竞争行为的举证、认定及对损害和赔偿额度的确定都存在较大难度。

随着网络技术的进步与平台经济的发展，如何规制流量恶意竞争等新型不正当竞争行为、营造公平竞争的市场环境，成为亟须深入研究的重要课题。

此外，还有操纵榜单和控制热搜等问题。“热搜”原本反映的是当前舆论最关切的热点问题，但在实践中我们发现，其后台算法有可能被滥用，出现操纵榜单、控制热搜、人为制造舆论热点等问题，严重影响着民众对热搜的信任。

卓别林的电影《摩登时代》对机器操控产业工人的讽刺，以及马克思着作《1844年经济学哲学手稿》对机器工业化时代人类“异化”的警示，无不提醒我们，就像机器流水线有可能凌驾于劳动工人之上一样，当今无处不在的算法若应用不当，也有可能成为一种凌驾于人之上的力量，为人和社会的发展带来新的风险。

为此，有效加强算法监管，积极应对新技术发展带来的挑战，让人类更好地享受新技术发展的福利，是顺应平台经济发展趋势的必然要求。

针对算法应用这一全新的治理课题，我国正在不断加强相关领域的制度建设和规范。如早在2018年，我国资管新规《关于规范金融机构资产管理业务的指导意见》就提出要避免智能算法的顺周期性风险，要求金融机构，应当根据不同产品投资策略，研发对应的人工智能算法或者程序化交易，避免算法同质化加剧投资行为的顺周期性，并针对由此可能引发的市场波动风险制订应对预案。

此外，新规提出，因算法同质化、编程设计错误、对数据利用深度不够等人工智能算法模型缺陷或者系统异常，导致“羊群效应”、影响金融市场稳定运行的，金融机构应当及时采取人工干预措施，强制调整或者终止人工智能业务。

2020年12月中共中央印发的《法治社会建设实施纲要（2020-2025年）》提出，制定完善对网络直播、自媒体、知识社区问答等新媒体业态和算法推荐、深度伪造等新技术应用的规范管理办法；加强对大数据、云计算和人工智能等新技术研发应用的规范引导。

尤其是2021年出台的系列制度，从反垄断等不正当竞争、保护消费者权益、保护个人信息安全等不同角度和侧重点，对算法应用引发的“大数据杀熟”行为提出了规范要求。

2021年2月，《关于平台经济领域的反垄断指南》规定，基于大数据和算法，根据交易相对人的支付能力、消费偏好、使用习惯等，实行差异性交易价格或者其他交易条件；对新老交易相对人实行差异性交易价格或者其他交易条件；实行差异性标准、规则、算法；实行差异性付款条件和交易方式等，都可能被认定为“大数据杀熟”等不正当竞争行为而面临更严格的监管。

2021年8月，国家市场监督管理总局公布的《禁止网络不正当竞争行为规定（公开征求意见稿）》第二十一条指出，经营者不得利用数据、算法等技术手段，通过收集、分析交易相对方的交易信息、浏览内容及次数、交易时使用的终端设备的品牌及价值等方式，对交易条件相同的交易相对方不合理地提供不同的交易信息，侵害交易相对方的知情权、选择权、公平交易权等，扰乱市场公平交易秩序。

从监管的角度来看，反不正当竞争法对“大数据杀熟”行为的规制的最大特点在于，企业并不需要具备市场支配地位，无论平台企业的市场地位如何，经营者利用技术手段，实施“二选一”行为，或者利用数据、算法等技术手段，侵害交易相对方的知情权、选择权、公平交易权等，扰乱市场公平交易秩序，实施“大数据杀熟”的行为，均会受到反不正当竞争法的限制。

2021年11月1日开始正式实施的个人信息保护法，第一次在法律文本中定义了“自动化决策”一词的含义，即“通过计算机程序自动分析、评估个人的行为习惯、兴趣爱好或者经济、健康、信用状况等，并进行决策的活动”。对利用个人信息进行自动化决策做了针对性的规范，要求个人信息处理者保证自动化决策的透明度和结果的公平、公正，不得通过自动化决策对个人在交易价格等交易条件上实行不合理的差别待遇，并在事前进行个人信息保护影响评估。个人认为自动化决策对其权益造成重大影响的，有权拒绝个人信息处理者仅通过自动化决策的方式做出决定。

可以说，这里的规定，更加强调对用户人格权益的保护，旨在保护个人信息安全。

算法规制的第二个重点是，算法在互联网信息服务领域的应用。

2021年8月，国家互联网信息办公室就《互联网信息服务算法推荐管理规定（征求意见稿）》向社会公开征求意见。征求意见稿中明确，所谓的算法推荐技术，是指应用生成合成类、个性化推送类、排序精选类、检索过滤类、调度决策类等算法技术向用户提供信息内容。

这意味着，各类信息流平台、用户生成内容（UGC）平台都在被监管范围内。甚至在朋友圈内常见的信息流广告，亦是推荐算法的结果，也应该遵守相关规定。

征求意见稿第一次区分了生成合成类、个性化推送类、排序精选类、检索过滤类、调度决策类五类向用户提供信息内容的算法技术，并就算法推荐服务提供者的责任和义务、算法推荐服务公告和算法备案等制度、算法推荐未成年人模式做出了详细规定。

在网络信息内容生态方面，征求意见稿提出，算法推荐服务提供者应当坚持主流价值导向，优化算法推荐服务机制，积极传播正能量，促进算法应用向上向善。

强调要“建立完善人工干预和用户自主选择机制”，也就是说，不能依赖算法进行内容推荐，要增加人工识别及筛选的过程，在首页首屏、热搜、精选、榜单类、弹窗等重点环节积极呈现符合主流价值导向的信息内容。

这意味着，在压实互联网信息服务平台主体责任方面，除了要求对谣言及其他不法信息进行治理，算法决策的合规化也是一个重要抓手。

在平台算法推荐服务过程中，依据何种算法和逻辑使用数据，将成为平台算法规制的重要内容。征求意见稿对算法推荐服务提供者在算法规则及公示方面都提出了要求。

2021年9月，国家互联网信息办公室印发《关于加强互联网信息服务算法综合治理的指导意见》，提出要用三年左右时间，逐步建立治理机制健全、监管体系完善、算法生态规范的算法安全综合治理格局。

在健全算法安全治理机制方面，《意见》提出要致力于打造形成政府监管、企业履责、行业自律、社会监督的算法安全多元共治局面。尤其是要强化平台企业主体责任，明确提出，企业应强化责任意识，对算法应用产生的结果负主体责任，并建立算法安全责任制度和科技伦理审查制度。

在促进算法生态规范发展方面，《意见》则提出要推动算法公开透明，督促企业及时、合理、有效地公开算法基本原理、优化目标、决策标准等信息，做好算法结果解释，畅通投诉通道。

《平台治理2.0》，于凤霞着

电子工业出版社，2022年4月出版

近年来数字经济增加值在我国GDP中的占比不断提升，但相对经济总量而言还是偏低；新业态新模式发展过程中也出现了新的问题和挑战。因此，在推动和规范数字经济发展的同时，需要重构治理体系，进一步突出竞争政策基础地位，并构建起全方位、多层次、立体化的治理体系。本书围绕平台治理，分析我国在数字治理、反垄断等方面的探索，平台经济在发展过程中的挑战和可能的应对之策。

2. 什么是算法

算法（Algorithm）是指解题方案的准确而完整的描述，是一系列解决问题的清晰指令，算法代表着用系统的方法描述解决问题的策略机制。也就是说，能够对一定规范的输入，在有限时间内获得所要求的输出。如果一个算法有缺陷，或不适合于某个问题，执行这个算法将不会解决这个问题。不同的算法可能用不同的时间、空间或效率来完成同样的任务。一个算法的优劣可以用空间复杂度与时间复杂度来衡量。
算法中的指令描述的是一个计算，当其运行时能从一个初始状态和（可能为空的）初始输入开始，经过一系列有限而清晰定义的状态，最终产生输出并停止于一个终态。一个状态到另一个状态的转移不一定是确定的。随机化算法在内的一些算法，包含了一些随机输入。
形式化算法的概念部分源自尝试解决希尔伯特提出的判定问题，并在其后尝试定义有效计算性或者有效方法中成形。这些尝试包括库尔特·哥德尔、Jacques Herbrand和斯蒂芬·科尔·克莱尼分别于1930年、1934年和1935年提出的递归函数，阿隆佐·邱奇于1936年提出的λ演算，1936年Emil Leon Post的Formulation 1和艾伦·图灵1937年提出的图灵机。即使在当前，依然常有直觉想法难以定义为形式化算法的情况。

3. 关于算法

阿朱对于算法的了解不多，总结如下，希望多多交流，改正瑕疵。

算法推荐主要有5种方式：

基于内容推荐：这是基于用户个人兴趣的推荐。根据用户个体的历史行为，计算对内容特征的偏好程度，进而推荐出与用户特征偏好匹配的内容。

协同过滤算法：这是基于群体的推荐。基于用户的相似度、内容的共现度，以及基于人口特征将用户聚集为不同群体来推荐。（解释一下：常见的协同过滤算法有两种，一种是基于用户的（user-based），也即计算用户之间的相似性，如果A和B的兴趣相近，那么A喜欢的电影，B也很有可能喜欢。另一种是基于物品的（item-based），也即计算物品之间的相似性，如果电影C和电影D很相似，那么喜欢电影C的人，可能也会喜欢电影D。）

扩展推荐：基于用户兴趣点、内容类别等扩展。（你喜欢历史资讯，我推考古、寻宝的资讯给你）

新热推荐：基于全局内容的时效性、热度推荐。（在产品初期同时缺乏用户数据和内容数据时，内容分发效率很低。使用基于内容推荐算法效果不显着，而使用一些热点话题可在保证一定流量的同时，不断通过用户的个人行为（点赞、评论、浏览、收藏）来逐步精确用户画像和进行内容沉淀，为之后的个性化推荐做准备）。

环境特征：基于地域、时间、场景等推荐。（知乎上你们市的牙科诊所广告、婚庆广告）

每种算法的效果不一，组合味道更佳，因此很多公司都是采用“算法矩阵”的方式来推荐feed。（后文也会谈到这一点）

优势:

内容质量审核、社区治理（辱骂、撕逼），推荐商品，减少人工运营成本。

源源不断推荐给你感兴趣的feed，提升了用户粘性，商业化的潜力进一步加大。

让用户 kill time 的需求更好地被满足，增强用户体验

弊端：

1.算法本身或者算法背后的人产生技术错误——只要是人写的算法，就一定有出错的概率，比如德国居民凌晨发飙的智能音箱、失控的Uber自动驾驶汽车就是程序上的Bug导致的，这一类我们克服的办法其实相对简单。但对于另一种人为算计消费者的算法有时候可能我们就无能为力了，比如大数据杀熟现象，无论真实与否，这类问题往往很难识别，因此也加大了监管的难度；（抖音视频里你见不到“钱”字，只能看到“Q”来代替）

2.算法对于人性部分的忽略——现在的人工智能离真正理解人类的感情和行为依然有巨大的鸿沟，Facebook提醒你给去世的亲人发生日祝福背后本质的原因在于AI无法真正理解死亡对于人类意味着什么；因此需要人机结合（平台人工参与，用户举报等自治措施），不能单独依靠算法。

3.算法训练数据本身的偏见——目前人工智能的基本逻辑是先构建一个合适的机器学习模型，然后用大量的数据去训练模型，然后用训练好的模型再来预测新的数据，这里边有一个非常重要前提就是输入数据的重要性，比如变坏的微软机器人Tay之所以产生问题就是因为输入的数据中本身就存在偏见，如果现实世界数据本身就存在偏见，那么预测结果也一定会有偏见；

先下结论吧：算法不会导致“信息茧房”

“社交媒体和算法推荐导致信息茧房”这一判断成立的一个重要前提是：我们只会点击那些我们熟悉的、赞同的内容，不断让机器加深对我们的印象：原来他们只喜欢看这些！

但在现实中，这个前提是过于简化的，乃至是错误的。

在个体层面，我们有着多样的阅读动机，受到各种认知偏见的影响，可能倾向于点击某些特定类型的内容，但绝不仅仅局限于自己认同的那些。

在社交层面：我们在大多数APP上都存在着社交关系，以及主动选择关注的帐号，这些都对我们能接触到的内容产生重要影响。一个在APP上拥有一定社交关系的人，不太可能陷入狭窄的视野当中。

在技术层面：在算法的分类里说了，每种算法都有其利弊，因此很多公司都是采用“算法矩阵”的方式来推荐feed。但在普罗大众眼里，算法=基于内容的推荐算法，而忽略了“基于内容的推荐算法”只是算法种类里的一种，其他类型算法也会被产品使用。

在企业层面：没有一个商场的经理，希望顾客每一次来到商场都只关注同一类别的商品。用户兴趣窄化对于商业化目标并不是一个好的选择。

博弈：

推荐太强了，关注力量就会弱。抖音沉浸式交互和基于内容的算法推荐是 kill time 的利器，推荐feed刷的过瘾了，你还会去刷关注feed吗？

共生：

算法有弊端，关注可以弥补或有所增益。推荐feed是忽略了人"社交性“这个特点，以知乎为例，关注的内容生产者传递给我们价值，所以我们需要一个途径来知道那几十个或上百的关注对象的产出内容。朋友圈满足我们窥探的信息需求，也同理。（另外从结果反推过程，大家看一下手里的B站、知乎、抖音、快手就清楚了）

阅读全文

热点内容

中国移动用什么服务密码发布：2024-05-20 00:52:10 浏览：695

make编译输出发布：2024-05-20 00:37:01 浏览：67

4200存储服务器发布：2024-05-20 00:20:35 浏览：160

解压小生活发布：2024-05-20 00:15:03 浏览：143

粘土小游戏服务器ip 发布：2024-05-20 00:14:00 浏览：196

魔兽世界如何快速增加服务器发布：2024-05-19 23:53:37 浏览：694

安卓手机如何转入苹果手机内发布：2024-05-19 23:50:35 浏览：405

安卓哪个能安装血染小镇发布：2024-05-19 23:45:57 浏览：901

tensorflowmac编译发布：2024-05-19 23:28:59 浏览：702

sqlmaxvarchar 发布：2024-05-19 23:24:02 浏览：703

算法的现象

与算法的现象相关的资讯