當前位置:首頁 » 操作系統 » 演算法的現象

演算法的現象

發布時間: 2023-04-28 02:52:16

1. 最懂你的「演算法」,如何不淪為「算計」

來源 摘編自《平台治理2.0:共同富裕時代數字經濟治理轉型》,電子工業出版社,2022年4月出版。

文 於鳳霞 國家信息中心信息化和產業發展部處長

隨著互聯網、大數據、演算法與人工智慧等的發展日新月異,平台經濟的崛起使得追求物美價廉、方便快捷的消費者與世界各地的商品和服務之間的距離只是點擊幾下滑鼠而已。網路世界、新興技術正在使我們更加便利、舒適,我們每天都在享受平台經濟繁榮發展帶來的福利。大數據和演算法等技術功不可沒。

克里斯托弗·斯坦納在其著作《演算法帝國》里對演算法推崇備至,認為構建演算法模仿、超越並最終取代人類,是21世紀最重要的能力,未來屬於演算法及其創造者。 科技 哲學家凱文·凱利在其著作《失控》中提到:「人們在將自然邏輯輸入機器的同時,也把技術邏輯帶到了生命之中……機器人、經濟體、計算機程序等人造物也越來越具有生命屬性。」

隨著平台經濟在人類經濟 社會 各領域的快速滲透,我們的生活已經悄悄地被演算法和數據控制,演算法與數據接管了整個 社會 。演算法為人類行為賦能,但受所輸入數據的質量及演算法模型本身的限制,內在地嵌入了人類正面或負面的價值觀,並能動地製造著各種風險。

阿里爾·扎拉奇在其《演算法的陷阱:超級平台、演算法壟斷與場景欺騙》一書中寫道,精妙的演算法與數據運算改變了市場競爭的本質,復雜多變的市場現實已在悄無聲息中將權力移交到少數人的手中,因此,必須由監管機構及時採取可行的方法和政策,有效化解演算法帶來的各種風險,促使創新能夠真正為 社會 帶來正面意義。

經過長期的數據沉澱和演算法優化,你的手機、你的常用App在某些方面確實會比你的家人、好友甚至你本人更了解你。這就意味著,當我們在利用演算法的時候,也不自覺地成了被演算法計算的對象。

「大數據殺熟」意指同樣的產品或者服務,老客戶看到的價格反倒比新客戶所看到的更高。而且還存在同一用戶信息在不同網路平台之間被共享的問題,許多用戶都遇到過這樣的情形:在一個網站瀏覽或搜索的內容很快會被另一個網站進行推薦或成為其廣告客戶。

在傳統銷售模式下,通常是老客戶能夠享受到更多的優惠,這些優惠往往通過會員卡、積分制等不同形式來實現,也廣為大眾所接受。

然而,通過網路平台開展的許多銷售活動,卻出現了相反的情況:隨著用戶在某個平台上消費次數的增加、消費金額的不斷提高,其最開始能夠享受到的各種優惠卻會逐漸消失,甚至變成老用戶可能要付出更高的價錢獲得服務,而新用戶則能夠享受到各類優惠。

這種問題在美國早就引起過熱議,2000年亞馬遜曾對68款碟片進行類似的定價機制。新顧客購買價格為22.74美元,老顧客卻需要26.24美元。在引起消費者廣泛質疑後,亞馬遜CEO貝佐斯回應這只是隨機價格的一種測試,並向高價客戶退還差價,這次風波才得以平息。2012年《華爾街日報》又爆料一家名為Staples的文具店的「差別定價」事件。

從某種意義上說,「大數據殺熟」屬於大數據營銷,部分平台在有了大數據這個強大的用戶畫像工具後,實現了千人千面的定價機制。利用大數據技術對用戶資料進行細分,根據用戶習慣建立用戶畫像,然後通過畫像給用戶推薦相應的產品與服務,並且進行差異化定價。

根據《中華人民共和國價格法》第十四條規定,經營者提供相同商品或者服務,不得對具有同等交易條件的其他經營者實行價格歧視。由於該法未針對「同等交易條件」進行詳細解釋,嚴格說來,網路平台依據大數據分析所做的「差別定價」並不能完全和「價格歧視」畫等號。

人們之所以會對「大數據殺熟」產生懷疑甚至憤怒,根本上是因為平台定價機制和供需匹配規則不透明。

基於用戶注冊及個人信息、地理位置、消費記錄、搜索習慣等行為數據,平台能夠針對不同的用戶形成獨特的用戶畫像。這一畫像有助於平台為用戶提供精準的個性化服務,但也埋下了「大數據殺熟」的潛在風險。

針對新老用戶或不同消費習慣的用戶,一些平台提供的同一產品或服務,存在較為嚴重的價格歧視現象,引發廣泛爭議。平台定價機制和供需匹配規則的不透明,還使得消費者在權益遭到損害時陷入舉證難、維權難的境地。

演算法引發的第二個問題可以被稱為「信息繭房」和「回聲室效應」。

「信息繭房」可能帶來的後果是,長期被禁錮在其中的個人,其思維甚至是生活可能呈現出一種定式化、程序化的狀態,失去了解不同事物的能力和接觸機會;另外,還可能加劇人與人的差異性、分化,甚至很有可能帶來一大批 社會 極端分子,從而帶來安全威脅,影響 社會 的穩定。

經濟學家安東尼·唐恩斯認為,人們容易從觀點相似的人那裡獲取信息,從而減少信息成本。網路虛擬社群一方面使愛好相似的人們聚集到一起,但高度同質化的聚集也減少了他們接受多元化聲音的可能,從而形成封閉的「回聲室」。

演算法給用戶推薦的信息內容,如新聞標題、內容、圖片、評論等,都會影響用戶的情緒,甚至改變用戶的思想和觀點。在這些場景中,演算法本身只是從優化業務的角度出發進行推薦和內容分發,這些演算法的長期高頻率使用,在客觀上深刻地影響著用戶的思想和行為,甚至影響整個 社會 的價值傳播。

因此,演算法作為一種技術工具,或許是中立的無所謂正向或負向價值觀,但如果演算法技術與商業利益密切聯系,或者被應用於與人和 社會 相關的場景時,必然會引發一系列 社會 問題,不容迴避。

演算法引發的第三個主要問題是流量造假和流量劫持。

一些平台或商家通過人為或機器操作手段提高關鍵詞搜索量、平台用戶數、廣告點擊量、視頻播放量、產品購買量、服務評論數等,還有部分平台通過強制跳轉、妨礙破壞等技術手段,或者使用定向引流、廣告混淆等非技術手段劫持本應屬於競爭對手的流量,誘導用戶使用己方的產品或服務。

在直播電商領域中,2020年新華社曾報道,山東臨沂電商從業者孫玲玲,在某電商平台經營一家銷售糖果類產品的店鋪,一個月內,孫玲玲找了多位帶貨主播,這些主播粉絲數量都超過百萬,但幾乎每場帶貨都以賠錢收場,流量造假問題也相當突出。

當前關於規范惡意流量競爭的制度尚不健全。一是法律規定較為模糊,尤其是對於流量不正當競爭行為的構成要件與法律責任缺乏明確界定;二是平台企業流量競爭手段越來越隱蔽和復雜,導致不正當競爭行為的舉證、認定及對損害和賠償額度的確定都存在較大難度。

隨著網路技術的進步與平台經濟的發展,如何規制流量惡意競爭等新型不正當競爭行為、營造公平競爭的市場環境,成為亟須深入研究的重要課題。

此外,還有操縱榜單和控制熱搜等問題。「熱搜」原本反映的是當前輿論最關切的熱點問題,但在實踐中我們發現,其後台演算法有可能被濫用,出現操縱榜單、控制熱搜、人為製造輿論熱點等問題,嚴重影響著民眾對熱搜的信任。

卓別林的電影《摩登時代》對機器操控產業工人的諷刺,以及馬克思著作《1844年經濟學哲學手稿》對機器工業化時代人類「異化」的警示,無不提醒我們,就像機器流水線有可能凌駕於勞動工人之上一樣,當今無處不在的演算法若應用不當,也有可能成為一種凌駕於人之上的力量,為人和 社會 的發展帶來新的風險。

為此,有效加強演算法監管,積極應對新技術發展帶來的挑戰,讓人類更好地享受新技術發展的福利,是順應平台經濟發展趨勢的必然要求。

針對演算法應用這一全新的治理課題,我國正在不斷加強相關領域的制度建設和規范。如早在2018年,我國資管新規《關於規範金融機構資產管理業務的指導意見》就提出要避免智能演算法的順周期性風險,要求金融機構,應當根據不同產品投資策略,研發對應的人工智慧演算法或者程序化交易,避免演算法同質化加劇投資行為的順周期性,並針對由此可能引發的市場波動風險制訂應對預案。

此外,新規提出,因演算法同質化、編程設計錯誤、對數據利用深度不夠等人工智慧演算法模型缺陷或者系統異常,導致「羊群效應」、影響金融市場穩定運行的,金融機構應當及時採取人工干預措施,強制調整或者終止人工智慧業務。

2020年12月中共中央印發的《法治 社會 建設實施綱要(2020-2025年)》提出,制定完善對網路直播、自媒體、知識社區問答等新媒體業態和演算法推薦、深度偽造等新技術應用的規范管理辦法;加強對大數據、雲計算和人工智慧等新技術研發應用的規范引導。

尤其是2021年出台的系列制度,從反壟斷等不正當競爭、保護消費者權益、保護個人信息安全等不同角度和側重點,對演算法應用引發的「大數據殺熟」行為提出了規范要求。

2021年2月,《關於平台經濟領域的反壟斷指南》規定,基於大數據和演算法,根據交易相對人的支付能力、消費偏好、使用習慣等,實行差異性交易價格或者其他交易條件;對新老交易相對人實行差異性交易價格或者其他交易條件;實行差異性標准、規則、演算法;實行差異性付款條件和交易方式等,都可能被認定為「大數據殺熟」等不正當競爭行為而面臨更嚴格的監管。

2021年8月,國家市場監督管理總局公布的《禁止網路不正當競爭行為規定(公開徵求意見稿)》第二十一條指出,經營者不得利用數據、演算法等技術手段,通過收集、分析交易相對方的交易信息、瀏覽內容及次數、交易時使用的終端設備的品牌及價值等方式,對交易條件相同的交易相對方不合理地提供不同的交易信息,侵害交易相對方的知情權、選擇權、公平交易權等,擾亂市場公平交易秩序。

從監管的角度來看,反不正當競爭法對「大數據殺熟」行為的規制的最大特點在於,企業並不需要具備市場支配地位,無論平台企業的市場地位如何,經營者利用技術手段,實施「二選一」行為,或者利用數據、演算法等技術手段,侵害交易相對方的知情權、選擇權、公平交易權等,擾亂市場公平交易秩序,實施「大數據殺熟」的行為,均會受到反不正當競爭法的限制。

2021年11月1日開始正式實施的個人信息保護法,第一次在法律文本中定義了「自動化決策」一詞的含義,即「通過計算機程序自動分析、評估個人的行為習慣、興趣愛好或者經濟、 健康 、信用狀況等,並進行決策的活動」。對利用個人信息進行自動化決策做了針對性的規范,要求個人信息處理者保證自動化決策的透明度和結果的公平、公正,不得通過自動化決策對個人在交易價格等交易條件上實行不合理的差別待遇,並在事前進行個人信息保護影響評估。個人認為自動化決策對其權益造成重大影響的,有權拒絕個人信息處理者僅通過自動化決策的方式做出決定。

可以說,這里的規定,更加強調對用戶人格權益的保護,旨在保護個人信息安全。

演算法規制的第二個重點是,演算法在互聯網信息服務領域的應用。

2021年8月,國家互聯網信息辦公室就《互聯網信息服務演算法推薦管理規定(徵求意見稿)》向 社會 公開徵求意見。徵求意見稿中明確,所謂的演算法推薦技術,是指應用生成合成類、個性化推送類、排序精選類、檢索過濾類、調度決策類等演算法技術向用戶提供信息內容。

這意味著,各類信息流平台、用戶生成內容(UGC)平台都在被監管范圍內。甚至在朋友圈內常見的信息流廣告,亦是推薦演算法的結果,也應該遵守相關規定。

徵求意見稿第一次區分了生成合成類、個性化推送類、排序精選類、檢索過濾類、調度決策類五類向用戶提供信息內容的演算法技術,並就演算法推薦服務提供者的責任和義務、演算法推薦服務公告和演算法備案等制度、演算法推薦未成年人模式做出了詳細規定。

在網路信息內容生態方面,徵求意見稿提出,演算法推薦服務提供者應當堅持主流價值導向,優化演算法推薦服務機制,積極傳播正能量,促進演算法應用向上向善。

強調要「建立完善人工干預和用戶自主選擇機制」,也就是說,不能依賴演算法進行內容推薦,要增加人工識別及篩選的過程,在首頁首屏、熱搜、精選、榜單類、彈窗等重點環節積極呈現符合主流價值導向的信息內容。

這意味著,在壓實互聯網信息服務平台主體責任方面,除了要求對謠言及其他不法信息進行治理,演算法決策的合規化也是一個重要抓手。

在平台演算法推薦服務過程中,依據何種演算法和邏輯使用數據,將成為平台演算法規制的重要內容。徵求意見稿對演算法推薦服務提供者在演算法規則及公示方面都提出了要求。

2021年9月,國家互聯網信息辦公室印發《關於加強互聯網信息服務演算法綜合治理的指導意見》,提出要用三年左右時間,逐步建立治理機制健全、監管體系完善、演算法生態規范的演算法安全綜合治理格局。

在健全演算法安全治理機制方面,《意見》提出要致力於打造形成政府監管、企業履責、行業自律、 社會 監督的演算法安全多元共治局面。尤其是要強化平台企業主體責任,明確提出,企業應強化責任意識,對演算法應用產生的結果負主體責任,並建立演算法安全責任制度和 科技 倫理審查制度。

在促進演算法生態規范發展方面,《意見》則提出要推動演算法公開透明,督促企業及時、合理、有效地公開演算法基本原理、優化目標、決策標准等信息,做好演算法結果解釋,暢通投訴通道。

《平台治理2.0》,於鳳霞 著

電子工業出版社,2022年4月出版

近年來數字經濟增加值在我國GDP中的佔比不斷提升,但相對經濟總量而言還是偏低;新業態新模式發展過程中也出現了新的問題和挑戰。因此,在推動和規范數字經濟發展的同時,需要重構治理體系,進一步突出競爭政策基礎地位,並構建起全方位、多層次、立體化的治理體系。本書圍繞平台治理,分析我國在數字治理、反壟斷等方面的 探索 ,平台經濟在發展過程中的挑戰和可能的應對之策。

2. 什麼是演算法

演算法(Algorithm)是指解題方案的准確而完整的描述,是一系列解決問題的清晰指令,演算法代表著用系統的方法描述解決問題的策略機制。也就是說,能夠對一定規范的輸入,在有限時間內獲得所要求的輸出。如果一個演算法有缺陷,或不適合於某個問題,執行這個演算法將不會解決這個問題。不同的演算法可能用不同的時間、空間或效率來完成同樣的任務。一個演算法的優劣可以用空間復雜度與時間復雜度來衡量。
演算法中的指令描述的是一個計算,當其運行時能從一個初始狀態和(可能為空的)初始輸入開始,經過一系列有限而清晰定義的狀態,最終產生輸出並停止於一個終態。一個狀態到另一個狀態的轉移不一定是確定的。隨機化演算法在內的一些演算法,包含了一些隨機輸入。
形式化演算法的概念部分源自嘗試解決希爾伯特提出的判定問題,並在其後嘗試定義有效計算性或者有效方法中成形。這些嘗試包括庫爾特·哥德爾、Jacques Herbrand和斯蒂芬·科爾·克萊尼分別於1930年、1934年和1935年提出的遞歸函數,阿隆佐·邱奇於1936年提出的λ演算,1936年Emil Leon Post的Formulation 1和艾倫·圖靈1937年提出的圖靈機。即使在當前,依然常有直覺想法難以定義為形式化演算法的情況。

3. 關於演算法

阿朱對於演算法的了解不多,總結如下,希望多多交流,改正瑕疵。

演算法推薦主要有5種方式:

基於內容推薦:這是基於用戶個人興趣的推薦。根據用戶個體的歷史行為,計算對內容特徵的偏好程度,進而推薦出與用戶特徵偏好匹配的內容。

協同過濾演算法:這是基於群體的推薦。基於用戶的相似度、內容的共現度,以及基於人口特徵將用戶聚集為不同群體來推薦。(解釋一下:常見的協同過濾演算法有兩種,一種是基於用戶的(user-based),也即計算用戶之間的相似性,如果A和B的興趣相近,那麼A喜歡的電影,B也很有可能喜歡。另一種是基於物品的(item-based),也即計算物品之間的相似性,如果電影C和電影D很相似,那麼喜歡電影C的人,可能也會喜歡電影D。)

擴展推薦:基於用戶興趣點、內容類別等擴展。(你喜歡歷史資訊,我推考古、尋寶的資訊給你)

新熱推薦:基於全局內容的時效性、熱度推薦。(在產品初期同時缺乏用戶數據和內容數據時,內容分發效率很低。使用基於內容推薦演算法效果不顯著,而使用一些熱點話題可在保證一定流量的同時,不斷通過用戶的個人行為(點贊、評論、瀏覽、收藏)來逐步精確用戶畫像和進行內容沉澱,為之後的個性化推薦做准備)。

環境特徵:基於地域、時間、場景等推薦。(知乎上你們市的牙科診所廣告、婚慶廣告)

每種演算法的效果不一,組合味道更佳,因此很多公司都是採用「演算法矩陣」的方式來推薦feed。(後文也會談到這一點)

優勢:

內容質量審核、社區治理(辱罵、撕逼),推薦商品,減少人工運營成本。

源源不斷推薦給你感興趣的feed,提升了用戶粘性,商業化的潛力進一步加大。

讓用戶 kill time 的需求更好地被滿足,增強用戶體驗

弊端:

1.演算法本身或者演算法背後的人產生技術錯誤——只要是人寫的演算法,就一定有出錯的概率,比如德國居民凌晨發飆的智能音箱、失控的Uber自動駕駛汽車就是程序上的Bug導致的,這一類我們克服的辦法其實相對簡單。但對於另一種人為算計消費者的演算法有時候可能我們就無能為力了,比如大數據殺熟現象,無論真實與否,這類問題往往很難識別,因此也加大了監管的難度;(抖音視頻里你見不到「錢」字,只能看到「Q」來代替)

2.演算法對於人性部分的忽略——現在的人工智慧離真正理解人類的感情和行為依然有巨大的鴻溝,Facebook提醒你給去世的親人發生日祝福背後本質的原因在於AI無法真正理解死亡對於人類意味著什麼;因此需要人機結合(平台人工參與,用戶舉報等自治措施),不能單獨依靠演算法。

3.演算法訓練數據本身的偏見——目前人工智慧的基本邏輯是先構建一個合適的機器學習模型,然後用大量的數據去訓練模型,然後用訓練好的模型再來預測新的數據,這里邊有一個非常重要前提就是輸入數據的重要性,比如變壞的微軟機器人Tay之所以產生問題就是因為輸入的數據中本身就存在偏見,如果現實世界數據本身就存在偏見,那麼預測結果也一定會有偏見;

先下結論吧:演算法不會導致「信息繭房」

「社交媒體和演算法推薦導致信息繭房」這一判斷成立的一個重要前提是:我們只會點擊那些我們熟悉的、贊同的內容,不斷讓機器加深對我們的印象:原來他們只喜歡看這些!

但在現實中,這個前提是過於簡化的,乃至是錯誤的。

在個體層面,我們有著多樣的閱讀動機,受到各種認知偏見的影響,可能傾向於點擊某些特定類型的內容,但絕不僅僅局限於自己認同的那些。

在社交層面:我們在大多數APP上都存在著社交關系,以及主動選擇關注的帳號,這些都對我們能接觸到的內容產生重要影響。一個在APP上擁有一定社交關系的人,不太可能陷入狹窄的視野當中。

在技術層面:在演算法的分類里說了,每種演算法都有其利弊,因此很多公司都是採用「演算法矩陣」的方式來推薦feed。但在普羅大眾眼裡,演算法=基於內容的推薦演算法,而忽略了「基於內容的推薦演算法」只是演算法種類里的一種,其他類型演算法也會被產品使用。

在企業層面:沒有一個商場的經理,希望顧客每一次來到商場都只關注同一類別的商品。用戶興趣窄化對於商業化目標並不是一個好的選擇。

博弈:

推薦太強了,關注力量就會弱。抖音沉浸式交互和基於內容的演算法推薦是 kill time 的利器,推薦feed刷的過癮了,你還會去刷關注feed嗎?

共生:

演算法有弊端,關注可以彌補或有所增益。推薦feed是忽略了人"社交性「這個特點,以知乎為例,關注的內容生產者傳遞給我們價值,所以我們需要一個途徑來知道那幾十個或上百的關注對象的產出內容。朋友圈滿足我們窺探的信息需求,也同理。(另外從結果反推過程,大家看一下手裡的B站、知乎、抖音、快手就清楚了)

熱點內容
如何取消列印機共享密碼 發布:2024-05-08 19:24:23 瀏覽:240
各層次的教育應如何配置財政資金 發布:2024-05-08 19:23:24 瀏覽:543
如何知道cpu配置是多少 發布:2024-05-08 19:23:18 瀏覽:366
python解釋 發布:2024-05-08 18:52:58 瀏覽:580
開利中央空調密碼如何修改 發布:2024-05-08 18:52:14 瀏覽:639
廠房配置應包含哪些 發布:2024-05-08 18:26:22 瀏覽:760
訪問極路由硬碟 發布:2024-05-08 18:15:15 瀏覽:718
小學生如何自學編程 發布:2024-05-08 18:14:31 瀏覽:561
資料庫復制軟體 發布:2024-05-08 18:00:30 瀏覽:238
python軟體測試 發布:2024-05-08 18:00:24 瀏覽:698