大數據網管運營數據存儲模式研究
⑴ 大數據時代網路輿情管理變革探討
大數據時代網路輿情管理變革探討
大數據時代的到來對人類的生活、工作與思維產生變革性影響,深刻改變著商業王國及公共管理等各個領域的面貌,「大數據」日漸成為各行業創新的助推器。當前中國網路輿情環境復雜,網路輿情危機時有發生,社會熱點輿情事件和涉官涉政輿情事件不斷涌現,造成社會民主生活和政治穩定間的不平衡等諸多影響。大數據背景下的網路輿情正在發生巨大的變化,網路輿情管理變得日益復雜和重要,如何抓住大數據時代為網路輿情管理變革帶來的機遇,以「大數據觀」變革傳統網路輿情管理思維,准確把握網路輿情的內在特徵及其在演變過程中的潛在規律,實現網路輿情管理在思維、模式以及技術上的創新,對於新形勢下做好網路輿情引導工作,加強和改進網路內容建設,具有重要的理論意義和實踐價值。
一、大數據時代必然要求網路輿情管理變革
「大數據」概念最早在20世紀80年代提出,2011年麥肯錫咨詢公司發布其研究成果《大數據:下一個創新、競爭和生產率的前沿》,使這個概念得以大范圍推廣。2012年3月29日,奧巴馬宣布將投入2億多美元啟動「大數據發展和研究計劃(Big Data Research and Development Initiative)」,將「大數據戰略」上升為國家戰略。近兩年,大數據備受學術界、產業界和政府部門的關注,成為國內外強有力的前沿詞彙。大數據又稱巨量數據、海量數據、大資料,指的是所涉及的數據量規模巨大到無法通過目前主流軟體工具在合理時間內進行抓取、管理和處理的數據集合,是必須通過深度挖掘、計算、分析才能創造價值的海量信息。大數據在體量、復雜性、產生速度及價值密度四個方面都極大地超越了傳統的數據形態,具有4V特徵:大量(Volume)、多樣(Variety)、高速(Velocity)、價值(Value)。數量龐大的網民通過論壇、微博、微信等多種途徑方便快捷地發表言論觀點,網路輿情的規模和復雜性急速上升,體量巨大而價值密度低,其內在特徵的變化必然要求實現網路輿情管理的變革以適應大數據時代的發展,這些要求主要體現在四個「轉向」上。
(一)從監測轉向預測。大數據的核心和目標就是預測。復雜網路的研究專家巴拉巴西認為,「93%的人類行為是可以預測的,當我們將生活數字化、公式化以及模型化的時候,我們會發現其實大家都非常相似。生活如此抵觸隨機運動,渴望朝更安全、更規則的方向發展,人類行為看上去很隨意、很偶然,卻極其容易被預測」[1]。例如,亞馬遜可以推薦我們想要的圖書,淘寶知道我們的喜好,而人人網可以猜出我們認識誰。傳統網路輿情管理把監測已經產生的輿情信息作為起點,這種明顯的滯後性使其在網路輿情危機的應對中處於消極被動的位置。而目前留給突發事件的處理時間越來越少,從傳統的「黃金24小時」變為「黃金4小時」,如此短的時間使輿情分析和決策尚未來得及參與進來,整個事件就已經造成了爆炸性的效果。在大數據時代,通過挖掘數據相關性,把數學演算法運用到海量的數據上進行分析,在敏感消息進行網路傳播的初期就提前開始監測,然後建立模型,模擬模擬網路輿情的演變過程,使網路輿情突發事件發生的可能性和傾向性變得可以預測。
(二)從節點轉向網路。由監測輿情轉向預測輿情的目標實現,最關鍵的大數據技術就是挖掘數據的相關性。在小數據時代,由於受到資料庫和計算分析能力的限制,無論是對於因果關系還是相關關系的追尋,都耗資耗時,並且易受傳統的思維模式和特定領域隱含的固有偏見的影響,無法保證輿情分析結果的准確性。因此傳統的網路輿情管理只注重輿情內容的監測,通過分析單個數據節點,如網民「說什麼」來抓住比較淺層的社會語義表達。大數據則在保留了原始數據的同時,記錄了網民「為什麼這么說」背後的社會心理和社會關系網。按照大數據思維,每一個數據都是一個節點,可無限次地與其他關聯數據形成輿情鏈上的乘法效應——類似微博裂變傳播路徑,數據裂變式的關聯狀態蘊含著無限可能性[2]。通過對海量信息的解構與重構,充分整合政府和企業的數據資產,利用一系列飛速發展的新技術和新工具,描繪、測量、計算各節點之間的關系,深度挖掘數據的相關性,以此排除偏見和視覺盲點,掌握易被忽略的社會動態,預測輿情的發展趨勢。因此大數據時代必然要求網路輿情管理變革其監測系統,由節點轉向網路,把握相關性,進而分析輿情背後的社會互動,乃至網路族群之間的界限和相互勾連。
(三)從定性轉向定量。輿情分析師或解讀者從自身經驗和視角出發,在傳統網路輿情管理的過程中進行定性分析時,必然使其分析結果帶有個人價值與理念的主觀印記,甚至不同的輿情機構對同一輿情事件會得出相悖的結論。在大數據時代,所有元數據都可通過量化關聯轉化為有價值的信息,並實現多次利用,每一次利用都是一種創新,大數據成為網路輿情定量管理的力量源泉。盡管數據的相關性決定了某些數據價值的潛藏性,但新技術、新軟體的出現使得通過數學分析實現數據的價值轉化變為可能。而多維解讀輿情和新的深刻洞見的揭示,使輿情分析結果的全面性和客觀性大大超越傳統的網路輿情管理。但數據的量化並不等同於簡單的「數字化」,而是數據的可計算化,舍恩伯格將其稱之為「數據化」,是指一種把現象轉變為可製表分析的量化形式的過程[3]。「數據化」使態度和情緒轉變為一種可以分析的形式,網路輿情的相關信息得以進行深入分析,一些社交媒體如Facebook、Twitter、QQ、微博、微信等坐擁大型數據的寶藏,一旦實現對其自身資料庫的深度利用,就能輕易獲得社會各個領域和所有用戶的幾乎全部動態信息。
(四)從樣本轉向全體。在傳統的網路輿情工作模式中,所採集的輿情關聯數據僅為樣本信息,構建的資料庫結構單一、數據量有限。其數據源一般是基於抽樣或者針對重點網路站點進行的數據抓取,僅能對小規模、有結構或類結構的數據進行分析,標准不一,難以在不同領域中通用。同時,樣本分析並不能保證結果的准確,即使分析方法和操作沒有問題,但采樣過程的任何偏誤都將使輿情分析結果與事實相去甚遠。大數據體量巨大,從TB級別躍升至PB乃至ZB級別,完整記錄了社情民意,成為人類生存痕跡和心理變化的記錄儀。采樣的目的是以盡可能少的數據獲得盡可能多的信息,但大數據是建立在掌握所有數據,至少是海量數據的基礎上的,在數據處理技術日新月異的今天,變革傳統輿情管理思維與方法,改變采樣的慣性行動成為必要。通過運用大數據技術,建立網路輿情自動分析系統,全天候自動搜索並採集與目標輿情看似毫不相關實則具有內在關聯的信息,在抓取和收集頁面之後,對信息自動分類、自動獲取關鍵詞、自動內容分析和自動報警等。樣本擴大至幾乎全體,輿情分析的結果更加客觀可靠。
二、大數據時代網路輿情管理變革的效應前瞻
抓住大數據時代變革網路輿情管理的新機遇,迎接大數據時代網路輿情管理的新挑戰,順應大數據時代網路輿情管理的新要求,變革與創新網路輿情管理將會產生良好的管理效應,實現新時期網路輿情管理的升級轉型。
(一)實現「防火」式管理。傳統的網路輿情管理因為無法把握數據相關性,不能准確預測輿情未來的發展趨勢,因此採用的是「滅火」式管理模式。政府通常在輿情產生或者已形成輿情危機的情況下才開始採取措施,如發布信息、引導輿情、滿足訴求等,以此達到「滅火」效果。在此種模式下,政府經常被動陷入網路輿情漩渦,由此形成視網路輿情為「敵情」的偏見。為了擺脫這一困境,政府總是試圖「控制」、「引導」和「應對」網路輿情,以一種上位者的姿態去支配、主宰網民及其輿情表達的方式。然而,若網民在網路輿情中的主體地位得不到保證,網路輿情就會失去其「減壓閥」的功能,網路輿情問題將會是治標不治本。大數據時代,政府轉變網路輿情管理思路,變革網路輿情管理模式,應用大數據技術對網路輿情進行關聯分析、級別劃分、聚類分析和傾向性分析,將實現「滅火」式管理到「防火」式管理的轉變。通過尋找「導火索」與「減壓閥」之間的平衡點,在發揮網路「民間輿論場」作用的同時,將網路輿情危機扼殺在搖籃里。例如美國中央情報局通過抓取海量數據來追蹤恐怖分子和監控社會情緒,在「阿拉伯之春」中,通過大數據分析多少人和哪些人的立場從溫和變為激進,並「算出」誰有可能會採取有害行為。
(二)打撈「沉沒的聲音」。大數據源於互聯網的分享、開放,但「數字鴻溝」的存在卻使「信息窮人」與網路隔絕。盡管互聯網的發展使這一部分人的比例越來越低,但發展不均衡性的擴大意味著現在和將來仍然有一個不容忽視的群體將無法提供任何數據。即使是那些能夠充分利用網路的人群,也有可能因為在某種情境下成為輿論中的弱勢群體,或者因其在輿情主流中的異質思維而選擇不在網路上發聲。當然,這種選擇既可能是主動也可能是被動的。正如美國哲學家埃里克·霍弗所言,「一個國家最不活躍的人群,為佔大多數的中間層次。他們是在城市工作和在鄉間務農的正派老百姓,然而,他們的命運卻受分據社會光譜兩頭的少數人——最優秀的人和最低劣的人所左右」[4]。顯而易見的是,單憑技術體系構築的大數據平台無法真正獲取「全部數據」,通過改革網路輿情管理去打撈那些可能代表某一個群體或一定數量級的「沉沒的聲音」十分必要。因此,全面思考和理清大數據時代網路輿情管理面臨的機遇和挑戰,通過「大輿情」觀念的構建,變革網路輿情管理的工作理念和模式,將有利於打撈「沉沒的聲音」。例如,將輿情服務與社會調查相結合,重視實地調研與第一手材料的採集,而不是把網路輿情管理捆綁在技術上,將避免得到不全面的輿情或做出誤導性決策。
(三)識破「偽輿情」。當前備受關注的網路輿情,越來越成為依存於影星式的學者、影星式的記者、影星式的商人和影星式的政客為中心的「偽輿情」[5]。重大敏感事件發生後,部分網管和有影響力的輿情機構快速封堵其主觀上認為的「有害信息」,選擇性地編撰輿情報告,以片面、虛假的「偽輿情」影響決策層對形勢的研判,使其做出符合自身利益訴求的決策。有些利益集團則精心扶植和培育自己的網路發言人,引導網民思考的內容和方向。結果,這些輿論領袖對關鍵事件和問題的看法在網路上大行其道,並淹沒其他異質言論,使群眾對真相的認知產生巨大偏差。當輿情被各方利益集團的政治力量和經濟力量操縱時,它便喪失了獨立性,一旦「偽輿情」被識破,輿情機構就可能失去其公信力。基於全網的完整、准確和極速的信息抓取有利於為輿情分析報告提供一手的材料、純粹的事實,從而獲得真實全面的輿情,使網民在不知道「為什麼」的情況下,依然能獲得對「是什麼」的比較公正客觀的認知,並以此助力網路輿情的引導。同時,通過變革網路輿情管理的體制機制,保持輿情管理的獨立性將有力識破「偽輿情」,剔除「雜音」與「噪音」,使大數據時代的網路輿情真正成為現實世界的「鏡像」。
(四)克服「盲人摸象」和「信息孤島」。海量信息無限增長與網民關注、分析能力有限之間的矛盾,造成了「數據爆炸」與「知識貧乏」的怪象,加劇了社會輿論的「盲人摸象」效應。大數據時代下,網路媒體促進了信息的開放和溝通的便捷,人們對公共事件的參與達到了一個前所未有的高度,但是分眾傳播、個性化傳播的凸顯以及信息的碎片化,使得全面、深刻地關注和分析事件變得越來越困難。網民非理性、易激動的特點導致網路輿情的偏激和情緒化,網路的「群體極化」被放大。大數據時代的輿情監測是建立在傳統人工和軟體無法進行的全網輿情信息採集的基礎上,樣本擴大到全體。通過運用大數據技術,建立網路輿情自動分析系統,避免因數據源不全面而造成的重要信息監測缺失,將有利於消弭「盲人摸象」現象。與此同時,由於信息化應用水平參差不齊,政府和企業不同的部門之間都存在「信息孤島」問題:有多少個部門就有多少個信息系統,每個系統都有自己的資料庫、應用軟體和用戶界面,完全是獨立的體系,阻礙了數據的互通互聯[6]。變革大數據時代網路輿情管理的工作模式,統一輿情行業的技術標准,共享數據,建立網路輿情服務聯盟,統籌政府、企業、媒體及社會力量,實現網路輿情的多元共治將有利於解決「信息孤島」問題。
三、大數據時代網路輿情管理的變革路徑
當大數據給各行各業帶來變革性影響時,全世界都沒做好迎接這場產業革命的准備。但與英美等發達國家相比,中國更像是處在大數據時代的前夜。而中國的人口和經濟規模決定了中國大數據的規模為全球最大,為中國抓住時代的脈搏進行改革提供了難得的機遇。在這種大背景下,大數據對傳統輿情管理也產生了深刻的影響,要使網路輿情管理變革產生應有的預期效應,適應時代的發展要求,須從思維觀念、方法手段、體制機制、技術保障、人才建設等路徑著手。
(一)樹立大輿情觀念。大數據時代網路輿情管理的變革,首要在於樹立大輿情觀念。這里的大輿情,包括兩層含義。第一,強調「大數據觀」,即充分實現網路數據平台的開放共享。按照「一切皆可量化」的大數據邏輯,一個新增的相關性數據的產生,通常會帶來一個新的分析結果。因此只有形成「大數據觀」,實現數據的動態分享,才能有效防止信息「碎片化」,最大限度地消除「盲人摸象」和「信息孤島」現象。第二,強調網上和網下數據的整合。網路輿情與社會調查結合不足,可能降低輿情的真實性,誤導決策。例如,對於假期調整方案的選擇,各輿情機構組織的網路投票的結果各不相同,其做出的輿情分析報告也和真實民意相左。因此只有真正掌握「大輿情」,打撈「沉沒的聲音」,才能正確決策,打造一個更安全、更高效的社會。樹立大輿情觀念,首先,必須實現數據分析的動態化,打破數據壟斷,統一標准,共享數據,預防孤立的輿情機構閉門造車,制定片面或錯誤的輿情分析報告。其次,應把網上網下各方面數據整合起來,挖掘網路輿情與社會動態背後的深層次關系,實現網路輿情管理和社會治理的緊密聯動、同步推進[7]。最後,完善和創新包括輿情抓取、預警、研判到決策、評估等在內的網路輿情管理的各個環節,使輿情管理功能不僅僅限於危機處理,更能發揮輔助決策的作用。
(二)變革網路輿情的引導戰略。做好輿論引導工作,應把握好時、度、效。但是目前許多地方和部門對如何進行網路輿情的引導仍然缺乏正確認識,於「時」不能把握好「黃金4小時」,於「度」不能掌握火候,拿捏分寸,於「效」不能保證網路輿情引導的實效質量。大數據由於自身具有的特點,使其利於變革網路輿情的引導戰略,變「封改刪」、「鴕鳥戰術」為「網上引導,網下落地」,使「偽輿情」失去生存的土壤。因此,我們要充分發揮大數據的優勢來提高輿情引導工作的能力。其一,利用大數據提升網路輿情引導的預見性和目的性。通過數據抓取和相關性分析,構建網民意見傾向分析模型,了解網民的偏好和特點,建設和完善政府網站、官方微博,扶植和藉助意見領袖,做到「善說話、說對話、接地氣、辦實事」。其二,通過數據的價值轉化,實現網路輿情的價值引導。在充分收集相關數據的基礎上,運用圖表等數據可視化技術揭示事件的前因後果,讓數據「發聲」,使網民既「知其然」也「知其所以然」,從而全方位360度無死角了解事件的來龍去脈,消除「盲人摸象」現象。其三,提升輿情引導的公信力。一方面加強新老媒體間的互動,發揮各自的優勢與公眾溝通,破解謠言和流言,達到時效性和權威性的雙重保障;另一方面要避免輿情分析師在處理數據的過程中受經驗偏好的影響,並防止大數據淪為某些機構和個人更便捷地操縱輿論的手段。
(三)健全大數據輿情管理體制機制。當前,網路輿情管理的體制機制尚不完善,很多地區尚不具備系統規范的輿情應對與處理的管理體系。輿情分析和預測手段落後,危機應對系統缺失,輿情管理組織機構不健全、不穩定,以及多頭管理等問題非常普遍。健全大數據輿情管理的體制機制,對於從源頭上解決網路輿情管理過程中出現的問題和困難,實現標本兼治,具有決定性作用。因此,為使網路輿情管理取得實效,提升網路輿情工作的規范化和科學化水平,我國應加快建立健全大數據輿情管理的體制機制。首先,建立網路輿情多元管理的互動機制,由國家出台大數據發展戰略規劃,產學研相結合,統籌政府、企業、社會和公民的力量,形成合力,實現共治。其次,變革網路輿情管理的機構設置,改變以往通過臨時組建領導小組或臨時辦公室等機構,或者以宣傳部門為「消防隊」等方式被動應對輿情危機的模式,通過常態化機構的設置和專業人員的配備,使網路輿情管理專門化、精細化。再次,建立權責明確的責任機制,通過加快數據立法進程明確各級各部門包括政府部門、企業媒體、人民團體等的權利義務;通過建立由網信部門牽頭的大數據輿情管理體制,改變多頭管理的局面,並設立政府首席信息官責任制度等。最後,健全大數據網路輿情管理的資源保障機制,大數據時代變革網路輿情管理面臨初期成本高、短期效益不明顯等問題,需要加大資金、技術、物資、人力等資源的投入。
(四)創新大數據網路輿情管理的方法與技術。大數據時代的到來,要求網路輿情管理必須採用更為先進的技術,這主要表現在對各種相關軟體的大量應用以及對大數據技術支撐平台的依託。目前中國網路輿情監測採集軟體中較具代表性的有TRS互聯網輿情信息監控系統、北大方正智思輿情監控系統、軍犬網路輿情監控系統、樂思網路輿情監測系統等。此外,還應完善和創新大數據技術支撐平台的五大基石——數據監測技術、數據挖掘技術、數據存儲技術、數據分析技術、數據安全技術,使大數據為網路輿情管理服務的同時又不超出我們的控制。同時,我們也不能陷入「技術是萬能的」誤區而盲目迷信和依賴技術,更不能因相信大數據強大的預測功能而導致「數據獨裁」,變成數據的奴隸。因此,網路輿情管理還需要依靠其他方法和手段相輔相成,共同作用。法律因其具備最大的強制性和權威性,成為最有效的管理控制的手段。法律與道德相互聯系,在極具復雜性和特殊性的虛擬空間里,教育和自律被擺在重要的位置上。例如,歐美發達國家如美國、英國、加拿大等都通過倡導用戶自律和自我管理來提高網民的媒介素養,加強自我把關能力。此外,還可以效仿韓國、新加坡等運用行政手段,要求網路用戶在獲得國家有關部門頒發的許可證的情況下,才能訪問政府嚴格控制的信息等。
(五)培育大數據時代的網路輿情管理人才。大數據時代的網路輿情將會形成多向度的研究,例如對社會話語表達、社會心理描繪、社會關系呈現、社會訴求預測等的分析研究。網路輿情將真正成為一門與多學科交叉的社會顯學,對人才的全面性要求很高。中國教育的學科劃分和培養體系,客觀導致培養出來的人才很難跨界。換句話說,真正進入這個行業的門檻是很高的。正因如此,各國越來越重視對數據科學家的培養,如美國在大學專門開設研究大數據技術的課程,通過嚴格的業務培訓和職業資格認證,培養下一代的數據科學家。2013年9月,我國人社部聯合人民網啟動「網路輿情分析師職業培訓計劃」,「網路輿情分析師」成為一項被正式認可的職業。但是我國現有輿情工作人員的水平仍然嚴重滯後,很多輿情機構尤其是地方政府並沒有專業的數據處理、分析團隊和專門的網路輿情管理部門。為突破大數據時代變革網路輿情管理的人才瓶頸,從短期看,可以通過招考、錄用等方式引進數據挖掘、分析人才,通過委託培養、網路培訓等方式強化已有專業人才力量,通過購買服務的方式短期租賃大數據輿情管理的高素質人才。從長遠看,則要系統梳理網路輿情管理所需人才目錄,培養和壯大既精通數據挖掘、數學建模,又擁有較高學習能力、分析能力和知識水平,橫跨統計學、社會學、計算機學、傳播學、管理學等學科的復合型人才,打造一支大數據網路輿情管理的專業人才隊伍。
以上是小編為大家分享的關於大數據時代網路輿情管理變革探討的相關內容,更多信息可以關注環球青藤分享更多干貨
⑵ 大數據的價值如何體現
大數據的價值如何體現_數據分析師考試
進入大數據時代,運營商應用大數據發展的驅動因素是什麼,是否需要建立新型資料庫? 劉偉光: 隨著通信行業的競爭日益激烈,傳統的語音和簡訊等主營收入的利潤不斷下滑,導致運營商必須找到新的利潤增長點,同時有效控制運營成本,從而使自身可以在激烈競爭中立於不敗之地。這也是為什麼運營商把實現精準化營銷和精細化運營提升到戰略層次的重要原因。
此外,傳統資料庫技術已無法滿足運營商對大數據充分利用的需求。新型資料庫應該具備如下特點:首先應該採用支持大規模並行處理的分布式架構;其次,應該使用基於符合工業標準的開放硬體和系統平台,保證成本可控;第三,隨著開源技術不斷成熟,創新速度快,新型資料庫平台應該易於與新的開源技術進行融合;第四,新的資料庫平台應該可以實現與Hadoop平台的無縫集成,實現跨結構化、半結構化、非結構化海量數據的混合分析能力。 盧東明: 運營商目前試圖做新型資料庫,但是不太現實,首先資料庫公司一直以來都是很穩定的幾家,需要長期積淀。
其次,大數據不是取代以前的技術,而是混合補充使用,不是新型資料庫出來後,就完全替代傳統資料庫從而大規模使用。資料庫是核心、穩定的技術,大數據是開源的軟體技術,運營商還是會選擇使用相對成熟的軟體。 《通信世界周刊》: 大數據今年以來得到格外關注,目前發展狀況如何? 盧東明: 大數據在運營商的業務中早就有應用,目前在各個省都得到普遍應用了。大數據這個詞目前有些炒作成分,它和以前的資料庫不是完全脫節的,是對資料庫的延伸。大數據是個現象,是資料庫的另一個形態,不是否定、顛覆之前的資料庫形態。
目前做大數據的廠商依然是以前那幾家數據廠商,不同的產品解決不同的問題。在中國電信行業,從數據量和應用角度來看處於世界領先地位,這是由於電信用戶多、規模大,電信業遇到的問題和挑戰比較大,解決方案難度高。 劉偉光: 目前中國三個電信運營商在業務支撐領域、網管IT支撐領域包括增值業務領域,已經隨著市場的需求推出了很多新的大數據實時分析的項目,相信未來的兩到三年這個市場將會成倍增長,甚至會到達我們今天不能預期的數量。 需要分析共享大數據的管理工具 《通信世界周刊》: IT企業如何依託大數據為運營商提供管理工具,提升運營效率? 劉偉光: 實現各部門的緊密協作永遠都是提升運營效率的不二法門。而IT企業應該為運營商提供實現緊密協作、分析、共享大數據的管理工具,來達成提升運營效率的目標。
此外,大數據時代,IT企業僅僅為運營商提供分析平台、分析工具是不夠的。這是因為運營商雖然很了解業務和需求,但普遍缺乏數學建模能力,因此很難利用好這些平台,使其發揮最大效益。所以,如何利用這些平台、系統和數據實現科學建模,同樣是提升運營效率的關鍵所在。 武新: 運營商要解決數據處理效率問題,現在的數據用以前的系統處理需要一天一夜,而應用大數據技術處理可以一個小時完成。在大數據平台,應用雲技術,通過集群的方式,幾十台伺服器同時工作,並進行壓縮數據來節省空間。
目前大數據主要是針對結構化數據的應用,用戶上哪個網,停留多長時間,通過分析都可做相應的分析結果推送給相關部門。除了對用戶上網行為分析,還有網路使用情況、網路設備情況和用戶使用手機類型分析。而對非結構化的數據,如視頻和圖片,目前分析得還較少。 《通信世界周刊》: 大數據具體應用於運營商的哪些業務中,有哪些成功的應用和案例? 盧東明: 大數據主要應用在運營商的「信令」系統分析上,由於其數據量非常大,比「話單」分析的挑戰大很多。移動互聯網發展起來之後,運營商開始關注大數據,進行「用戶行為分析」,根據人群分析做精準營銷,推薦流量套餐。
此外,運營商提供IDC服務,通過「雲」中心的方式為互聯網企業提供服務。 武新: 運營商從最近兩三年開始,感受到這方面的壓力,開始尋求解決方案。中國移動「信令」分析系統項目對海量數據進行分析和挖掘;中國聯通對「話單」數據進行用戶行為分析。中國電信「新一代資料庫」產品正在測試中,通過精分系統,進行精準營銷。此外,在運營商專網也已應用大數據。運營商目前仍處於測試探索中,通過幾種方法針對不同的應用進行測試、篩選。
目前運營商的相關項目有「流量分析」、「智能管道」和「新一代資料庫」產品等,傳統的資料庫面對海量數據已經無法支撐,將來會慢慢被大數據代替掉。 要有開放的心態 《通信世界周刊》: 發展大數據需要解決哪些問題,關鍵點是什麼? 盧東明: 由於數據分析要看存儲效果,涉及到效率和速度。目前運營商應用大數據存在的問題是避免無限制的花錢。另一方面,運營商要和廠商合作,針對不同的業務類型和應用場景,採取不同的分析方法。此外,運營商要有開放的心態,因為大數據作為開源的軟體也不是可以解決所有的問題的。 武新: 在數據處理上,運營商轉型中不僅有技術上的問題,還需要經歷一個時間階段和過程。
此外,運營商要轉變思維方式,其在數據分析上的經驗不如互聯網企業,這是方法論問題,關繫到如何用數據做生意。運營商以前都是依託傳統業務,海量數據的出現,使得行業即將洗牌,運營商不得不轉型重視數據挖掘。 但運營商可以發揮自己的優勢,首先,要分析用戶行為的變化,由分析以前的語音用戶轉變為分析上網行為。其次,運營商有能力提供類似互聯網公司的服務,如QQ聊天。
最後,運營商有專網資源,有自己的數據中心可以運維,但是目前這些優勢還沒有完全發揮出來,是因為還沒把握透用戶的需求。
以上是小編為大家分享的關於大數據的價值如何體現的相關內容,更多信息可以關注環球青藤分享更多干貨