李飛飛資料庫
『壹』 未來人工智慧高度普及,對我們家居生活有著怎樣的影響
人工智慧的發展歷程
· 1945艾倫圖靈在論文《計算機器不智能》中提出了著名的圖靈測試,給人工智慧的収展產生了深遠的影響。
· 1951年,馬文·明斯基(Marvin Minsky)和迪恩·愛德蒙(Dean Edmunds)建立了"隨機神經網路模擬加固計算器"SNARC。
· 2018年人工智慧成為最熱門的科技話題之一,未來商業價值顯著,人才需求近一步擴大。
人工智慧在各行各業的應用
人工智慧如何解決行業痛點
· 安防:利用計算機視覺技術和大數據分析犯罪嫌疑人生活軌跡及可能出現的場所
· 金融:利用語音識別、 語義理解等技術打造智能客服
· 醫療:智能影像可以快速進行癌症早期篩查, 幫助患者更早収現病灶
· 交通:無人駕駛通過感測器、 計算機視覺等技術解放人的雙手和感知
· 零售:利用計算機視覺、 語音/語義識別, 機器人等技術提升消費體驗
· 工業製造:機器人代替工人在危險場所完成工作 ,在流水線上高效完成重復工作
『貳』 學人工智慧應該選什麼專業
人工智慧技術關繫到人工智慧產品是否可以順利應用到我們的生活場景中。在人工智慧領域,它普遍包含了機器學習、知識圖譜、自然語言處理、人機交互、計算機視覺、生物特徵識別、AR/VR七個關鍵技術。
一、機器學習
機器學習(MachineLearning)是一門涉及統計學、系統辨識、逼近理論、神經網路、優化理論、計算機科學、腦科學等諸多領域的交叉學科,研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的性能,是人工智慧技術的核心。基於數據的機器學習是現代智能技術中的重要方法之一,研究從觀測數據(樣本)出發尋找規律,利用這些規律對未來數據或無法觀測的數據進行預測。根據學習模式、學習方法以及演算法的不同,機器學習存在不同的分類方法。
根據學習模式將機器學習分類為監督學習、無監督學習和強化學習等。
根據學習方法可以將機器學習分為傳統機器學習和深度學習。
二、知識圖譜
知識圖譜本質上是結構化的語義知識庫,是一種由節點和邊組成的圖數據結構,以符號形式描述物理世界中的概念及其相互關系,其基本組成單位是「實體—關系—實體」三元組,以及實體及其相關「屬性—值」對。不同實體之間通過關系相互聯結,構成網狀的知識結構。在知識圖譜中,每個節點表示現實世界的「實體」,每條邊為實體與實體之間的「關系」。通俗地講,知識圖譜就是把所有不同種類的信息連接在一起而得到的一個關系網路,提供了從「關系」的角度去分析問題的能力。
知識圖譜可用於反欺詐、不一致性驗證、組團欺詐等公共安全保障領域,需要用到異常分析、靜態分析、動態分析等數據挖掘方法。特別地,知識圖譜在搜索引擎、可視化展示和精準營銷方面有很大的優勢,已成為業界的熱門工具。但是,知識圖譜的發展還有很大的挑戰,如數據的雜訊問題,即數據本身有錯誤或者數據存在冗餘。隨著知識圖譜應用的不斷深入,還有一系列關鍵技術需要突破。
三、自然語言處理
自然語言處理是計算機科學領域與人工智慧領域中的一個重要方向,研究能實現人與計算機之間用自然語言進行有效通信的各種理論和方法,涉及的領域較多,主要包括機器翻譯、機器閱讀理解和問答系統等。
機器翻譯
機器翻譯技術是指利用計算機技術實現從一種自然語言到另外一種自然語言的翻譯過程。基於統計的機器翻譯方法突破了之前基於規則和實例翻譯方法的局限性,翻譯性能取得巨大提升。基於深度神經網路的機器翻譯在日常口語等一些場景的成功應用已經顯現出了巨大的潛力。隨著上下文的語境表徵和知識邏輯推理能力的發展,自然語言知識圖譜不斷擴充,機器翻譯將會在多輪對話翻譯及篇章翻譯等領域取得更大進展。
語義理解
語義理解技術是指利用計算機技術實現對文本篇章的理解,並且回答與篇章相關問題的過程。語義理解更注重於對上下文的理解以及對答案精準程度的把控。隨著MCTest數據集的發布,語義理解受到更多關注,取得了快速發展,相關數據集和對應的神經網路模型層出不窮。語義理解技術將在智能客服、產品自動問答等相關領域發揮重要作用,進一步提高問答與對話系統的精度。
問答系統
問答系統分為開放領域的對話系統和特定領域的問答系統。問答系統技術是指讓計算機像人類一樣用自然語言與人交流的技術。人們可以向問答系統提交用自然語言表達的問題,系統會返回關聯性較高的答案。盡管問答系統目前已經有了不少應用產品出現,但大多是在實際信息服務系統和智能手機助手等領域中的應用,在問答系統魯棒性方面仍然存在著問題和挑戰。
自然語言處理面臨四大挑戰:
一是在詞法、句法、語義、語用和語音等不同層面存在不確定性;
二是新的詞彙、術語、語義和語法導致未知語言現象的不可預測性;
三是數據資源的不充分使其難以覆蓋復雜的語言現象;
四是語義知識的模糊性和錯綜復雜的關聯性難以用簡單的數學模型描述,語義計算需要參數龐大的非線性計算
四、人機交互
人機交互主要研究人和計算機之間的信息交換,主要包括人到計算機和計算機到人的兩部分信息交換,是人工智慧領域的重要的外圍技術。人機交互是與認知心理學、人機工程學、多媒體技術、虛擬現實技術等密切相關的綜合學科。傳統的人與計算機之間的信息交換主要依靠交互設備進行,主要包括鍵盤、滑鼠、操縱桿、數據服裝、眼動跟蹤器、位置跟蹤器、數據手套、壓力筆等輸入設備,以及列印機、繪圖儀、顯示器、頭盔式顯示器、音箱等輸出設備。人機交互技術除了傳統的基本交互和圖形交互外,還包括語音交互、情感交互、體感交互及腦機交互等技術。
五、計算機視覺
計算機視覺是使用計算機模仿人類視覺系統的科學,讓計算機擁有類似人類提取、處理、理解和分析圖像以及圖像序列的能力。自動駕駛、機器人、智能醫療等領域均需要通過計算機視覺技術從視覺信號中提取並處理信息。近來隨著深度學習的發展,預處理、特徵提取與演算法處理漸漸融合,形成端到端的人工智慧演算法技術。根據解決的問題,計算機視覺可分為計算成像學、圖像理解、三維視覺、動態視覺和視頻編解碼五大類。
目前,計算機視覺技術發展迅速,已具備初步的產業規模。未來計算機視覺技術的發展主要面臨以下挑戰:
一是如何在不同的應用領域和其他技術更好的結合,計算機視覺在解決某些問題時可以廣泛利用大數據,已經逐漸成熟並且可以超過人類,而在某些問題上卻無法達到很高的精度;
二是如何降低計算機視覺演算法的開發時間和人力成本,目前計算機視覺演算法需要大量的數據與人工標注,需要較長的研發周期以達到應用領域所要求的精度與耗時;
三是如何加快新型演算法的設計開發,隨著新的成像硬體與人工智慧晶元的出現,針對不同晶元與數據採集設備的計算機視覺演算法的設計與開發也是挑戰之一。
六、生物特徵識別
生物特徵識別技術是指通過個體生理特徵或行為特徵對個體身份進行識別認證的技術。從應用流程看,生物特徵識別通常分為注冊和識別兩個階段。注冊階段通過感測器對人體的生物表徵信息進行採集,如利用圖像感測器對指紋和人臉等光學信息、麥克風對說話聲等聲學信息進行採集,利用數據預處理以及特徵提取技術對採集的數據進行處理,得到相應的特徵進行存儲。
識別過程採用與注冊過程一致的信息採集方式對待識別人進行信息採集、數據預處理和特徵提取,然後將提取的特徵與存儲的特徵進行比對分析,完成識別。從應用任務看,生物特徵識別一般分為辨認與確認兩種任務,辨認是指從存儲庫中確定待識別人身份的過程,是一對多的問題;確認是指將待識別人信息與存儲庫中特定單人信息進行比對,確定身份的過程,是一對一的問題。
生物特徵識別技術涉及的內容十分廣泛,包括指紋、掌紋、人臉、虹膜、指靜脈、聲紋、步態等多種生物特徵,其識別過程涉及到圖像處理、計算機視覺、語音識別、機器學習等多項技術。目前生物特徵識別作為重要的智能化身份認證技術,在金融、公共安全、教育、交通等領域得到廣泛的應用。
七、VR/AR
虛擬現實(VR)/增強現實(AR)是以計算機為核心的新型視聽技術。結合相關科學技術,在一定范圍內生成與真實環境在視覺、聽覺、觸感等方面高度近似的數字化環境。用戶藉助必要的裝備與數字化環境中的對象進行交互,相互影響,獲得近似真實環境的感受和體驗,通過顯示設備、跟蹤定位設備、觸力覺交互設備、數據獲取設備、專用晶元等實現。
虛擬現實/增強現實從技術特徵角度,按照不同處理階段,可以分為獲取與建模技術、分析與利用技術、交換與分發技術、展示與交互技術以及技術標准與評價體系五個方面。獲取與建模技術研究如何把物理世界或者人類的創意進行數字化和模型化,難點是三維物理世界的數字化和模型化技術;分析與利用技術重點研究對數字內容進行分析、理解、搜索和知識化方法,其難點是在於內容的語義表示和分析;交換與分發技術主要強調各種網路環境下大規模的數字化內容流通、轉換、集成和面向不同終端用戶的個性化服務等,其核心是開放的內容交換和版權管理技術;展示與交換技術重點研究符合人類習慣數字內容的各種顯示技術及交互方法,以期提高人對復雜信息的認知能力,其難點在於建立自然和諧的人機交互環境;標准與評價體系重點研究虛擬現實/增強現實基礎資源、內容編目、信源編碼等的規范標准以及相應的評估技術。
目前虛擬現實/增強現實面臨的挑戰主要體現在智能獲取、普適設備、自由交互和感知融合四個方面。在硬體平台與裝置、核心晶元與器件、軟體平台與工具、相關標准與規范等方面存在一系列科學技術問題。總體來說虛擬現實/增強現實呈現虛擬現實系統智能化、虛實環境對象無縫融合、自然交互全方位與舒適化的發展趨勢
『叄』 大數據幫助我們走進大腦的繽紛世界
大數據幫助我們走進大腦的繽紛世界
大數據的核心就是預測,通常被視為人工智慧的一部分或者更精確說被視為是一種機器學習。因此大數據在腦科學研究中會大顯身手,腦科學研究可使我們開發出更有效和智能化的機器學習演算法,又會反過來推動和幫助我們更好地開采大數據。
人的大腦由約1000億個神經元組成,每個神經元又和大約一千個其他神經元相連,組成了一個極其復雜的網路。在此之上,大腦還是一個動態系統,隨時間和環境在不斷變化,具有自組織、自適應和自學習的特徵。而理解和認識大腦是公認的科學的最後堡壘。一方面,現代社會進步的同時也給人們帶來巨大的心理上的壓力。據醫學權威雜志《柳葉刀》在2009年發表的對中國人群的調查發現,中國的月患精神疾病率高達17.5%。在西方社會,由於服用抗抑鬱症葯百憂靈的人群基數之大,在倫敦的自來水裡甚至發現了百憂靈的殘留物。老年痴呆是另一類困擾著我們的疾病,數據表明香港人的女性平均壽命為86.7歲,而這一年齡有約一半以上的人是老年痴呆患者。想像一下:大街上行走的老年人有一半人找不回家了,這該是怎樣的一個社會。其他腦疾病如腦卒中(俗稱腦中風)每十二秒鍾就會奪走一個中國人的性命。另一方面,腦科學的進步會推進人類社會的長足發展。我們社會可能面臨的智能化是繼第一次工業革命(蒸汽機的發明)、第二次工業革命(電氣化)和第三次工業革命(自動化)後的第四次工業革命。這次工業革命的一大特徵是擬腦化,具有一定智能的機器人的出現將是這次工業革命的一大特徵。為達到上述目的:人類更健康的生存和更舒適的生活,研究、認識和理解大腦是其中的關鍵。歐盟於2013年啟動了人類大腦計劃,這計劃投資十億歐元為期十年,意在用計算機來模擬人腦。繼歐盟之後,奧巴馬也宣布了美國大腦計劃投資45億美元,旨在記錄每個神經元活動。目前中國的腦計劃也在醞釀中。這些腦計劃的背後都有一個關鍵的問題:如何讀懂和解析出深藏在我們獲得的海量數據里的關於大腦的運行規律。這樣的數據可以是遺傳的數據,它決定了你將來的健康狀況、智力水平和大腦的結構,可以是成千上萬個神經元共同行為;它決定了你如何學習,如何對付一些突發狀況,也可以是更為粗略化的腦影像數據;它可以讓我們無創地首次觀察到每個人大腦的運行情況,或更為常見的各種認知行為指標如智商等。這些前所末有的大數據為大腦研究開啟了全新的天地,一個典型的病人可以有至少1GB的原始數據,一千個人就有1TB的數據。目前在這方面做得較為成功的是南加州的Toga教授組,他們有一個一百多人組成的研究小組從UCLA被南加州大學整個買斷;據報道,Toga教授本人也以百萬美元的年薪搬到南加州大學。自2004年以來,他們開始收集老年痴呆症的各種各樣的如前所述的數據,前後花了數億美元。但由於缺乏有效數理分析工具,在這方面一直沒有得到有顯著結果的結論,原因在於基於大數據,尋找老年痴呆病根相當於大海撈針。與他們合作,我所在團隊利用新發展的統計工具首先在這些數據中找到了可能的老年痴呆症基因和對應的損壞腦區。為了克服上述困難,Toga團隊的另一個明星教授Paul Thomson另闢蹊徑,開始了另一個被稱為「迷」的研究項目。該項目的成功之處在於它並不需要索取原始數據,Thomson為你提供了一個分析方法軟體,通過該方法在各個具有數據的小組里得到一個或數個統計分析結果,然後這些統計結果通過一種叫作薈萃分析的統計方法匯總,Thomson得到一個總的結果。通過對幾萬位病人的數據分析,他們得到了許多十分有意義的結果。「迷」項目的成功實施為大數據應用中如何克服數據獲取這一難題提供了一個很好的、值得借鑒的解決方法。近幾十年人工智慧的快速發展具體體現於一些智能演算法如深度學習的成功應用中。深度學習的成功秘訣在於:華人科學家李飛飛構建的一個大型的人臉資料庫、今天的大規模計算能力的提高。由於這兩點,深度學習在人臉識別上的精度甚至超過了人類。當然,人工智慧最看得見的應用應該是機器人,具有很強計算能力又有大型數據為依託的機器人將在我們社會智能化發展中扮演十分重要的角色。正像《大數據時代》作者維克多·施恩伯格指出,大數據的核心就是預測,通常被視為人工智慧的一部分或者更精確說被視為是一種機器學習。因此大數據在腦科學研究中會大顯身手,腦科學研究可使我們開發出更有效和智能化的機器學習演算法,又會反過來推動和幫助我們更好地開采大數據。
以上是小編為大家分享的關於大數據幫助我們走進大腦的繽紛世界的相關內容,更多信息可以關注環球青藤分享更多干貨
『肆』 對於谷歌雲而言,中國市場不重要嗎
對於谷歌雲而言,中國市場不重要嗎
我國此前也曾發布《國務院關於促進雲計算創新發展培育信息產業新業態的意見》以及《雲計算綜合標准化體系建設指南》,將雲計算提升到了國家戰略的高度。
亞馬遜AWS、微軟Azure等雲服務巨頭顯然已經看到中國市場未來在雲計算上的巨大機遇,截止目前,AWS在華兩個區域布局有數據中心,共4個可用區,據不完全估計年營收或已達到15億元人民幣,摺合約2億美元,該數字僅次於阿里雲、騰訊雲。微軟Azure在中國已有3個數據中心,雖在營收上沒有給出確切數據,但通過與世紀互聯的合作,微軟Azure在中國已有11萬企業客戶,1 400多個雲合作夥伴,入華成效顯著。
競爭對手對中國雲計算市場不斷拋出的橄欖枝,置若罔聞、視若無睹都不會成為谷歌雲的最佳選擇。谷歌在雲計算上的「淡定表現」是一種假象還是在谷歌的整體戰略中,雲計算只是個「配角」?
谷歌的雲計算是個配角嗎?
如果要論雲計算在谷歌發展戰略中的地位,我們可能需要從谷歌的企業文化說起。20年前,拉里·佩奇和謝爾蓋·布林在加利福尼亞的山景城創辦了谷歌,兩位創始人雖然性格迥異,但在如何管理公司或谷歌未來應該朝著哪個方向發展上卻有著驚人的共識:崇尚技術,這讓谷歌有了很深的工程師文化;崇尚創新,又使谷歌的「登月」文化傳承至今;夢想改變世界的大情懷,又讓谷歌的各項業務不因短時的利益而改變航向。
因此,兩位所向披靡的谷歌創始人帶領谷歌涉足了一切他們可以涉足的領域,只要有創新、只要他們認為對未來有益,谷歌就會去做,這就有了我們看到的谷歌無人駕駛汽車、谷歌眼鏡,甚至是谷歌收購的Youtobe等等。於是,當我們將谷歌的雲計算業務放在谷歌整個產品生態中去的時候,谷歌雲就稍顯渺小。
谷歌旗下的產品分為三大類,針對消費者的「人人適用」類,針對企業客戶的「企業適用」類,針對開發者的「開發者適用」類,看起來產品圖譜很簡單,但如果把每類下的產品數量相加,谷歌的總產品數量則有110種之多。然而,谷歌的雲計算業務沒有被單獨歸為一類,外界通常籠統地將谷歌雲端平台、谷歌G Suite等統稱為谷歌雲業務,在谷歌一年一度的財報中,也鮮有提及「谷歌雲」,而是把它歸到了「其他收入」行列。
值得考慮的是,谷歌母公司Alphabet2017年度營收超1000億美元,谷歌雲的營收只佔到了4%(實際佔比可能比這個更少),谷歌公司的營收大王——廣告業務,其2017年營收佔到了谷歌總營收約90%。對比AWS已被亞馬遜宣稱成為營收主力,谷歌雲的地位確實有不小落差。一言以蔽之,有了廣告業務這個收入引擎,谷歌董事會們並沒有指望雲計算能給他們賺多少錢。
如果用「雲計算不重要」來形容谷歌雲的戰略地位又不太恰當。因為2015年穀歌CEO桑達爾·皮查伊(Sundar Pichai)請來了重量級人物,企業計算巨頭VMware(現已被戴爾科技集團收購)創始人黛安·格林(Diane Greene)加入谷歌,擔任谷歌雲CEO(Google Cloud CEO)。在隨後的2016年穀歌消費者大會上,黛安·格林宣布正式啟用Google Cloud 谷歌雲,谷歌雲的征途由此開始。
在戴安·格林的帶領下,谷歌雲產品目前已覆蓋計算、存儲和資料庫、網路、大數據、物聯網、機器學習、身份驗證與安全、管理工具、開發者工具等九大方面。今年2月,谷歌首次就雲計算部門的營收進行了宣布,戴安·格林表示2017年穀歌雲的季度營收已經達到10億美元,按此推算谷歌雲年營收最高達到40億美元,位於國際巨頭亞馬遜AWS 2017年度營收175億美元之後,卻排在中國體量最大的雲服務商阿里雲2017年度營收17.85億美元之前。
此前,戴爾·格林還在演講中透露,拉里·佩奇等谷歌董事會高層都為谷歌雲2017年取得的成就感到興奮,並正在籌備雲計算相關企業的收購事宜。如此看來,谷歌對雲計算的態度大致明了:不打算靠雲計算賺錢,但可能在謀劃繼續往裡面砸錢,不急不躁,小步慢跑。
2016年11月,世界人工智慧頂級專家李飛飛加入谷歌,擔任谷歌雲人工智慧機與器學習首席科學家(Chief Scientist, Cloud AI & ML),這里谷歌將「Cloud(雲計算)」、「AI(人工智慧)」、「ML(機器學習)」融合成了一個詞,簡稱為「Cloud AI & ML」。可以看出,這位深耕人工智慧、機器領域的科學家將會於「谷歌雲」有著千絲萬縷的聯系。
(重組後的Alphabet組織架構圖,僅供參考)
2015年穀歌母公司Alphabet啟動企業結構重組,2017年完成重組後,「Cloud」作為一個單獨的部門位列其中。AI或ML沒有單獨成立部門,原因或許在於Alphabet的各個子公司中,無論是神秘的谷歌X實驗室、人工智慧Deepmind,還是無人駕駛汽車項目Waymo都離不開AI&ML,也就是說對於谷歌各項子業務,AI&ML都作為底層支撐,無需單獨成立部門。
對於谷歌雲也是如此。李飛飛這位以研究AI&ML擅長的首席科學家被冠以「Cloud AI & ML」的頭銜,她工作關鍵將是把AI&ML深度融進雲計算。
李飛飛也這么做了,她的第一站就是中國。
2017年12月,在上海舉行的谷歌開發者大會上,李飛飛宣布「谷歌AI中國中心」正式成立,那天她身著一件中國紅風格的旗袍短袖侃侃而談。李飛飛是谷歌雲官網掛出的十位高管中唯一一位華人面孔,這個身份或許與谷歌選定其為Cloud AI & ML首席科學家不無關系。
在2018年3月,谷歌 Cloud Next 17上,李飛飛發布了谷歌雲面向機器學習和人工智慧的一系列新API 以及收購機器學習競賽平台Kaggle。
之後谷歌雲可能還會藉助「谷歌AI中國中心」進一步壯大其在中國的雲計算業務,這一天希望不會等太久。
谷歌這次會妥協嗎?
2010年,谷歌搜索業務退出中國的事件,現在想想仍然心有餘悸。關於谷歌退出中國的原因外界說法很多,一種聲音認為,谷歌單方面確認其遭受來自中國黑客的網路攻擊;另一聲音,谷歌在與中國本土搜索引擎網路爭搶份額的過程中敗下陣來,倉皇逃脫;還有一種聲音則是因為,谷歌無法接受中國政府提出的「內容審查」要求;另外,也有人指出,是李開復的離職,讓谷歌缺乏一個中國區領導者,致使其無法本土化。
總之,谷歌最後選擇了不妥協。
然而這次,谷歌雲將經受的來自中國政府的考驗相對更加嚴峻,因為涉及到了中國用戶的數據問題。中國《網路安全法》對數據主權做了規定,即數據要採取本地化存儲,對於本國或者外國公司在採集和存儲與個人信息和關鍵數據相關數據時,必須使用主權國家境內的伺服器。
無論是亞馬遜AWS還是微軟Azure、蘋果icloud等跨國公司巨頭都已經選擇順應中國政府的要求,與中國本地公司合作,基礎設施交由中國公司運營,蘋果icloud甚至將鑰匙串一並遷移回中國。谷歌雲會跟它的競爭對手們一樣選擇妥協嗎?谷歌雲的華人領導者李飛飛能否帶領谷歌雲歸航?
谷歌創始人拉里佩奇曾表示:「企業只以盈利為目的,而不為改變世界做出貢獻,就不能成為另人滿意的企業」。在谷歌的整個生態中,「現在」與「未來」是兩個明顯的分界線。谷歌的營收大王廣告業務是「現在」,而「未來」則是人工智慧、無人駕駛等一切可以讓人類變得更好的技術,當下,谷歌將「雲計算」也劃分到了「未來」里。
「非盈利」的想法可能不會使谷歌雲選擇快速攻入中國市場,它的步伐用「培育雲計算「可能比用「佔領市場」更為貼切。
『伍』 人工智慧領域哪些高校實力強
高校建立的實驗室與大公司有所不同,其研究項目除了偏應用科學的領域,還有一些屬於基礎理論研究的項目,是無法從具體的產品上表現的,通常高校實驗室會同時進行兩種領域的研究甚至側重後者,考慮到高校在學術界的地位,人們在關注實驗室研究內容的時候除了關注它的產品,同時也應該注意其在基礎研究領域的水平。
麻省理工學院
MIT的人工智慧實驗室全稱叫CSAIL (ComputerScience and Artificial Intelligence
Laboratory)。最初,這是兩個實驗室:計算機實驗室創辦於1963年,人工智慧實驗室創辦於1959年,兩個實驗室在2003年正式合並。
CSAIL是MIT最大的實驗室,也是世界上最重要的信息技術研發中心。CSAIL的成員創立了多於100家知名公司
,包括機器人之父科林·安格爾,iRobot公司創始人之一海倫·格雷納,波士頓動力公司創始人馬克·雷伯特,還有卡內基·梅隆大學機器人研究所的負責人馬特·梅森。
MIT也幾乎是頂尖技術的代名詞。它在去年底發布了2015年CSAIL的主要創新,包含3D列印心臟,可以爬樓梯、開門甚至駕車的機器人,癌症預測工具等。
『陸』 有哪些資料庫公司參加了數據技術嘉年華(DTC)
本屆DTC主論壇一共有七位分享嘉賓,每一位都是資料庫行業的領袖,他/她們是:蓋國強、李飛飛、蘇光牛、趙培、王義成、黃東旭、陽振坤、任永傑、林韶賓(萬里開源GreatDB)
『柒』 OceanBase那麼厲害,為什麼不去和Oracle競爭,搶占企業市場的市場份額
因為干不過 吹出來的 給不懂的人看而已 1500多個節點的分布式架構和人家10年前27節點rac比!別忘了你用的ssd 人家還是機械盤!
阿里巴巴旗下的資料庫OceanBase屢屢在國際上獲得資料庫競賽大獎,不少人就要問了,既然OceanBase這么厲害,為什麼阿里巴巴不去搶佔Oracle的市場份額呢?
OceanBase競賽結果有片面性、功能還不夠完善事實上在阿里系內部,也只有螞蟻金服是真正在大規模使用,在阿里系內部其他團隊已經有三大資料庫,X-DB是阿里集團資料庫團隊搞的,PolarDB是阿里雲團隊、也就是李飛飛博士負責的,OceanBase是螞蟻金服資料庫團隊搞的,現在阿里內部已經推進了X-DB和PolarDB的全面融合,李飛飛博士領導的PolarDB團隊將會立足長遠,是下一代資料庫系統,未來阿里雲的業務有多廣,PolarDB要面對的業務場景就有多復雜。
OceanBase最大的優勢在於這是阿里真正完全自研的資料庫,跟阿里雲一樣,是從頭到尾完全自研的,當然這個完全自研到底到底有沒有水分我們並不知道。大家了解OceanBase就是之前的打比賽,不過OceanBase佔了分布式的光,吃了硬體的便宜,加上最近十年Oracle已經不來打比賽了,阿里本質上是跟十年前的Oracle在比,軟硬體技術都不在同一個起點上,這也是這個競賽結果有很大片面性的根本原因。在單機性能方面,Oracle依然要更強一些,穩定性就更不用說了,Oracle已經穩定運行了這么多年。
OceanBase之所以還沒辦法跟Oracle競爭,是因為OceanBase還沒有那麼強,也還有非常多需要完善的地方,功能上還有很多不足,在阿里內部資料庫分化也還比較明顯,OceanBase在跟另外的產品競爭當也,沒有優勢。
OceanBase「專屬性」明顯、開源後閉源,企業要穩定、企業也不都是阿里OceanBase更多的還是圍繞螞蟻金服自己的業務在做,現在除了阿里系內部在使用,真正的商業化用戶也就只有PICC、南京銀行兩個比較大,是在真正使用OceanBase,客戶群體還太小太小,樣本數量確實還不夠大。
OceanBase之前其實是開源了的,不過後來又閉源了,在商業化過程中也遇到了一些問題,這個操作當時其實就嚇到了很多人,OceanBase閉源之後的版本跟原來的差距非常大的。OceanBase更適合處理互聯網業務,跟傳統企業業務契合度並沒有那麼高,Oracle的很多功能OceanBase都還不具備,OceanBase的生態、工具、技術支持還差很多很多。oceanbase是為大規模事務處理准備的分布式系統,聽起來很強大,但是真的不夠接地氣。
OceanBase針對阿里的業務進行了深度優化和定製,這就讓OceanBase在通用性上有了很大的阻礙。可是在其他企業就很難的,阿里有很好的技術團隊,他們也可以為了業務做出專門的調整,阿里有這樣的能力和資源,但是小企業沒有這樣的配置,尤其是傳統企業根本不可能做這樣的事情。大家更希望系統是穩定好用的,拿過來就可以直接用的,你現在又不開源了,用戶擔心更大,還不如繼續用穩定的Oracle資料庫。
技術這東西吧我還是喜歡說句實話,不是你自己說你有多厲害就真的多厲害,還得是實際場景的應用才行。就像網路一樣,好像這些年大家也不吹網路了,但是春晚一戰,網路成為唯一一個扛住了春晚流量洪峰的企業,技術實力業內人都看得明白。OceanBase做得很好,但是也沒有那麼好,至少是目前應用還沒有那麼好。
早就在競爭了!
實際上阿里雲的OceanBase資料庫系統在推出以後,實際上就已經開始商業化運作了,就在不斷的從甲骨文公司手裡面搶到更多的企業級應用市場了。
OceanBase確實很先進近日,在資料庫領域內,OceanBase資料庫又打破了世界記錄,直接創造了7.07億TPMC的新世界記錄。
從OceanBase的功能和速度來看,現在OceanBase是世界領先的資料庫產品,在被譽為「資料庫領域世界盃」的國際權威TPC-C測試中,OceanBase性能分數打破Oracle多年壟斷,不斷創造新的世界記錄。
而且OceanBase採用新一代分布式處理技術,顛覆了傳統資料庫集中式技術架構,尤其適應了互聯網持續擴張的數據處理需求。
正是OceanBase資料庫的可擴容的特點,也降低了用戶的使用成本,而且又擁有很高的速度,因此,現在OceanBase在企業市場中的份額是越來越大了。
現在阿里雲市場份額很大阿里雲市場份額不斷擴大。根據國際研究機構Gartner發布最新雲計算市場追蹤數據,阿里雲亞太市場排名第一,全球市場排名第三。在全球市場份額中,阿里雲僅次於美國的亞馬遜和微軟公司。
阿里雲從2018年到2019年,在全球市場份額從7.7%上漲至9.1%,進一步拉開與第四名谷歌差距,擠佔了不少亞馬遜的份額。而在亞太市場,阿里雲的份額更大,從2018年的26%上漲至2019年的28%,接近亞馬遜和微軟公司的總和。
現在阿里雲的服務其中一項最重要的就是資料庫的服務,也就是OceanBase資料庫的服務。
實際上,從2015年,OceanBase資料庫推出以後,淘寶和支付寶系統就開始了去IOE,開始上雲,然後好多銀行的金融服務也開始去IOE,上雲。這些實際上都是開始拋棄甲骨文資料庫系統了。到現在為止,通過上雲使用OceanBase資料庫資料庫的企業和公司就更多了。
結論綜上所述,OceanBase資料庫早就在跟甲骨文公司進行競爭了,現在阿里雲的份額在全球排在第三名,阿里雲其中最關鍵的應用就是OceanBase資料庫的應用了。
OceanBase其對標的是亞馬遜的Aurora,你要目前去和Oracle競爭,這個目前還不對等。
OceanBase滿打滿算10年的時間,Oracle呢,40多年了。目前大的企業,像銀行、電信這些核心企業,基本上是Oracle的天下,也有Sybase、DB2、SQLServer。其實還是那幾個巨頭在玩,甲骨文、微軟、IBM、SAP,這些可都是企業服務領域的巨頭。
聽到DB2(IBM)是不是有人覺得老土了,但是現實就是還有很多系統在用,為什麼呢?因為有些系統要切換資料庫,估計要出大問題。
互聯網公司反而在這方面投入不高,那就用像MySQL這種開源的,最先MySQL被SUN公司收購了,現在SUN又被Oracle收購了,所以還是Oracle旗下的。
Oracle之所以這么強勢,就是因為其產品的穩定性,尤其是金融類機構,一點數據問題都不能出,否則你銀行里只有100塊,花出去了101塊,這個問題就大了。你可以想下,幾十年,遍布全球的金融類機構,大部分只敢用Oracle,就是因為產品穩定。而且這么長時間的技術積累,問題解決經驗,這個真的不是說自研就解決的。
伴隨著雲服務的大趨勢,幾個主要的雲服務提供商,亞馬遜、阿里、騰訊都在發力資料庫,像淘寶、微信這種大的國內應用,本身必然會要求其資料庫團隊越來越強大。
OceanBase其實也在慢慢的搬運Oracle的客戶,但是這個急不得。其實在市場定位上,國內的大量互聯網公司並沒有使用Oracle,因為太貴了。所以這部分客戶才是OceanBase的主要目標。
Oracle代表的是雲服務以前的頂峰,而且目前看想替換不是幾年的事情。新的OceanBase伴隨著雲服務的擴展,必然一步步的能取得更多的市場份額。阿里雲發展必然能帶動OceanBase的快速發展。
慢慢來吧,數據要的是穩定。
第一,oceanbase是否比Oracle強並不能完全肯定,Oracle這么多年的發展形成了完整的生態,讓大多數人熟悉了他那一套,oceanbase應該說在一些場景下比Oracle強,尤其分布式方面,因為他這方面在自身業務驅動下更加突出。
第二,Oracle的客戶基本上是規模型企業,且一般用於核心業務系統上,切換成本很大,風險很大,做這樣的決策是非常困難的。
第三,人才培養沒有那麼快,切換oceanbase沒有多少人會,培訓學習和運營管理都需要時間
第四,阿里發展重心不是這種產品銷售模式,Oracle這種模式需要大量的營銷團隊和服務支持團隊
第五,阿里時機還未到,先通過雲服務不斷發展客戶完善產品,後期根據自身的發展策略可能會決定面向客戶銷售
銀行 金融 政府等行業是不會去嘗試新技術的 他們要的是穩定 可靠 打個比方 銀行每天流水 1個億 用新系統 花錢了 而且出了問題 損失了 誰負責?!花錢不討好!銀行也不差那點軟體版權費!
應用場景差別很大,分布式系統維護成本很高。這和外國寧願買二手F16,也不願意采購殲10一樣,更何況,OB確實還不如Oracle。
但是現階段貿易戰,已經消除了Oracle的空間,正是OB等系統的機會
如你所願。
oceanbase最近獨立運營了,開始發力推廣。先把TPC-C基準測試排名達到世界第一。(第二也是自己,這次是二刷)
然後最近剛剛開源。把300萬核心代碼都開源出來。大家可到github上查看。
金融領域繼續發力。和合作夥伴一起做去O。盡量能兼容Oracle,讓客戶無損切換到oceanbase上來。
相信不遠的將來,中國企業都能用上國產高性能資料庫。