当前位置:首页 » 操作系统 » 李飞飞数据库

李飞飞数据库

发布时间: 2022-08-31 05:45:15

‘壹’ 未来人工智能高度普及,对我们家居生活有着怎样的影响

人工智能的发展历程

· 1945艾伦图灵在论文《计算机器不智能》中提出了着名的图灵测试,给人工智能的収展产生了深远的影响。

· 1951年,马文·明斯基(Marvin Minsky)和迪恩·爱德蒙(Dean Edmunds)建立了"随机神经网络模拟加固计算器"SNARC。

· 2018年人工智能成为最热门的科技话题之一,未来商业价值显着,人才需求近一步扩大。

人工智能在各行各业的应用

人工智能如何解决行业痛点

· 安防:利用计算机视觉技术和大数据分析犯罪嫌疑人生活轨迹及可能出现的场所

· 金融:利用语音识别、 语义理解等技术打造智能客服

· 医疗:智能影像可以快速进行癌症早期筛查, 帮助患者更早収现病灶

· 交通:无人驾驶通过传感器、 计算机视觉等技术解放人的双手和感知

· 零售:利用计算机视觉、 语音/语义识别, 机器人等技术提升消费体验

· 工业制造:机器人代替工人在危险场所完成工作 ,在流水线上高效完成重复工作



‘贰’ 学人工智能应该选什么专业

人工智能技术关系到人工智能产品是否可以顺利应用到我们的生活场景中。在人工智能领域,它普遍包含了机器学习、知识图谱、自然语言处理、人机交互、计算机视觉、生物特征识别、AR/VR七个关键技术。

一、机器学习
机器学习(MachineLearning)是一门涉及统计学、系统辨识、逼近理论、神经网络、优化理论、计算机科学、脑科学等诸多领域的交叉学科,研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,是人工智能技术的核心。基于数据的机器学习是现代智能技术中的重要方法之一,研究从观测数据(样本)出发寻找规律,利用这些规律对未来数据或无法观测的数据进行预测。根据学习模式、学习方法以及算法的不同,机器学习存在不同的分类方法。
根据学习模式将机器学习分类为监督学习、无监督学习和强化学习等。
根据学习方法可以将机器学习分为传统机器学习和深度学习。

二、知识图谱
知识图谱本质上是结构化的语义知识库,是一种由节点和边组成的图数据结构,以符号形式描述物理世界中的概念及其相互关系,其基本组成单位是“实体—关系—实体”三元组,以及实体及其相关“属性—值”对。不同实体之间通过关系相互联结,构成网状的知识结构。在知识图谱中,每个节点表示现实世界的“实体”,每条边为实体与实体之间的“关系”。通俗地讲,知识图谱就是把所有不同种类的信息连接在一起而得到的一个关系网络,提供了从“关系”的角度去分析问题的能力。
知识图谱可用于反欺诈、不一致性验证、组团欺诈等公共安全保障领域,需要用到异常分析、静态分析、动态分析等数据挖掘方法。特别地,知识图谱在搜索引擎、可视化展示和精准营销方面有很大的优势,已成为业界的热门工具。但是,知识图谱的发展还有很大的挑战,如数据的噪声问题,即数据本身有错误或者数据存在冗余。随着知识图谱应用的不断深入,还有一系列关键技术需要突破。

三、自然语言处理
自然语言处理是计算机科学领域与人工智能领域中的一个重要方向,研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法,涉及的领域较多,主要包括机器翻译、机器阅读理解和问答系统等。
机器翻译
机器翻译技术是指利用计算机技术实现从一种自然语言到另外一种自然语言的翻译过程。基于统计的机器翻译方法突破了之前基于规则和实例翻译方法的局限性,翻译性能取得巨大提升。基于深度神经网络的机器翻译在日常口语等一些场景的成功应用已经显现出了巨大的潜力。随着上下文的语境表征和知识逻辑推理能力的发展,自然语言知识图谱不断扩充,机器翻译将会在多轮对话翻译及篇章翻译等领域取得更大进展。
语义理解
语义理解技术是指利用计算机技术实现对文本篇章的理解,并且回答与篇章相关问题的过程。语义理解更注重于对上下文的理解以及对答案精准程度的把控。随着MCTest数据集的发布,语义理解受到更多关注,取得了快速发展,相关数据集和对应的神经网络模型层出不穷。语义理解技术将在智能客服、产品自动问答等相关领域发挥重要作用,进一步提高问答与对话系统的精度。
问答系统
问答系统分为开放领域的对话系统和特定领域的问答系统。问答系统技术是指让计算机像人类一样用自然语言与人交流的技术。人们可以向问答系统提交用自然语言表达的问题,系统会返回关联性较高的答案。尽管问答系统目前已经有了不少应用产品出现,但大多是在实际信息服务系统和智能手机助手等领域中的应用,在问答系统鲁棒性方面仍然存在着问题和挑战。
自然语言处理面临四大挑战:
一是在词法、句法、语义、语用和语音等不同层面存在不确定性;
二是新的词汇、术语、语义和语法导致未知语言现象的不可预测性;
三是数据资源的不充分使其难以覆盖复杂的语言现象;
四是语义知识的模糊性和错综复杂的关联性难以用简单的数学模型描述,语义计算需要参数庞大的非线性计算

四、人机交互
人机交互主要研究人和计算机之间的信息交换,主要包括人到计算机和计算机到人的两部分信息交换,是人工智能领域的重要的外围技术。人机交互是与认知心理学、人机工程学、多媒体技术、虚拟现实技术等密切相关的综合学科。传统的人与计算机之间的信息交换主要依靠交互设备进行,主要包括键盘、鼠标、操纵杆、数据服装、眼动跟踪器、位置跟踪器、数据手套、压力笔等输入设备,以及打印机、绘图仪、显示器、头盔式显示器、音箱等输出设备。人机交互技术除了传统的基本交互和图形交互外,还包括语音交互、情感交互、体感交互及脑机交互等技术。

五、计算机视觉
计算机视觉是使用计算机模仿人类视觉系统的科学,让计算机拥有类似人类提取、处理、理解和分析图像以及图像序列的能力。自动驾驶、机器人、智能医疗等领域均需要通过计算机视觉技术从视觉信号中提取并处理信息。近来随着深度学习的发展,预处理、特征提取与算法处理渐渐融合,形成端到端的人工智能算法技术。根据解决的问题,计算机视觉可分为计算成像学、图像理解、三维视觉、动态视觉和视频编解码五大类。
目前,计算机视觉技术发展迅速,已具备初步的产业规模。未来计算机视觉技术的发展主要面临以下挑战:
一是如何在不同的应用领域和其他技术更好的结合,计算机视觉在解决某些问题时可以广泛利用大数据,已经逐渐成熟并且可以超过人类,而在某些问题上却无法达到很高的精度;
二是如何降低计算机视觉算法的开发时间和人力成本,目前计算机视觉算法需要大量的数据与人工标注,需要较长的研发周期以达到应用领域所要求的精度与耗时;
三是如何加快新型算法的设计开发,随着新的成像硬件与人工智能芯片的出现,针对不同芯片与数据采集设备的计算机视觉算法的设计与开发也是挑战之一。

六、生物特征识别
生物特征识别技术是指通过个体生理特征或行为特征对个体身份进行识别认证的技术。从应用流程看,生物特征识别通常分为注册和识别两个阶段。注册阶段通过传感器对人体的生物表征信息进行采集,如利用图像传感器对指纹和人脸等光学信息、麦克风对说话声等声学信息进行采集,利用数据预处理以及特征提取技术对采集的数据进行处理,得到相应的特征进行存储
识别过程采用与注册过程一致的信息采集方式对待识别人进行信息采集、数据预处理和特征提取,然后将提取的特征与存储的特征进行比对分析,完成识别。从应用任务看,生物特征识别一般分为辨认与确认两种任务,辨认是指从存储库中确定待识别人身份的过程,是一对多的问题;确认是指将待识别人信息与存储库中特定单人信息进行比对,确定身份的过程,是一对一的问题。
生物特征识别技术涉及的内容十分广泛,包括指纹、掌纹、人脸、虹膜、指静脉、声纹、步态等多种生物特征,其识别过程涉及到图像处理、计算机视觉、语音识别、机器学习等多项技术。目前生物特征识别作为重要的智能化身份认证技术,在金融、公共安全、教育、交通等领域得到广泛的应用。

七、VR/AR
虚拟现实(VR)/增强现实(AR)是以计算机为核心的新型视听技术。结合相关科学技术,在一定范围内生成与真实环境在视觉、听觉、触感等方面高度近似的数字化环境。用户借助必要的装备与数字化环境中的对象进行交互,相互影响,获得近似真实环境的感受和体验,通过显示设备、跟踪定位设备、触力觉交互设备、数据获取设备、专用芯片等实现。
虚拟现实/增强现实从技术特征角度,按照不同处理阶段,可以分为获取与建模技术、分析与利用技术、交换与分发技术、展示与交互技术以及技术标准与评价体系五个方面。获取与建模技术研究如何把物理世界或者人类的创意进行数字化和模型化,难点是三维物理世界的数字化和模型化技术;分析与利用技术重点研究对数字内容进行分析、理解、搜索和知识化方法,其难点是在于内容的语义表示和分析;交换与分发技术主要强调各种网络环境下大规模的数字化内容流通、转换、集成和面向不同终端用户的个性化服务等,其核心是开放的内容交换和版权管理技术;展示与交换技术重点研究符合人类习惯数字内容的各种显示技术及交互方法,以期提高人对复杂信息的认知能力,其难点在于建立自然和谐的人机交互环境;标准与评价体系重点研究虚拟现实/增强现实基础资源、内容编目、信源编码等的规范标准以及相应的评估技术。
目前虚拟现实/增强现实面临的挑战主要体现在智能获取、普适设备、自由交互和感知融合四个方面。在硬件平台与装置、核心芯片与器件、软件平台与工具、相关标准与规范等方面存在一系列科学技术问题。总体来说虚拟现实/增强现实呈现虚拟现实系统智能化、虚实环境对象无缝融合、自然交互全方位与舒适化的发展趋势

‘叁’ 大数据帮助我们走进大脑的缤纷世界

大数据帮助我们走进大脑的缤纷世界

大数据的核心就是预测,通常被视为人工智能的一部分或者更精确说被视为是一种机器学习。因此大数据在脑科学研究中会大显身手,脑科学研究可使我们开发出更有效和智能化的机器学习算法,又会反过来推动和帮助我们更好地开采大数据。
人的大脑由约1000亿个神经元组成,每个神经元又和大约一千个其他神经元相连,组成了一个极其复杂的网络。在此之上,大脑还是一个动态系统,随时间和环境在不断变化,具有自组织、自适应和自学习的特征。而理解和认识大脑是公认的科学的最后堡垒。一方面,现代社会进步的同时也给人们带来巨大的心理上的压力。据医学权威杂志《柳叶刀》在2009年发表的对中国人群的调查发现,中国的月患精神疾病率高达17.5%。在西方社会,由于服用抗抑郁症药百忧灵的人群基数之大,在伦敦的自来水里甚至发现了百忧灵的残留物。老年痴呆是另一类困扰着我们的疾病,数据表明香港人的女性平均寿命为86.7岁,而这一年龄有约一半以上的人是老年痴呆患者。想象一下:大街上行走的老年人有一半人找不回家了,这该是怎样的一个社会。其他脑疾病如脑卒中(俗称脑中风)每十二秒钟就会夺走一个中国人的性命。另一方面,脑科学的进步会推进人类社会的长足发展。我们社会可能面临的智能化是继第一次工业革命(蒸汽机的发明)、第二次工业革命(电气化)和第三次工业革命(自动化)后的第四次工业革命。这次工业革命的一大特征是拟脑化,具有一定智能的机器人的出现将是这次工业革命的一大特征。为达到上述目的:人类更健康的生存和更舒适的生活,研究、认识和理解大脑是其中的关键。欧盟于2013年启动了人类大脑计划,这计划投资十亿欧元为期十年,意在用计算机来模拟人脑。继欧盟之后,奥巴马也宣布了美国大脑计划投资45亿美元,旨在记录每个神经元活动。目前中国的脑计划也在酝酿中。这些脑计划的背后都有一个关键的问题:如何读懂和解析出深藏在我们获得的海量数据里的关于大脑的运行规律。这样的数据可以是遗传的数据,它决定了你将来的健康状况、智力水平和大脑的结构,可以是成千上万个神经元共同行为;它决定了你如何学习,如何对付一些突发状况,也可以是更为粗略化的脑影像数据;它可以让我们无创地首次观察到每个人大脑的运行情况,或更为常见的各种认知行为指标如智商等。这些前所末有的大数据为大脑研究开启了全新的天地,一个典型的病人可以有至少1GB的原始数据,一千个人就有1TB的数据。目前在这方面做得较为成功的是南加州的Toga教授组,他们有一个一百多人组成的研究小组从UCLA被南加州大学整个买断;据报道,Toga教授本人也以百万美元的年薪搬到南加州大学。自2004年以来,他们开始收集老年痴呆症的各种各样的如前所述的数据,前后花了数亿美元。但由于缺乏有效数理分析工具,在这方面一直没有得到有显着结果的结论,原因在于基于大数据,寻找老年痴呆病根相当于大海捞针。与他们合作,我所在团队利用新发展的统计工具首先在这些数据中找到了可能的老年痴呆症基因和对应的损坏脑区。为了克服上述困难,Toga团队的另一个明星教授Paul Thomson另辟蹊径,开始了另一个被称为“迷”的研究项目。该项目的成功之处在于它并不需要索取原始数据,Thomson为你提供了一个分析方法软件,通过该方法在各个具有数据的小组里得到一个或数个统计分析结果,然后这些统计结果通过一种叫作荟萃分析的统计方法汇总,Thomson得到一个总的结果。通过对几万位病人的数据分析,他们得到了许多十分有意义的结果。“迷”项目的成功实施为大数据应用中如何克服数据获取这一难题提供了一个很好的、值得借鉴的解决方法。近几十年人工智能的快速发展具体体现于一些智能算法如深度学习的成功应用中。深度学习的成功秘诀在于:华人科学家李飞飞构建的一个大型的人脸数据库、今天的大规模计算能力的提高。由于这两点,深度学习在人脸识别上的精度甚至超过了人类。当然,人工智能最看得见的应用应该是机器人,具有很强计算能力又有大型数据为依托的机器人将在我们社会智能化发展中扮演十分重要的角色。正像《大数据时代》作者维克多·施恩伯格指出,大数据的核心就是预测,通常被视为人工智能的一部分或者更精确说被视为是一种机器学习。因此大数据在脑科学研究中会大显身手,脑科学研究可使我们开发出更有效和智能化的机器学习算法,又会反过来推动和帮助我们更好地开采大数据。

以上是小编为大家分享的关于大数据帮助我们走进大脑的缤纷世界的相关内容,更多信息可以关注环球青藤分享更多干货

‘肆’ 对于谷歌云而言,中国市场不重要吗

对于谷歌云而言,中国市场不重要吗
我国此前也曾发布《国务院关于促进云计算创新发展培育信息产业新业态的意见》以及《云计算综合标准化体系建设指南》,将云计算提升到了国家战略的高度。
亚马逊AWS、微软Azure等云服务巨头显然已经看到中国市场未来在云计算上的巨大机遇,截止目前,AWS在华两个区域布局有数据中心,共4个可用区,据不完全估计年营收或已达到15亿元人民币,折合约2亿美元,该数字仅次于阿里云、腾讯云。微软Azure在中国已有3个数据中心,虽在营收上没有给出确切数据,但通过与世纪互联的合作,微软Azure在中国已有11万企业客户,1 400多个云合作伙伴,入华成效显着。
竞争对手对中国云计算市场不断抛出的橄榄枝,置若罔闻、视若无睹都不会成为谷歌云的最佳选择。谷歌在云计算上的“淡定表现”是一种假象还是在谷歌的整体战略中,云计算只是个“配角”?
谷歌的云计算是个配角吗?
如果要论云计算在谷歌发展战略中的地位,我们可能需要从谷歌的企业文化说起。20年前,拉里·佩奇和谢尔盖·布林在加利福尼亚的山景城创办了谷歌,两位创始人虽然性格迥异,但在如何管理公司或谷歌未来应该朝着哪个方向发展上却有着惊人的共识:崇尚技术,这让谷歌有了很深的工程师文化;崇尚创新,又使谷歌的“登月”文化传承至今;梦想改变世界的大情怀,又让谷歌的各项业务不因短时的利益而改变航向。
因此,两位所向披靡的谷歌创始人带领谷歌涉足了一切他们可以涉足的领域,只要有创新、只要他们认为对未来有益,谷歌就会去做,这就有了我们看到的谷歌无人驾驶汽车、谷歌眼镜,甚至是谷歌收购的Youtobe等等。于是,当我们将谷歌的云计算业务放在谷歌整个产品生态中去的时候,谷歌云就稍显渺小。
谷歌旗下的产品分为三大类,针对消费者的“人人适用”类,针对企业客户的“企业适用”类,针对开发者的“开发者适用”类,看起来产品图谱很简单,但如果把每类下的产品数量相加,谷歌的总产品数量则有110种之多。然而,谷歌的云计算业务没有被单独归为一类,外界通常笼统地将谷歌云端平台、谷歌G Suite等统称为谷歌云业务,在谷歌一年一度的财报中,也鲜有提及“谷歌云”,而是把它归到了“其他收入”行列。
值得考虑的是,谷歌母公司Alphabet2017年度营收超1000亿美元,谷歌云的营收只占到了4%(实际占比可能比这个更少),谷歌公司的营收大王——广告业务,其2017年营收占到了谷歌总营收约90%。对比AWS已被亚马逊宣称成为营收主力,谷歌云的地位确实有不小落差。一言以蔽之,有了广告业务这个收入引擎,谷歌董事会们并没有指望云计算能给他们赚多少钱。
如果用“云计算不重要”来形容谷歌云的战略地位又不太恰当。因为2015年谷歌CEO桑达尔·皮查伊(Sundar Pichai)请来了重量级人物,企业计算巨头VMware(现已被戴尔科技集团收购)创始人黛安·格林(Diane Greene)加入谷歌,担任谷歌云CEO(Google Cloud CEO)。在随后的2016年谷歌消费者大会上,黛安·格林宣布正式启用Google Cloud 谷歌云,谷歌云的征途由此开始。
在戴安·格林的带领下,谷歌云产品目前已覆盖计算、存储和数据库、网络、大数据、物联网、机器学习、身份验证与安全、管理工具、开发者工具等九大方面。今年2月,谷歌首次就云计算部门的营收进行了宣布,戴安·格林表示2017年谷歌云的季度营收已经达到10亿美元,按此推算谷歌云年营收最高达到40亿美元,位于国际巨头亚马逊AWS 2017年度营收175亿美元之后,却排在中国体量最大的云服务商阿里云2017年度营收17.85亿美元之前。
此前,戴尔·格林还在演讲中透露,拉里·佩奇等谷歌董事会高层都为谷歌云2017年取得的成就感到兴奋,并正在筹备云计算相关企业的收购事宜。如此看来,谷歌对云计算的态度大致明了:不打算靠云计算赚钱,但可能在谋划继续往里面砸钱,不急不躁,小步慢跑。
2016年11月,世界人工智能顶级专家李飞飞加入谷歌,担任谷歌云人工智能机与器学习首席科学家(Chief Scientist, Cloud AI & ML),这里谷歌将“Cloud(云计算)”、“AI(人工智能)”、“ML(机器学习)”融合成了一个词,简称为“Cloud AI & ML”。可以看出,这位深耕人工智能、机器领域的科学家将会于“谷歌云”有着千丝万缕的联系。
(重组后的Alphabet组织架构图,仅供参考)
2015年谷歌母公司Alphabet启动企业结构重组,2017年完成重组后,“Cloud”作为一个单独的部门位列其中。AI或ML没有单独成立部门,原因或许在于Alphabet的各个子公司中,无论是神秘的谷歌X实验室、人工智能Deepmind,还是无人驾驶汽车项目Waymo都离不开AI&ML,也就是说对于谷歌各项子业务,AI&ML都作为底层支撑,无需单独成立部门。
对于谷歌云也是如此。李飞飞这位以研究AI&ML擅长的首席科学家被冠以“Cloud AI & ML”的头衔,她工作关键将是把AI&ML深度融进云计算。
李飞飞也这么做了,她的第一站就是中国。
2017年12月,在上海举行的谷歌开发者大会上,李飞飞宣布“谷歌AI中国中心”正式成立,那天她身着一件中国红风格的旗袍短袖侃侃而谈。李飞飞是谷歌云官网挂出的十位高管中唯一一位华人面孔,这个身份或许与谷歌选定其为Cloud AI & ML首席科学家不无关系。

在2018年3月,谷歌 Cloud Next 17上,李飞飞发布了谷歌云面向机器学习和人工智能的一系列新API 以及收购机器学习竞赛平台Kaggle。
之后谷歌云可能还会借助“谷歌AI中国中心”进一步壮大其在中国的云计算业务,这一天希望不会等太久。
谷歌这次会妥协吗?
2010年,谷歌搜索业务退出中国的事件,现在想想仍然心有余悸。关于谷歌退出中国的原因外界说法很多,一种声音认为,谷歌单方面确认其遭受来自中国黑客的网络攻击;另一声音,谷歌在与中国本土搜索引擎网络争抢份额的过程中败下阵来,仓皇逃脱;还有一种声音则是因为,谷歌无法接受中国政府提出的“内容审查”要求;另外,也有人指出,是李开复的离职,让谷歌缺乏一个中国区领导者,致使其无法本土化。
总之,谷歌最后选择了不妥协。
然而这次,谷歌云将经受的来自中国政府的考验相对更加严峻,因为涉及到了中国用户的数据问题。中国《网络安全法》对数据主权做了规定,即数据要采取本地化存储,对于本国或者外国公司在采集和存储与个人信息和关键数据相关数据时,必须使用主权国家境内的服务器。
无论是亚马逊AWS还是微软Azure、苹果icloud等跨国公司巨头都已经选择顺应中国政府的要求,与中国本地公司合作,基础设施交由中国公司运营,苹果icloud甚至将钥匙串一并迁移回中国。谷歌云会跟它的竞争对手们一样选择妥协吗?谷歌云的华人领导者李飞飞能否带领谷歌云归航?
谷歌创始人拉里佩奇曾表示:“企业只以盈利为目的,而不为改变世界做出贡献,就不能成为另人满意的企业”。在谷歌的整个生态中,“现在”与“未来”是两个明显的分界线。谷歌的营收大王广告业务是“现在”,而“未来”则是人工智能、无人驾驶等一切可以让人类变得更好的技术,当下,谷歌将“云计算”也划分到了“未来”里。
“非盈利”的想法可能不会使谷歌云选择快速攻入中国市场,它的步伐用“培育云计算“可能比用“占领市场”更为贴切。

‘伍’ 人工智能领域哪些高校实力强

高校建立的实验室与大公司有所不同,其研究项目除了偏应用科学的领域,还有一些属于基础理论研究的项目,是无法从具体的产品上表现的,通常高校实验室会同时进行两种领域的研究甚至侧重后者,考虑到高校在学术界的地位,人们在关注实验室研究内容的时候除了关注它的产品,同时也应该注意其在基础研究领域的水平。

麻省理工学院

MIT的人工智能实验室全称叫CSAIL (ComputerScience and Artificial Intelligence
Laboratory)。最初,这是两个实验室:计算机实验室创办于1963年,人工智能实验室创办于1959年,两个实验室在2003年正式合并。

CSAIL是MIT最大的实验室,也是世界上最重要的信息技术研发中心。CSAIL的成员创立了多于100家知名公司
,包括机器人之父科林·安格尔,iRobot公司创始人之一海伦·格雷纳,波士顿动力公司创始人马克·雷伯特,还有卡内基·梅隆大学机器人研究所的负责人马特·梅森。

MIT也几乎是顶尖技术的代名词。它在去年底发布了2015年CSAIL的主要创新,包含3D打印心脏,可以爬楼梯、开门甚至驾车的机器人,癌症预测工具等。

‘陆’ 有哪些数据库公司参加了数据技术嘉年华(DTC)

本届DTC主论坛一共有七位分享嘉宾,每一位都是数据库行业的领袖,他/她们是:盖国强、李飞飞、苏光牛、赵培、王义成、黄东旭、阳振坤、任永杰、林韶宾(万里开源GreatDB)

‘柒’ OceanBase那么厉害,为什么不去和Oracle竞争,抢占企业市场的市场份额

因为干不过 吹出来的 给不懂的人看而已 1500多个节点的分布式架构和人家10年前27节点rac比!别忘了你用的ssd 人家还是机械盘!

阿里巴巴旗下的数据库OceanBase屡屡在国际上获得数据库竞赛大奖,不少人就要问了,既然OceanBase这么厉害,为什么阿里巴巴不去抢占Oracle的市场份额呢?

OceanBase竞赛结果有片面性、功能还不够完善

事实上在阿里系内部,也只有蚂蚁金服是真正在大规模使用,在阿里系内部其他团队已经有三大数据库,X-DB是阿里集团数据库团队搞的,PolarDB是阿里云团队、也就是李飞飞博士负责的,OceanBase是蚂蚁金服数据库团队搞的,现在阿里内部已经推进了X-DB和PolarDB的全面融合,李飞飞博士领导的PolarDB团队将会立足长远,是下一代数据库系统,未来阿里云的业务有多广,PolarDB要面对的业务场景就有多复杂。

OceanBase最大的优势在于这是阿里真正完全自研的数据库,跟阿里云一样,是从头到尾完全自研的,当然这个完全自研到底到底有没有水分我们并不知道。大家了解OceanBase就是之前的打比赛,不过OceanBase占了分布式的光,吃了硬件的便宜,加上最近十年Oracle已经不来打比赛了,阿里本质上是跟十年前的Oracle在比,软硬件技术都不在同一个起点上,这也是这个竞赛结果有很大片面性的根本原因。在单机性能方面,Oracle依然要更强一些,稳定性就更不用说了,Oracle已经稳定运行了这么多年。


OceanBase之所以还没办法跟Oracle竞争,是因为OceanBase还没有那么强,也还有非常多需要完善的地方,功能上还有很多不足,在阿里内部数据库分化也还比较明显,OceanBase在跟另外的产品竞争当也,没有优势。

OceanBase“专属性”明显、开源后闭源,企业要稳定、企业也不都是阿里

OceanBase更多的还是围绕蚂蚁金服自己的业务在做,现在除了阿里系内部在使用,真正的商业化用户也就只有PICC、南京银行两个比较大,是在真正使用OceanBase,客户群体还太小太小,样本数量确实还不够大。

OceanBase之前其实是开源了的,不过后来又闭源了,在商业化过程中也遇到了一些问题,这个操作当时其实就吓到了很多人,OceanBase闭源之后的版本跟原来的差距非常大的。OceanBase更适合处理互联网业务,跟传统企业业务契合度并没有那么高,Oracle的很多功能OceanBase都还不具备,OceanBase的生态、工具、技术支持还差很多很多。oceanbase是为大规模事务处理准备的分布式系统,听起来很强大,但是真的不够接地气。


OceanBase针对阿里的业务进行了深度优化和定制,这就让OceanBase在通用性上有了很大的阻碍。可是在其他企业就很难的,阿里有很好的技术团队,他们也可以为了业务做出专门的调整,阿里有这样的能力和资源,但是小企业没有这样的配置,尤其是传统企业根本不可能做这样的事情。大家更希望系统是稳定好用的,拿过来就可以直接用的,你现在又不开源了,用户担心更大,还不如继续用稳定的Oracle数据库。

技术这东西吧我还是喜欢说句实话,不是你自己说你有多厉害就真的多厉害,还得是实际场景的应用才行。就像网络一样,好像这些年大家也不吹网络了,但是春晚一战,网络成为唯一一个扛住了春晚流量洪峰的企业,技术实力业内人都看得明白。OceanBase做得很好,但是也没有那么好,至少是目前应用还没有那么好。

早就在竞争了!

实际上阿里云的OceanBase数据库系统在推出以后,实际上就已经开始商业化运作了,就在不断的从甲骨文公司手里面抢到更多的企业级应用市场了。

OceanBase确实很先进

近日,在数据库领域内,OceanBase数据库又打破了世界记录,直接创造了7.07亿TPMC的新世界记录。

从OceanBase的功能和速度来看,现在OceanBase是世界领先的数据库产品,在被誉为“数据库领域世界杯”的国际权威TPC-C测试中,OceanBase性能分数打破Oracle多年垄断,不断创造新的世界记录。

而且OceanBase采用新一代分布式处理技术,颠覆了传统数据库集中式技术架构,尤其适应了互联网持续扩张的数据处理需求。

正是OceanBase数据库的可扩容的特点,也降低了用户的使用成本,而且又拥有很高的速度,因此,现在OceanBase在企业市场中的份额是越来越大了。

现在阿里云市场份额很大

阿里云市场份额不断扩大。根据国际研究机构Gartner发布最新云计算市场追踪数据,阿里云亚太市场排名第一,全球市场排名第三。在全球市场份额中,阿里云仅次于美国的亚马逊和微软公司。

阿里云从2018年到2019年,在全球市场份额从7.7%上涨至9.1%,进一步拉开与第四名谷歌差距,挤占了不少亚马逊的份额。而在亚太市场,阿里云的份额更大,从2018年的26%上涨至2019年的28%,接近亚马逊和微软公司的总和。

现在阿里云的服务其中一项最重要的就是数据库的服务,也就是OceanBase数据库的服务。

实际上,从2015年,OceanBase数据库推出以后,淘宝和支付宝系统就开始了去IOE,开始上云,然后好多银行的金融服务也开始去IOE,上云。这些实际上都是开始抛弃甲骨文数据库系统了。到现在为止,通过上云使用OceanBase数据库数据库的企业和公司就更多了。

结论

综上所述,OceanBase数据库早就在跟甲骨文公司进行竞争了,现在阿里云的份额在全球排在第三名,阿里云其中最关键的应用就是OceanBase数据库的应用了。

OceanBase其对标的是亚马逊的Aurora,你要目前去和Oracle竞争,这个目前还不对等。



OceanBase满打满算10年的时间,Oracle呢,40多年了。目前大的企业,像银行、电信这些核心企业,基本上是Oracle的天下,也有Sybase、DB2、SQLServer。其实还是那几个巨头在玩,甲骨文、微软、IBM、SAP,这些可都是企业服务领域的巨头。


听到DB2(IBM)是不是有人觉得老土了,但是现实就是还有很多系统在用,为什么呢?因为有些系统要切换数据库,估计要出大问题。


互联网公司反而在这方面投入不高,那就用像MySQL这种开源的,最先MySQL被SUN公司收购了,现在SUN又被Oracle收购了,所以还是Oracle旗下的。



Oracle之所以这么强势,就是因为其产品的稳定性,尤其是金融类机构,一点数据问题都不能出,否则你银行里只有100块,花出去了101块,这个问题就大了。你可以想下,几十年,遍布全球的金融类机构,大部分只敢用Oracle,就是因为产品稳定。而且这么长时间的技术积累,问题解决经验,这个真的不是说自研就解决的。


伴随着云服务的大趋势,几个主要的云服务提供商,亚马逊、阿里、腾讯都在发力数据库,像淘宝、微信这种大的国内应用,本身必然会要求其数据库团队越来越强大。


OceanBase其实也在慢慢的搬运Oracle的客户,但是这个急不得。其实在市场定位上,国内的大量互联网公司并没有使用Oracle,因为太贵了。所以这部分客户才是OceanBase的主要目标。



Oracle代表的是云服务以前的顶峰,而且目前看想替换不是几年的事情。新的OceanBase伴随着云服务的扩展,必然一步步的能取得更多的市场份额。阿里云发展必然能带动OceanBase的快速发展。


慢慢来吧,数据要的是稳定。

第一,oceanbase是否比Oracle强并不能完全肯定,Oracle这么多年的发展形成了完整的生态,让大多数人熟悉了他那一套,oceanbase应该说在一些场景下比Oracle强,尤其分布式方面,因为他这方面在自身业务驱动下更加突出。

第二,Oracle的客户基本上是规模型企业,且一般用于核心业务系统上,切换成本很大,风险很大,做这样的决策是非常困难的。

第三,人才培养没有那么快,切换oceanbase没有多少人会,培训学习和运营管理都需要时间

第四,阿里发展重心不是这种产品销售模式,Oracle这种模式需要大量的营销团队和服务支持团队

第五,阿里时机还未到,先通过云服务不断发展客户完善产品,后期根据自身的发展策略可能会决定面向客户销售

银行 金融 政府等行业是不会去尝试新技术的 他们要的是稳定 可靠 打个比方 银行每天流水 1个亿 用新系统 花钱了 而且出了问题 损失了 谁负责?!花钱不讨好!银行也不差那点软件版权费!

应用场景差别很大,分布式系统维护成本很高。这和外国宁愿买二手F16,也不愿意采购歼10一样,更何况,OB确实还不如Oracle。

但是现阶段贸易战,已经消除了Oracle的空间,正是OB等系统的机会

如你所愿。

oceanbase最近独立运营了,开始发力推广。先把TPC-C基准测试排名达到世界第一。(第二也是自己,这次是二刷)

然后最近刚刚开源。把300万核心代码都开源出来。大家可到github上查看。

金融领域继续发力。和合作伙伴一起做去O。尽量能兼容Oracle,让客户无损切换到oceanbase上来。

相信不远的将来,中国企业都能用上国产高性能数据库。

热点内容
安卓手机如何使用大流量 发布:2025-05-14 17:47:34 浏览:81
精密模具编程 发布:2025-05-14 17:45:16 浏览:499
存储顺序和逻辑顺序有什么区别 发布:2025-05-14 17:44:30 浏览:275
安卓版设置里的隐身在哪里 发布:2025-05-14 17:35:16 浏览:333
linuxshell密码 发布:2025-05-14 17:21:11 浏览:200
安卓手机听筒在哪里关闭 发布:2025-05-14 17:16:20 浏览:456
我的世界炸毁50万服务器 发布:2025-05-14 17:16:07 浏览:123
存储站源 发布:2025-05-14 17:14:20 浏览:864
win2008的ftp设置 发布:2025-05-14 17:03:31 浏览:665
莱克发的工资卡密码是多少 发布:2025-05-14 16:57:10 浏览:179