資料庫誤讀
Ⅰ 32寸顯示器電腦誤讀成60寸怎麼改
沒辦法改,這屬於軟體以及軟體所調用的資料庫的問題,這是騰訊的鍋,你是無法更改的——我們剛剛起步,比起貓和狗來說我們太小,我們是bnz168,我們為自己帶鹽
Ⅱ 虛擬機硬碟空間有,但是創建sql2008資料庫還是提示空間不足。
檢查有的殘留文件,被機器誤讀了,有的只有幾K 但是顯示幾G
優化下,刪除,垃圾
uuuuuuuuuuuuuuuuuuuuuuuuuuuu
隱隱約約隱隱約約隱隱約約隱隱約約隱隱約約隱隱約約隱隱約約隱隱約約隱隱約約隱隱約約隱隱約約隱隱約約隱隱約約隱隱約約有億元
停停停停停停停停停停停停停停停停停停停停停停停停停停停停停停停停停停停停停停停停停停停停
【已備案域名】【空間】【伺服器】【VPS】====【網路一下 華特科技】
找華特--藍天
Ⅲ 面試的時候,問了一個問題,什麼是 防止SQL注入
簡單回答:防止——利用即有的應用、功能,將(惡意)SQL命令發送到到後台資料庫引擎。
----------詳述,及關鍵要點,有耐心可以看一看--------
-------(下面的論述,要看懂需要有基本的SQL資料庫編程和操作知識,本人實際經驗,僅供參考)------
1、SQL語言在當前主要用於資料庫管理系統軟體中,進行數據查詢、分析、匯總等等,但一些高級別的資料庫管理系統還存在一些非常高級的能力,可以以向它發送SQL指令的方法讓它干一些特別的事,甚至出格的事,比如起動某個應用程序等,具體的能力視「資料庫管理系統」(也稱「資料庫引擎」)而定。一些通用的資料庫指令有時也能幹出一些出格的事,比如創建用戶、修改用戶(特別是管理員用戶)基礎信息(比如密碼)等。
2、其實,一般而言,絕大多數沒有學過電腦與資料庫的人是不懂得SQL語言的。也就是說,一般的客戶端使用者總是按設計者的預設以點擊或輸入常規信息的方法來與電腦進行交互,進而將數據傳給客戶端,客戶端合成SQL指令後向「資料庫引擎」獲取或提交數據。
3、但是因為SQL指令是一種純文本的字串,在某些特定情況下,操作者輸入的字串經客戶端合成後,會異化成能讓「資料庫引擎」誤讀的指令。
4、舉個簡單的例子進行說明吧:
----**********************-----
A、設計者預先的設計,用戶輸入條件,'其他費用'(或別的字串),就查出 ABA02欄位 中值為『其它費用』(或別的字串)的數據。預期合成後發向伺服器的字串為:
SELECT*FROMABA1A
WHEREABA02='其他費用'
B、但是,輸入者並不按預期的輸入,而是輸入可以合成惡意SQL語句的字串,那麼,我們來看看會發生什麼事。
合成SQL的代碼一般是:
"SELECT*FROMABA1AWHEREABA02='"+用戶輸入字串+"'"
現在用戶輸入
"其他費用';DELETE[!AY_LS]WHERE'0'='0"
代入上一行,變成:
"SELECT*FROMABA1AWHEREABA02='"+"其他費用';DELETE[!AY_LS]WHERE'0'='0"+"'"
最終合成的SQL字串就是:
SELECT*FROMABA1AWHEREABA02
='其他費用';DELETE[LSTAB]WHERE'0'='0'
能看懂SQL的人就明白了,這個字串如果發向「資料庫引擎」,結果是,查出數據之外,還將LSTAB這個數據表中所有的數據進行了刪除,這根本不是設計者預先所需要的。
----**********************-----
5、更多的相關的發揮你可以自個去想,有的SQL語句利用「資料庫引擎」的能力可以產生相當可怕的後果。產生這種「SQL注入」的可能,是因為設計者沒有客戶輸入後,合成SQL語句時,可能有「SQL注入」進行猜測與預想。另一方面,「SQL注入」的實現往往需要客戶對SQL資料庫有相當的了解。
6、防止SQL注入最基本的要點就是,破壞用戶的輸入可能合成有效的SQL語句的可能。做法有很多,比如限制輸入的長度,限制輸入特定的字元,對用戶輸入的數據進行預檢,不讓用戶自由輸入,只能輸入關鍵詞並轉碼為特定數值,等等。
7、最常規的,違范的做法就是,不讓用戶自由輸入條件字串,只能輸入特定的條件,這是防SQL注入的最好辦法。實在需要自由輸入的情況下,一定要做預判,不讓自由輸入的字串能合成有效SQL語句。比如,最簡單的禁止中存在「空格」這樣,就無法合成有效的無錯的SQL語句了,等等!
8、「SQL注入」不但在網頁輸入中可能存在,在其它的,只要涉及用戶輸入與「資料庫引擎」的情況下,都可能存在!另外,網頁提交中,有些非常規的方法可以繞過正常的方式輸入,比如直接在瀏覽器網址處輸入特定字串,以直接post數據等。
Ⅳ 為什麼選擇使用NoSQL資料庫開發如此困難
傳統觀念中 NoSQL資料庫非常適合某些數據類型,如:非關系數據源。同時,NoSQL被吹捧為最適合Web應用程序的優秀平台。然而他適合大多數數據,特別是web應用程序的數據是相關型。那麼,這是否可以給你一個堅持使用RDMS的理由呢?也不一定,即使很困難,我們還是要做出選擇。
評估NoSQL是一個很茅盾的理論,一些人認為,應該將所有文檔數據存儲在一個文檔中,做鏈接代碼就是褻瀆神明。另外一部分人認為,存儲應用文檔,
加入代碼,才是合理選擇。與此同時,不同的資料庫,需要在文檔中限制嵌套數據數量。有的人會鼓勵文檔引用。這是NoSQL數據模型的基本部分,也沒有一個
明確的共識。
曾經有一篇很熱的帖子"Why you should never use
XYZ",我想,讀到這里,一定會有人搜索這篇文章。當然,這種文章各式各樣,太過於籠統的標題也沒什麼幫助。毫無疑問,會有人會搜索這個文章,然後再找
到這個文章,進一步深入,找到該文章的方法遠比成功(理解問題)的故事多。很難知道誰提供了一個有效的技術問題,誰又誤讀了這個問題(或者缺少證據證明其
觀點)。
有大量選擇,RDBMS的世界,選擇就很容易。你有4或5個目標,大家工作方式差不多,來選擇環境、預算支持的平台。對於成熟的產品,風險比較小。 NoSQL的世界,有很多資料庫引擎功能選擇。每一個有自己的獨特優勢,也有致命弱點。所以選擇很難, NoSQL項目生命周期短,嘗試新項目或者流行項目也會有風險。上次,我的的項目是在 CouchDB上,而現在似乎停擺了。
做出這個痛苦決定的原因是,這可能是一個案例:你需要做一大堆工作,才能知道,你做出的選擇對與錯。你可以實體化你的數據模型,了解他與系統的工作
情況,但是,這只有你正真撞到南牆,才可以找到裂縫(答案)。以我為例,我建的應用程序是關系資料庫,移動文件存儲的主要因素是,需要一個無模式設計來達
到我的目標。使用NoSQL 資料庫存儲關系型資料庫並不是我們所常說的,雖然,這種事常常發生。
現在我在用 Couchbase 和
MongoDB,Mongo對我沒多大吸引力,不過鑒於他非常流行,對於引起來說,很有好處。當然,很多都可以以同樣的方式流行。PHP很流行,因為他的
易用性,而不是因為他很好。我現在在使用MongoDB和PHP,也在學習Couchbase,如果你有任何NoSQL平台的使用感想,歡迎交流。
Ⅳ 請討論資料庫表的記錄數大概在什麼范圍內的時候,使用表的掃描效率比較高。
一、高級掃描使用舉例。
通常情況下在數據查詢的時候,資料庫會利用索引或者通過全表掃描來查找數據。但是如果需要的數據在資料庫中存儲不連續或者需要查找的記錄比較多時,此時索引的效果就會大打折扣。在這種情況下,資料庫查詢優化器可能會採用全表掃描來代替索引。但是眾所周知,全表掃描的效率是比較低下的。為此在SQL Server資料庫的企業版中,提出了一個高級掃描的處理方式。簡單的說,高級掃描可以讓多項查詢任務共享完全表掃描。筆者先給大家舉一個例子,然後再跟大家談談隱藏在其背後的秘密。
如在上圖中,一個表中的記錄比較多有40000頁。用戶甲需要查詢這個表中的記錄,假設其採用了全表掃描。當資料庫查詢到20000頁的時候,用戶乙也需要這個表中的數據,那麼又觸發了一個全表掃描。此時如果沒有採用高級掃描技術的話,則用戶乙的SQL語句必須要等到用戶甲的執行完畢後才會執行。而如果採用了高級掃描技術的話,則資料庫在從20000頁開始的全表掃描中,會把掃描的結果分成兩個副本,分別給用戶甲與乙。然後當第30000頁的時候,用戶丙也參與進來了。同理資料庫引擎會把從30000頁開始的掃描結果分為三個副本,分別給三個用戶。當整個表掃描完成之後,資料庫引擎就會把結果返回給用戶甲。然後再從頭開始掃描,當掃描到20000頁的時候,就會把上次掃描的20000頁到400000頁的結果合並起來然後返回給用戶乙。掃描到300000頁的時候就會把與上次掃描到的結果合並起來返回給用戶丙。
可見如果在不同高級掃描功能的話,則不同用戶在不同時刻的查詢請求,可能需要對某個表進行全表掃描三次。而在上面這個案例中,則知需要對這個表掃描2次都不到。為此當多個對同一個表進行全表掃描時,高級掃描工具可以明顯提高資料庫的運行性能。
二、高級掃描實現的秘密。
可見高級掃描其主要就是通過共享全表掃描技術來實現的。也就是說,當SQL語句的執行計劃需要掃描表中的數據頁(即全表掃描),並且資料庫引擎檢測到其他查詢執行計劃正在掃描這個表中的時候(如上例中用戶乙、丙參與進來),則資料庫引擎就會在第二個掃描的當前位置將第二個掃描插入到第一個掃描中(此時資料庫引擎會會把掃描的結果產生一個副本)。資料庫引起會一次讀取一頁,並加每一頁的行傳遞給多個執行計劃,一直到當前掃描結束。
此時,第一個掃描(用戶甲)已經完全結束,資料庫引擎就會把掃描的結果傳遞給用戶甲的進程。但是此時資料庫乙還不能夠把結果返回給用戶乙,因為在用戶甲開始查詢到用戶乙遞交SQL語句中間,可能會有用戶對前面幾頁的數據進行修改。為此資料庫引擎需要對先前的頁進行重新掃描,以防止數據的誤讀。為此第二個查詢計劃必須發起第二個全表掃描,檢索第二個執行計劃加入第一次掃描正在進行的掃描之前讀取的數據頁。即第二個執行計劃的掃描將繞回到第一個數據頁,並從這里開始掃描,直到其加入到第一個掃描時的位置。然後資料庫引擎會把掃描到的結果返回給第二個查詢計劃,依次類推。在實際工作中,可以按這種方式組合任意數量的掃描。其實這種掃描很想走馬燈,為此我們又把高級掃描戲稱為全表掃描。可見在這種情況下,如果多個用戶在一次全表掃描的過程中查詢同一個表,則可以減少全表掃描的次數。如果在沒有高級掃描的情況下,像上面的用戶甲、乙、丙都必須要爭用緩沖區空間並因此導致硬碟或者內存的爭用等等。然後資料庫引擎會分別為每一個用戶讀取依次相同的頁,而不是每次讀取的結果有多個用戶共享。顯然跟高級掃描比起來,這種處理方式其效率會低很多。
三、高級掃描的弊端與解決方式。
雖然高級掃描會提高資料庫的查詢性能,但是這種處理機制也會有一個弊端,即會導致查詢結果記錄順序的混亂。如上面這個例子中,如果三個用戶採用的都是同一個查詢語句的話,則其最後返回的結果雖然記錄的內容是相同的,但是顯示的記錄順序是不同的(假設沒有採用排序語句)。這可能會給用戶一種誤解,以為各自查到的是不同的內容。為什麼會產生這種情況呢?為了說們這個問題的原因,筆者就對表中的內容進行簡化。假設某一張表中有三條記錄,序號分別為1、2、3。
Ⅵ 大數據時代,人類生活面臨顛覆
大數據時代,人類生活面臨顛覆
對於IT領域來說,最近有很多非常新的概念,比如雲計算、物聯網,當大家剛剛對這些概念開始有清晰的認知時,又一個全新概念出現了——大數據。什麼是大數據?大數據概念究竟指向何方,大數據背後能怎樣改變我們生活?會不會給我們的生活和工作帶來困擾?
本報與第一財經頭腦風暴節目合作探討大數據時代下的問題。參與這次討論的嘉賓有大數據概念的提出者、牛津大學教授維克托·邁爾·舍恩伯格,微軟亞太研發集團、雲計算操作系統首席架構師徐明強,上海市信息化專家、專業委員會專家、復旦大學計算機學院院長王曉陽,科爾尼管理咨詢全球合夥人孫健,復旦大學現代哲學研究所所長俞吾金,啟明創投合夥人童士豪,著名財經評論員石述思。
1 到底什麼是大數據?
維克托:我認為它就是新黃金,我覺得是21世紀最主要的資源,這種資源對社會、企業、個人是否能成功,還是會受苦受難有著很重要的作用。解釋一下,雖然此前我們都有數據,可把它們整理在一起然後分析是非常昂貴的,因此我們更多的注意力都放在了實體資源上,就是真正的黃金、金塊,像勞動力這種資源。但只有最近我們才靠人的知識、創新來創造財富,更靠前一步,我們可以根據數據來進行,因為數據收集以及分析,成本上升的程度都已經改變了,然後我們的數據就可以達到一定規模。最後,大家所尋求的不管你是一個人、一個公司、一個組織,還是這個社會,無外乎就是這種所謂的新黃金。
為什麼最近黃金的價值會跌得很厲害?因為老黃金不值錢了,沒有新黃金有價值。
童士豪:我的觀點有點類似,第一個是雲,第二個是關系,第三個是未來。像剛才維克托先生提到的,因為雲時代到了,儲存的大量數據的成本非常低,所以能讓大家去利用大數據做工作分析,最近由於很多事情的關系,有更多的關系被理解,所以能去預測未來狀況。用自己的話說,就是在聆聽上花很多時間,看了很多朋友,大家尋找工作機會也好或者是認識對工作有幫助的合作夥伴也好,在這么大的信息里,這么多人把他自己的信息放在上面,就是做了一件事,就是分析。如果你40歲想當創意公司的CEO,你現在20歲,未來20年該怎麼規劃?這就是非常有意思的一件事。
最後可能有不同的可能性,最後會不會給你找到一個最好的方法,那是自己決定的。可能性放在面前,是機會率最高的,怎麼選還是個人決定,所以大數據並沒有抹殺個人的意識。
石述思:大數據首先改變的是我們看待世界的方法,它會對這個時代的很多的價值觀產生劇烈沖擊。舉例來說,因為過去我們東方人特別喜歡一個詞叫因果,我們認為善有善報、惡有惡報,其實根據交管部門調查的數據,在街頭遭遇橫禍的人其實跟道德無關,秦檜的壽命是岳飛的兩倍半,很多貪官在發現之前,那過的確實是令人無限羨慕的生活。因此,通過大數據我們能用一種全新的觀念來看待這個世界,這個世界是有關聯來建構的一個新型的關系,只有科技發展到一定水平,才能達到這樣的高度。
與此同時,在大數據時代,我們該恪守的底線還是要恪守,但它的確在告訴我們真相,因為科學就是在告訴我們真相。我有一個願望,就是剛才講的大數據是新的黃金,我希望它更多地用於社會公益事業,比如,去挽救地震局。這樣能避免很多人道主義的災難和財產的損失,結論是我們過去認為上帝是哲學家或者叫哲人,現在發現他老人家是個老頑童。
2 大數據究竟有沒有對各領域的工作和生活產生影響?
王曉陽:大數據影響了智慧。怎麼理解呢?大數據本身的概念是數據採集和處理,到了一定的程度使我們的社會也好,管理者也好,都能獲益——從城市來講,一個管理者可以聚集這些數據和處理方式,使得我們能用智慧來管理城市,可以從交通管理、公共衛生,還有其他各個方面來管理,這管理是需要數據,數據產生了智慧,然後反過頭來能管理我們的模式。
比如,在公共衛生方面,採集數據到了目前為止其實已經進行了好多年,它的數據採集原來並不是為了大數據來做的,其實是為了一個方便——方便大家去看病。而且你的電子病例等,讓你看病更人性化,或者對醫生來講能更快、更方便地去熟悉病情,但在這種情況下,這個數據一旦採集起來使得我們對整個城市的健康狀況就能進一步了解,所以,剛才講的看病的數據其實是原本的用意,大數據一來其實我們就能看見原來看不見的問題。比如一些比較大趨勢方面的問題,流行病在哪個地方比較多,或者它怎樣流傳的,等等。這些事情我們原來是看不到的,這種情況就是大數據對我們的幫助。
徐明強:先舉個例子,有一個球和一隻螞蟻,球跟螞蟻說,做三維世界的事物太好了,你看這條線上有多少個螞蟻我一眼就看見了,螞蟻說我真的不信,我得按照這條線爬,爬到頭計數器沒有出故障我才知道有多少螞蟻。這能看到三維和二維差了一維,就差了這么大,所以大數據首先它不是數據大,不是同樣的數據多了就變成大數據,而是在原有的二維、原有的資料庫基礎上,再建立一維,給它一個全新的看點。舉例說明,你如果在美國,你是欠了債的,除了債主對你感興趣,還有人會對你感興趣——如果你欠了債,突然你可以還債了,那麼銀行會對你感興趣。在11年前,美國資本一號就發明了一種大數據的應用,它可以找到哪些人是欠了銀行的錢、欠了信用卡的錢,然後它就會觀察你的消費數據,當它發現你可以開始還的時候,他立刻把你再買過來,從此以後他就吃上了你的利息。資本一號這個公司在2001年時,每個季度的增長率是20%,就是因為它大數據的程序,它可以高命中率地發現這個,它是從哪裡找來的數據呢?從沃爾瑪、從各種各樣的消費數據中找到的。從這個實例我們可以看出,大數據這個原有的數據分析商務智能上加了一層,商務智能不能告訴我們別人將要並且能做什麼。
關於我們公司對奧斯卡頒獎的預測,除了對李安的預測沒對,其他都對了。其實,我們的預測是把所有人員都做了一個概率,所以做了19個預測對的,是我們放在第一概率的獲獎人,下面還有4個是第二概率,所以李安導演我們放在第二概率,我們把他放在後面。
這個預測跟大數據很有關系,首先做大數據需要有IQ,智商,就是說,這個模型要非常好。我們公司做IQ的人叫加戴維·羅斯查爾德,是我們研究部門的一個人。還有其他人,我要講講,他這個人的IQ有什麼差別?他這個人的IQ用了一個非常簡單聚合的模式,除了IQ還有什麼呢?智商以後還要有勤商,勤奮的勤。勤商就是說,他非常勤奮地去找數據,要找多種數據,還要找非常實際的數據,所以他在網上、社交網上都有找。有一些找不到的數據,怎麼辦?他找人做調查,然後找人來做,所以他又有智商,又有勤商,夠不夠呢?還不夠,五年前這種事情做不到,為什麼?五年前他要做這樣大量的數據的話,自己作為一個研究生的小預算是做不到的,但雲計算的出現,他就可以做到了。可以延伸這些數據,用很多處理器來處理,現在他就是用了雲做這樣一個計算,最後成功了。
孫健:我寫的是機會加危險,就是危機。我同意維克托的結論,說這是一個新的金礦,或者有說法叫新的機會,但不要忘記那同時會帶來很多危險。如果我們不能很好地去處理大數據的話,特別是像在我們日常工作中接觸到的很多中國企業,它們大多數甚至在最基礎的數據分析方面還比較落後,這就意味著,我們該怎樣很快地過渡到大數據時代去,去面對大數據挑戰,如果准備不好,那我很擔心,這會像以往很多新技術來了以後的情況,很容易造成很多企業邯鄲學步——連走路都還沒學會,就要學跳,一下子邁到大數據時代,企業不知道怎樣真正地讓大數據發揮作用。
在我們的行業里,因為大數據而做了很多產品創新。談到大數據時代的破壞型創新,實際上也是談了同樣的問題,因為在創新的同時,事實上要推導、顛覆原來的很多東西,包括我們咨詢行業的很多服務和產品都要做更新,也要跟上時代。比如,我們有一家很大的全球性零售企業,它每天要處理海量數據,那麼在海量數據之前,雖然有了技術手段,它仍需找到一個很好的切入點,去解決大數據該怎樣應用到業務中,改變業務模式,給業務創新帶來價值。因為要把這個大數據加以更好地利用,再便宜還是投資,還是要改變,硬體、軟體各方面要做配置,甚至對應的組織要做調整,一個企業要做進一步調整才能適應大數據時代的需求,才能讓大數據發揮作用。所以我們做的工作就是幫助企業找到它的價值創造,建立業務模式,來證明在這方面做這樣的投資,讓大數據發揮作用是值得的。
俞吾金:我想提出不同看法,就是因為人類的思維有一個特點,他把覺悟的東西誇大為全球的。比如你看到三隻天鵝是白的,但其實有一千隻天鵝都是白的,可在澳大利亞發現了一隻黑天鵝,就把一切天鵝都是白的這個原理給推翻了,我覺得大數據這個問題是重要的,但如何正確看待它,不能走極端。大數據反映了人們從數量關系去理解生活的一種思維方法,從古代開始就非常重視,當然古代沒有使用大數據這個概念。
數字本身對生活的重要性越來越大。從哲學上看,它有實踐性,比如數學中的π,圓周率,它等於3.1415926……它就把所有大數據都囊括進去了,更容易理解的是三分之一,三分之一的另一種寫法就是0.333333無限被延伸,所以黑客在邏輯學里就強調,這個無限包容在三分之一這個有限中,有限中包含著無限的一個展開,包含所有數據的展開,這就體現了實踐精神。從這個實踐角度看這個數據,我認為大數據在當代的變動中有重要地位,但看它要有眼光,不要誇大也不要縮小。
3 怎麼理解三分之一就把一生所有數據都概括了?
維克托:我不同意俞老師的觀點。數字的歷史很悠久,但是,以前我們對這些數字的處理方式非常有限,光有技術是不夠的,能對數據進行分析,比如像數字,它對你只是一個數字,這個意義不重要,你也可以用一個漢字或一個字母來表示,那從這個角度來看,大數據不過是一個很長很長的數字,你可以用心記住就可以。
但其實,大數據的價值在於,在整個數據的收集過程中,需要運用分析才可以了解。比如,如何進行預防性的維修,如何能夠防止爆發等,我們不是把這個數字簡單地記下來或背下來,而是要通過分析,通過數據統計的分析,通過把它進行整理了解之後分析,這不是你背下來一個數字就可以了,這是非常大的區別。
4 大數據時代究竟會給生活帶來什麼樣的顛覆?
維克托:首先從商業來講,我覺得有三個元素要記住:一個是在商業世界中決策將發生變化,會越來越清楚地證明,要靠數據說話。
在美國,最大的互聯網公司大概是谷歌,每天都有30億搜索請求。有一天他們屏幕上准備用藍色,然後他們就選了一個特別的藍色,但他是要測試41種不同的藍色,來看到底哪一種最受歡迎。他本來想自己來決定:我是首席設計師啊,我就選了一種藍色。但他的老闆說:不行,我需要實證來告訴我們哪一種藍色最受歡迎。但這個谷歌的首席設計師就辭職了,他說我是首席設計師啊,我是最清楚的。通過很多測試發現,有一種藍色的藍是裸眼看到和設計師選的藍色不太區別得開,但另一種通過測試所產生的藍色,更受歡迎,有更多點擊量。通過實證做出來的決策更有效。類似例子有很多,都說我做這行已經幾十年了,我說的肯定沒錯。這種傳統的社會觀念和思維方式會受到挑戰,我們的決策必須要靠數據說話,這是第一點。
第二,就是在我們出去說話時,我們要注意不能誤讀數據,錯誤的數據是不行的。也就是如果原來的材料不對,原料是垃圾,出來的東西肯定也是垃圾,這個公司出這些數據的話都是比較容易理解的,但可能不是你應該熟悉的數據。
第三個是挑戰。就是普通產業,尤其是計算機產業,數據會超越它們,這個可能是有一種挑戰式的說法。如果沒有足夠的數據,你也趕不上一個大量數據的比較平庸的模型,也就是為什麼說數據會超越那些產業。比如機器翻譯這件事,在六七十年代,IBM花了很多錢想用機器翻譯,它要弄一些語言的規則輸入到機器中,但效果不太好,它就有了一個新想法,它不是把一種語言的語法規則輸入機器,而是把加拿大議會中的英法雙語的互譯輸進去,把成千上萬的翻譯資料輸入進去,它就有了大量的累計組織上的資料庫,這個效果就好得多。而谷歌又在這個領域有更多數據,一下子這個翻譯就更成熟、效果更好。可以說,是這個數據使它超越了這個軟體。因為今天這個大數據的力量,可以很容易地獲得想要的資訊,但大概在十年前,需要五十萬個伺服器,大量的儲存以及處理數據的模式,你才能開始一個新業務。今天如果要輸入業務,用雲計算來測試就可以了。比如有一個叫蒂塞德的公司,它有很多產品及價格,它收購一些數據來預測到底一個產品是上架還是下架,雖然他們擁有大量客戶,可這個公司的員工只有13個人,因此它的伺服器有很多,他們擁有大量的數據。可見,這個舞台不僅可以讓大公司來做,而且創新的小公司也能以平等的地位來競爭。
王曉陽:其實講到改變了我們整個思維方式,所謂的就是實驗這個思維,比理論思維更重要,這一點我不是太懂。其實維克托先生剛才舉的例子,是在很多情況下,是我們用數據去驗證以前想要能夠有的東西,有一些智慧確實是在數字里挖掘出來的,這個可能是一個語言來自不同的地方,怎麼講呢?基於在大數據的情況下,其實有一個所謂的循環概念,等於說你有了智慧以後去驗證,驗證數據里又產生了各種各樣的智慧來做這樣的理解,所以從這個角度來講,我覺得是大數據的情況下面,沒有顛覆,而是說一個改進,對我們認知世界的改進。就公共衛生這個話題來說,我們舉的最多的一個例子就是在谷歌,有一個所謂的趨勢預測,它就是用了網民們搜索的詞來預測。
所謂的預測流感,怎麼做?很簡單,就是它去分析了以往的數據,說在流感發生的地域,地域的那個時間大家是用什麼詞去搜索,這樣就可以做統計。做了統計以後,反過頭來用這些搜索詞來預測這個流感,這種情況下是什麼意思?並不見得是說這種數據或大數據的情況就能使我們對這個流感突然有一個新的認識,其實不然,其實是谷歌的那些工程師們有一個想法,認為我們好像流行流感,這和大家有關,而每個人都會用搜索來獲取一些跟流感有關的信息,就有了這樣的關聯。這個關聯怎麼去發現?這就要用數據去發現,用所謂的大數據的做法,去實現我們已有的一些概念的東西,把它實現了之後,就能做預測。所以從這樣的角度講,並不見得是有了大數據,我們就可以把所有的智慧都丟掉,我們不用IQ了,只要數據就好了,這肯定是不行的。一定是IQ加上數據,然後能讓它有個正反的概念,這是大數據所應該乾的事情。
童士豪:我有不同想法,我覺得剛才維克托先生講的一點很有意思,就是對智慧的要求,大數據時代是不一樣的。在大數據時代,對智慧的要求可以低一點,都能產生更好的結果,這是一個有意思的事情。他剛才提了一個例子,之前要做翻譯是很難的,你的規則必須特別強、精簡、完整,才能有60%、70%的准確率。但在大數據時代,我們不用想那些,不用花智慧講那麼復雜的規則和套路,乾脆把幾億個已翻譯好的文章交給電腦,用統計學的方式找到哪種情況下,翻譯的字的另外一個意思是比較對的。這對於智慧的要求其實是降低了,但效果可能會更好。
孫健:可能我們對智慧的理解有歧義。我覺得維克托先生講的我理解,因為他有另一本書叫《Delete》,裡面專門講了這個三重智慧,談了取捨問題。因為隨著存儲技術、網際網路的發展,他講的更多的是知識,知識的要求可以低,但對智慧,我覺得理解不一樣。我理解的智慧是,你判斷一個事物的根本的、真正的洞察能力。就是,你對一個事物的洞察能力還是需要有,不會因為大數據的存在而削弱或不需要了,而恰恰因為大數據的存在才更需要洞察力。
5 大數據時代到底真正來臨了嗎?
王曉陽:大數據時代來不來臨要看你怎麼度量、衡量。現在這個數據的量和種類,以及採集的方式、手段,處理的手段,絕對已經達到了「前無古人,後無來者」的感覺。這個情況下,我們從這個數據採集以及數據處理這個能力方面來講,我們的大數據時代來臨了,但我們使用數據利用數據這個才是剛剛開始,只是剛起步。
而大數據改變我們生活的時代,還沒有完全到來,但為這個我們已經做了很多准備,這是城市的管理問題。我們為大數據時代做了很多准備,比如在數據採集方面已經做了很多准備,怎麼樣利用這個數據來做我們這個智慧城市,這是一個最大的問題。
徐明強:從商業角度來看,我從運用上說,個人認為是來臨了。舉個例子,墨客這樣一個葯材公司,他可以根據天氣性質,比如如果今天冬天特別冷,很多過敏性動物就會冬眠,四五月份突然轉熱時,花粉也開始多了,今年有很多人會過敏,等等,它就通過市場進行營銷,把比如克敏能這種葯材發布出去。
維克托·邁爾·舍恩伯格:美國總統奧巴馬曾說,盡管政府也嘗試,但他總是落後於企業,落後於社會的其他一些群體。所以說搞這種活動能充分激發數據,提供給大眾,而且公司也可以拿這些數據,讓公司能利用這些數據有更多創新。這是一個想法,也許有一些做法,比如商業方法,我認為能通過發揮企業的智慧,發揮像微軟這樣的一些聰明企業的智慧,還是有幫助的,包括和政府的合作來管好社會。
石述思:我有一個感受,當商業巨頭面對屌絲談大數據時,我們都有一種不寒而慄的感覺,因為盡管大數據時代我們每個人都是公平的,我們可以說小公司可以獲得公平競爭待遇,但其實掌握大數據的都是一些巨頭,他們有得天獨厚的優勢來搶我們錢包里的錢,我們很難,因為公司的定義就是在法律允許的范疇中唯利是圖。但我們倒是渴望政府部門能利用大數據為我們提供普惠性的服務,可就像一些智慧城市沒法真正做到智慧管理的案例一樣,所以我對大數據來到中國的前途深表憂慮。還有,即使優秀的公司利用大數據,它也要面對一個現實,比如我們像電視台做廣告的一樣,為什麼現在人依然很多,因為中國貧富差距特別大,如果你掌握了所有消費者的數據,而大多數在今天是無效數據,所以你還是有一個有選擇的大數據的過程,叫有購買力的大數據,所以各種各樣的問題就會出現在我們面前,就是社會本來是我們需要,但它存在很多幕後看不清楚的東西。我們擔心被商業巨頭利用,來完成對消費者進一步的盤剝。
孫健:我覺得從企業角度來看也是同樣的問題。我前面想表達的意思就是,第一我們今天中國很多企業實際上並沒有準備好迎接這個大數據,因為我們現在還停留在比較初級的基礎數據分析時代,我們很多的基礎數據今天都沒有被運用,不要說大數據,就是小數據今天也沒有很好的利用。還有很多假的數據,是因為對這些數據的輸入管理非常不成熟,我自己在工作中接觸很多企業,企業今天做的幾件事大家都在做,有ERP系統,有資料庫,有了數據就往裡面存,但我發覺,有很多中國企業兌現的數據管理沒有規范化的感覺,更沒有很好的利用。這就存在這樣的擔心:最後大數據時代來了以後,我們本來中國企業在這個數據分析的利用上就不擅長,今天有了大數據以後差距會變得更大,以後國際巨頭有一個成熟的數據分析方法,很多健全的商業模式,它會把這個差距變得越來越大。
6 在大數據時代,下一個預言會是什麼,下一個判斷會是什麼?
維克托:接下來怎麼能讓生活比現在更高效,就是要讓城市變得更加智能,這是可行的,為什麼?我強調的是,我們有可能改善我們的公共衛生,改善教育,我們有能力收集數據,公共交通的通化能真正滿足市民的需求,而不只是政客,而且能源消耗也會得到更好的檢測、預測和管理,這樣我們的城市就會更加智能,讓城市的生活更加好。在150年前,曾有預測如果是在城市生活,壽命會更短;在農村生活則壽命長。而150年之後的今天,壽命更加長了,有了大數據我們會更加美好,可是有一個條件,就是那些決策者,他們一定要使用這些數字才可以。
下一步是專家怎麼來做。其實這涉及到在數據時代,數據點是有限的,那麼我們收集的數據,只要我們收集足夠的數據來解決問題就可以了。因為非常復雜、數據點非常少,所以我們的數據點收集起來必須是要高質量的,現在不是這樣的,現在的是更加的多、更加的亂。解釋一下什麼叫更多更亂,更多就是有數據點,關於我們想要研究的一個現象,我們可以更多的進行數據統計,比如在美國,你有DNA基因圖譜,那麼只要2000美金就可以知道你的整個基因圖譜當中的30億這個東西是怎麼組成的,這樣你就可以知道那些30億個精對,現在如果說有一個基因組成可能會導致什麼樣的癌症,就可以查基因圖譜,說我是不容易生這個病的,這是為什麼可以預測是否患癌症的原因。那麼有更多的數據便會存在一定的不準確性,所以,我說更多且更亂,所以這里允許一點點的不準確,或者可以亂一點,這個所謂的亂就是指,不是說每一個數據點都要達到最高的准確度,這個結果就是,不是百分之一百完美,但在大數據這樣一種方向,或者說,我們在正確的數據點上要知道一個方向。知道方向比晚一點知道完美的數據更有效。比如交通預測,也許當下看到的交通預測比實際運用中要晚了20分鍾,可能看起來太晚了,但如果這是預測一個星期的信息,就夠了。
王曉陽:大數據時代對我們這個城市更加理解,所謂的理解就是你知道這個城市裡發生了什麼,這非常重要。在以前,這個城市的管理都是一拍腦袋,有的時候拍腦袋拍出很好的來,拍腦袋也能拍出非常棒的一個城市來,但是有的時候呢?拍腦袋可能太離譜,這種情況下在大數據時代我們怎麼樣利用好,就是我們所講的。而為了政績也可以用大數據來考慮,說這個數字到底對它的政績有沒有好處?就是名義是一個很大的方面,大數據方面不光是理解我們這個城市發生了什麼,而且還能了解我們城市裡的民眾在想什麼?這點對城市管理來說非常重要,城市不光是一個硬體設施,不光是地鐵和高樓,人在裡面非常重要。
以上是小編為大家分享的關於大數據時代,人類生活面臨顛覆的相關內容,更多信息可以關注環球青藤分享更多干貨
Ⅶ 產品數字碼是什麼
咨詢記錄 · 回答於2021-04-25
Ⅷ SQLServer怎麼讀
讀:S - Q - L Server
或讀: /ˈsiːkwəl/ Server
/'si:kwəl/其實是sequel單詞的讀音。
SQL的前身是Structured English QUEry Language,前身以sequel單詞作為的別名(這個巧妙的別名據說當初花了超過兩個工作日的會議才確定下來)。後來衍生出SEQUEL/2,也就是現在的SQL(Structured Query Language)。
(8)資料庫誤讀擴展閱讀:
SQL語句可以用來執行各種各樣的操作,例如更新資料庫中的數據,從資料庫中提取數據等。目前,絕大多數流行的關系型資料庫管理系統,如Oracle,Sybase,Microsoft SQL Server,Access等都採用了SQL語言標准。
雖然很多資料庫都對SQL語句進行了再開發和擴展,但是包括Select,Insert,Update,Delete,Create,以及Drop在內的標準的SQL命令仍然可以被用來完成幾乎所有的資料庫操作。