終極演算法下載
『壹』 《終極演算法機器學習和人工智慧如何重塑世界》epub下載在線閱讀,求百度網盤雲資源
《終極演算法》([美] 佩德羅·多明戈斯)電子書網盤下載免費在線閱讀
資源鏈接:
鏈接:https://pan..com/s/13L5BZg0_z-3JHM9dv9pJtQ
書名:終極演算法
作者:[美] 佩德羅·多明戈斯
譯者:黃芳萍
豆瓣評分:7.1
出版社:中信出版集團
出版年份:2017-1-1
頁數:402
內容簡介:
演算法已在多大程度上影響我們的生活?
購物網站用演算法來為你推薦商品,點評網站用演算法來幫你選擇餐館,GPS系統用演算法來幫你選擇最佳路線,公司用演算法來選擇求職者……
當機器最終學會如何學習時,將會發生什麼?
不同於傳統演算法,現在悄然主導我們生活的是「能夠學習的機器」,它們通過學習我們瑣碎的數據,來執行任務;它們甚至在我們還沒提出要求,就能完成我們想做的事。
什麼是終極演算法?
機器學習五大學派,每個學派都有自己的主演算法,能幫助人們解決特定的問題。而如果整合所有這些演算法的優點,就有可能找到一種「終極演算法」,該演算法可以獲得過去、現在和未來的所有知識,這也必將創造新的人類文明。
你為什麼必須了解終極演算法?
不論你身處什麼行業、做什麼工作,了解終極演算法都將帶給你嶄新的科學世界觀,預測以後的科技發展,布局未來,佔位未來!
作者簡介:
佩德羅•多明戈斯(Pedro Domingos)
•美國華盛頓大學計算機科學教授,加州大學歐文分校信息與計算機科學博士,在機器學習與數據挖掘方面著有200多部專業著作和數百篇論文。
•國際機器學習學會聯合創始人,《機器學習》雜志編委會成員,JAIR前副主編。
•美國人工智慧協會院士(AAAI Fellow,國際人工智慧界的最高榮譽),榮獲SIGKDD創新大獎(數據科學領域的最高獎項)、斯隆獎(Sloan Fellowship)、美國國家科學基金會成就獎(NSF CAREER Award)、富布賴特獎學金、IBM學院獎以及多個頂級論文獎項。
『貳』 《終極演算法機器學習和人工智慧如何重塑世界》epub下載在線閱讀,求百度網盤雲資源
《終極演算法》([美] 佩德羅·多明戈斯)電子書網盤下載免費在線閱讀
資源鏈接:
鏈接:https://pan..com/s/1az3Npn6XLJgEnftJYKHEtg 提取碼:2t85
書名:終極演算法
作者:[美] 佩德羅·多明戈斯
譯者:黃芳萍
豆瓣評分:7.1
出版社:中信出版集團
出版年份:2017-1-1
頁數:402
內容簡介:
演算法已在多大程度上影響我們的生活?
購物網站用演算法來為你推薦商品,點評網站用演算法來幫你選擇餐館,GPS系統用演算法來幫你選擇最佳路線,公司用演算法來選擇求職者……
當機器最終學會如何學習時,將會發生什麼?
不同於傳統演算法,現在悄然主導我們生活的是「能夠學習的機器」,它們通過學習我們瑣碎的數據,來執行任務;它們甚至在我們還沒提出要求,就能完成我們想做的事。
什麼是終極演算法?
機器學習五大學派,每個學派都有自己的主演算法,能幫助人們解決特定的問題。而如果整合所有這些演算法的優點,就有可能找到一種「終極演算法」,該演算法可以獲得過去、現在和未來的所有知識,這也必將創造新的人類文明。
你為什麼必須了解終極演算法?
不論你身處什麼行業、做什麼工作,了解終極演算法都將帶給你嶄新的科學世界觀,預測以後的科技發展,布局未來,佔位未來!
作者簡介:
佩德羅•多明戈斯(Pedro Domingos)
美國華盛頓大學計算機科學教授,加州大學歐文分校信息與計算機科學博士,在機器學習與數據挖掘方面著有200多部專業著作和數百篇論文。
國際機器學習學會聯合創始人,《機器學習》雜志編委會成員,JAIR前副主編。
美國人工智慧協會院士(AAAI Fellow,國際人工智慧界的最高榮譽),榮獲SIGKDD創新大獎(數據科學領域的最高獎項)、斯隆獎(Sloan Fellowship)、美國國家科學基金會成就獎(NSF CAREER Award)、富布賴特獎學金、IBM學院獎以及多個頂級論文獎項。
『叄』 《超級思維人類和計算機一起思考的驚人力量》pdf下載在線閱讀,求百度網盤雲資源
《超級思維》([美]托馬斯·W·馬隆)電子書網盤下載免費在線閱讀
資源鏈接:
鏈接:https://pan..com/s/1LIgZ_L0uIwEo0Up1L81g0A
書名:超級思維
作者:[美]托馬斯·W·馬隆
譯者:任燁
豆瓣評分:7.3
出版社:中信出版集團
出版年份:2019-10
頁數:314
內容簡介:
麻省理工學院集體智能中心主任新作,如何運用人機超級思維這種新型集體智能,解決商業和社會領域中的一些重要問題。
-
-
「超級思維」一詞的意思是「多種個體思維形成的強大組合」。《超級思維》要講述的正是超級思維在我們這個星球上的發展歷程。我們會看到人類的歷史在很大程度上就是人類超級思維的歷史,也就是以群體(比如層級制、社群、市場和民主制)為單位的人,如何完成了僅憑一己之力絕不可能做到的事情。
-
更重要的是,我們還會看到計算機將對人類超級思維的未來發展產生多麼關鍵的影響。在很長一段時間里,計算機的重要貢獻都不是人工智慧,而是「超級連接」,即以全新的方式和空前的規模將人類的思維彼此連接起來。不過隨著時間的推移,計算機也會完成越來越多如今只有人類才能勝任的復雜思考。
-
《超級思維》探討的主要內容並不是計算機將如何完成人類過去常做的事情,而是人類和計算機將如何共同完成以前不可能做到的事情,人機超級思維將如何成為智能水平更高的工具,以及我們將如何利用這些新型的集體智能來解決企業、政府和其他社會領域中的一些重要問題。
-
繼人工智慧、超級智能、終極演算法之後,《超級思維》一書提出了一個炙手可熱的新概念:超級思維。「超級思維」的意思是「多種個體思維形成的強大組合」。《超級思維》要講述的正是超級思維在我們這個星球上的發展歷程。我們會看到人類的歷史在很大程度上就是人類超級思維的歷史,也就是以群體(比如層級制、社群、市場和民主制)為單位的人,如何完成了僅憑一己之力絕不可能做到的事情。
-
《超級思維》的作者托馬斯·馬隆是麻省理工學院集體智能中心的負責人,是全世界研究「群體決策」「集體智能」的頂級專家,被尊為「集體智能之父」。他在《超級思維》中針對計算機將如何增強集體智能,以及超級思維如何能幫助我們解決當今世界面臨的極其復雜的問題,提出了令人耳目一新的前瞻性和現實主義觀點。
-
《超級思維》從集體智能的歷史講起,講述了超級思維在我們這個星球上的發展歷程。更重要的是,《超級思維》列舉了幾十個生動的真實案例,從亞當·斯密《國富論》中的別針工廠,到臉書、谷歌、維基網路、推特等網路社區,再到亞馬遜的「土耳其機器人」和麻省理工學院的氣候合作實驗室,這些案例極具說服力和感染力地向我們展示出一幅超級思維讓世界、企業、組織、生活,以及你我變得更智能的美好圖景。
《超級思維》得到了多個行業、多個領域的大咖點贊推薦。他們是:麥肯錫全球研究院院長詹姆斯·曼尼卡,麻省理工學院媒體實驗室主任伊藤穰一,科幻小說作家、雨果獎獲得者弗諾·文奇,谷歌公司副總裁、「互聯網之父」溫頓·瑟夫,麻省理工學院人工智慧實驗室前主任帕特里克·溫斯頓。
-
《超級思維》適用於跨國公司、政府、非營利組織、創新型組織、網路社區等機構和組織,適用於科學界、醫學界、商界、教育界等不同科研領域,適用於地區、國家和全球等不同地域。
-
這本研究透徹、可讀性強的書,對超級思維會在商業和社會中給我們帶來的機遇和挑戰,進行了深刻且務實的探索。在數字技術統治的世界中,關注如何利用人類思維力量的領導者,都應該讀一讀這本書。
——詹姆斯·曼尼卡,麥肯錫全球研究院院長
-
集體智能之父針對計算機將如何增強集體智能,以及超級思維如何能幫助我們解決當今世界面臨的極其復雜的問題,提出了令人耳目一新的現實主義觀點。
——伊藤穰一(Joi Ito),麻省理工學院媒體實驗室主任
-
人類與計算機及網路的組合具有巨大的潛力。像我們這樣微小的生物該如何利用這種潛力呢?馬隆在這本書中以一種具體的方式回答了這個問題,並為一個新學科奠定了基礎:超級思維工程學。
——弗諾·文奇(Vernor Vinge),
科幻小說作家、雨果獎獲得者、「技術奇點」概念創造者
-
這本書深入探索了信息技術的力量如何使新型人類組織成為現實。強烈推薦!
——吉米·威爾士(Jimmy Donal Wales),
維基網路創始人
-
馬隆帶領我們踏上了一段精心策劃的旅程,對思想、智能、推理和意識等概念進行了探索。他從極其廣泛的角度看待這些概念,並改變了我對「思考」的理解。
——溫頓·瑟夫(Vinton Cerf),
谷歌公司副總裁、「互聯網之父」之一
-
托馬斯·馬隆恰當地表達出對人工智慧的擔憂,解釋了為什麼人工智慧在超級思維中與人類協作時效果更佳。如何讓一個超級思維變得更智能,是這本精彩的著作帶給我們的諸多驚喜之一。
——帕特里克·溫斯頓(Patrick Winston),
麻省理工學院人工智慧實驗室前主任、《人工智慧》一書作者
作者簡介:
托馬斯·W. 馬隆(Thomas W. Malone)
-
美國麻省理工學院斯隆管理學院的帕特里克·麥戈文管理學教授,信息技術教授,工作與組織研究教授。他也是麻省理工學院集體智能中心的創辦者和負責人,以及麻省理工學院「創造21世紀的組織」項目的兩位聯合創始人之一。
-
他著有《工作的未來》(The Future of Work)一書,還寫作了100多篇文章、研究論文和書籍章節,他還是4家軟體公司的聯合創始人、11項專利的發明者和4本圖書的合編者。
『肆』 怎麼評價《終極演算法》這本書.
對於這樣一種重要技術,市面上一直缺少一本適合普通讀者的入門科普讀物,而眾多的專業書籍要求讀者具備一定的高等數學和計算機基礎演算法知識,並不適合科普的需要。直到朋友將《終極演算法:機器學習和人工智慧如何重塑世界》推薦給我時,我欣慰地發現,這正是想了解一點機器學習的讀者所需要的。
『伍』 《終極演算法機器學習和人工智慧如何重塑世界》epub下載在線閱讀全文,求百度網盤雲資源
《終極演算法機器學習和人工智慧如何重塑世界》([美]佩德羅·多明戈斯)電子書網盤下載免費在線閱讀
鏈接:https://pan..com/s/1VygoLeNPNozcQ9vOBI9rjg
書名:終極演算法機器學習和人工智慧如何重塑世界
作者:[美] 佩德羅·多明戈斯
出版社:中信出版集團
副標題:機器學習和人工智慧如何重塑世界
原作名:The Master Algorithm: How the Quest for the Ultimate Learning Machine Will Remake Our World
譯者:黃芳萍
出版年:2017-1-1
頁數:402
內容簡介
演算法已在多大程度上影響我們的生活購物網站用演算法來為你推薦商品,點評網站用演算法來幫你選擇餐館,GPS系統用演算法來幫你選擇最佳路線,公司用演算法來選擇求職者……當機器最終學會如何學習時,將會發生什麼?
作者簡介
佩德羅•多明戈斯(Pedro Domingos)美國華盛頓大學計算機科學教授,加州大學歐文分校信息與計算機科學博士,在機器學習與數據挖掘方面著有200多部專業著作和數百篇論文。國際機器學習學會聯合創始人,《機器學習》雜志編委會成員,JAIR前副主編。美國人工智慧協會院士(AAAI Fellow,國際人工智慧界的最高榮譽),榮獲SIGKDD創新大獎(數據科學領域的最高獎項)、斯隆獎(Sloan Fellowship)、美國國家科學基金會成就獎(NSF CAREER Award)、富布賴特獎學金、IBM學院獎以及多個頂級論文獎項。
『陸』 《終極演算法機器學習和人工智慧如何重塑世界》pdf下載在線閱讀全文,求百度網盤雲資源
《終極演算法機器學習和人工智慧如何重塑世界》網路網盤pdf最新全集下載:
鏈接: https://pan..com/s/11uSQcjgbFHeGbwjuYNREHA
簡介:購物網站用演算法來為你推薦商品,點評網站用演算法來幫你選擇餐館,GPS系統用演算法來幫你選擇*佳路線,公司用演算法來選擇求職者……當機器最終學會如何學習時,將會發生什麼?不同於傳統演算法,現在悄然主導我們生活的是「能夠學習的機器」,它們通過學習我們瑣碎的數據,來執行任務;它們甚至在我們還沒提出要求,就能完成我們想做的事。
『柒』 終極演算法:機器學習和人工智慧如何重塑世界 pdf 百度雲下載
如推薦序的作者所寫的一樣,我是不喜歡「終極」這樣的說法的。但既然本書作者是大牛,這么說也定然有其緣由。且看下去吧。我比較討厭歐美作家寫書的一個特點:很長,很羅嗦。教材的話還好一些,可以稱之為詳細,但科普類的書籍簡直要命。我真的懷疑他們是不是有湊字數的想法。
前面三章實在有點羅嗦,第四章之後就好了,講的內容就實在多了。因為我很早之前,從學習形式語言開始了解符號計算(這是七十年代AI的研究重點),便傾向於符號學派AI,這本書倒是先從這個點切入的,我覺得很好,不會讓人一看到AI,就想到ML,就想到概率統計,就想到優化。如果這么簡單就能實現AI,這與「人工智障」有什麼區別。我們一直強調,「人工神經網路」與大腦中的「神經網路」並沒有什麼關聯,第四、五章講到了這些區別,清晰的指出了,我們需要智能,但智能的運行方式,卻不必類似於我們的大腦。概率並不是我喜歡的部分,因為它沒有辦法幫助推理和證明,第六章講到了此種問題。之後的幾章就比較玄乎了,我覺得沒有什麼實在的內容。
雖然這本書在京東」機器學習「排行榜的前端位置,但是,其實並不是給想要學習機器學習並以此工作的人寫的,這是一本科普書,或者類似於夜下閑聊的記錄。如果連教材都沒有時間看,連數學都沒有時間學習,哪兒來的時間看看這個玄而又玄的東西呢
『捌』 求《終極演算法機器學習和人工智慧如何重塑世界》全文免費下載百度網盤資源,謝謝~
《終極演算法機器學習和人工智慧如何重塑世界》網路網盤pdf最新全集下載:
鏈接: https://pan..com/s/11uSQcjgbFHeGbwjuYNREHA
簡介:購物網站用演算法來為你推薦商品,點評網站用演算法來幫你選擇餐館,GPS系統用演算法來幫你選擇*佳路線,公司用演算法來選擇求職者……當機器最終學會如何學習時,將會發生什麼?不同於傳統演算法,現在悄然主導我們生活的是「能夠學習的機器」,它們通過學習我們瑣碎的數據,來執行任務;它們甚至在我們還沒提出要求,就能完成我們想做的事。
『玖』 『終極演算法』摘抄筆記-貝葉斯學派
對於貝葉斯學派來說,學習「僅僅是」貝葉斯定理的另外一個運用,將所有模型當作假設,將數據作為論據:隨著你看到的數據越來越多,有些模型會變得越來越有可能性,而有些則相反,直到理想的模型漸漸突出,成為最終的勝者。
假設你半夜在一個陌生的星球上醒來。雖然你能看到的只是繁星閃爍的天空,你有理由相信太陽會在某個時間點升起,因為多數星球會自傳並繞著自己的太陽轉。所以你估計相應的概率應該會大於1/2(比如說2/3)。我們將其稱為太陽會升起來的「 先驗概率 」,因為這發生在看到任何證據之前。 「先驗概率」的基礎並不是數過去這個星球上太陽升起的次數,因為過去你沒有看到;它反映的是對於將要發生的事情,你優先相信的東西,這建立在你掌握的宇宙常識之上 。但現在星星開始漸漸暗淡,所以你對於太陽會升起的信心越來越強,這建立於你在地球上生存的經歷之上。你的這種信心源自「 後驗概率 」,因為這個概率是 在看到一些證據後得出的。天空開始漸漸變亮,後驗概率又變得更大了 。
貝葉斯通過以下句子概況了這一點:P(原因|結果)隨著P(結果),即結果的先驗概率(也就是在原因不明的情況下結果出現的概率)的下降而下降。最終,其他條件不變,一個原因是前驗的可能性越大,它該成為後驗的可能性就越大。綜上所述,貝葉斯定理認為: P(原因|結果)=P(原因)×P(結果|原因)/ P(結果)
貝葉斯定理之所以有用,是因為通常給定原因後,我們就會知道結果,但我們想知道的是已知結果,如何找出原因。例如,我們知道感冒病人發燒的概率,但真正想知道的是,發燒病人患感冒的概率是多少。
貝葉斯定理作為統計學和機器學習的基礎,受到計算難題和巨大爭論的困擾。你想知道原因也情有可原:這不就是我們之前在感冒的例子中看到的那樣,貝葉斯定理是由條件概率概念得出的直接結果嗎?的確,公式本身沒有什麼問題。爭議在於相信貝葉斯定理的人怎麼知道推導該定理的各個概率,以及那些概率的含義是什麼。 對於多數統計學家來說,估算概率的唯一有效方法就是計算相應事件發生的頻率 。例如,感冒的概率是0.2,因為被觀察的100名病人中,有20名發燒了。這是「頻率論」對於概率的解釋,統計學中占據主導地位的學派就是由此來命名的。但請注意,在日出的例子以及拉普拉斯的無差別原則中,我們會做點不一樣的事:千方百計找到方法算出概率。到底有什麼正當的理由,能夠假設太陽升起的概率是1/2、2/3,或者別的呢?
然而, 貝葉斯學派眼中的概率 。概率並非頻率,而是一種主觀程度上的信任。因此,用概率來做什麼由你決定,而貝葉斯推理讓你做的事就是:通過新證據來修正你之前相信的東西,得到後來相信的東西(也被稱為「轉動貝葉斯手柄」)。
隨著變數的增加,如果有20種症狀和1萬個病人就會遇到之前提到過的組合爆照問題。因此我們會做簡化的假設來減少概率的數量,這些概率的數量由我們估算而來,且我們可以掌控。一個很簡單且受人追捧的假設就是,在給定原因的情況下,所有的結果都相互獨立。如果我們想直接估算P(感冒|發燒、咳嗽等),假如不利用定理先將其轉化成P(發燒、咳嗽等|感冒),那麼我們就還需要指數數量的概率,每個組合的症狀以及感冒或非感冒都有一個概率。
如果學習演算法利用貝葉斯定理,且給定原因時,假定結果相互獨立,那麼該學習演算法被稱為「樸素貝葉斯分類器」。
統計學家喬治·博克斯說的一句很有名的話:「所有的模型都是錯的,但有些卻有用。」雖然一個模型過於簡化,但你有足夠的數據用來估算那就比沒有數據的完美模型要好。令人詫異的是,有些模型錯誤百出,同時又很有用。經濟學家彌爾頓·弗里德曼甚至在一篇很有影響力的文章中提出,最有說服力的理論往往受到最大程度的簡化,只要這些理論所做的預測是准確的,因為它們用最簡潔的方法解釋最復雜的問題。
1913年第一次世界大戰前夕,俄國數學家安德烈·馬爾可夫發表了一篇文章,將所有事情的概率運用到詩歌當中。詩中,他模仿俄國文學的經典:普希金的《尤金·奧涅金》,運用了當今我們所說的「馬爾可夫鏈」。他沒有假定每個字母都是隨機產生的,與剩下的毫無關聯,而是 最低限度引入了順序結構:每個字母出現的概率由在它之前、與它緊接的字母來決定 。
例如母音和輔音常常會交替出現,所以如果你看到一個輔音,那麼下一個字母(忽略發音和空格)很有可能就是母音,但如果字母之間互相獨立,出現母音的可能性就不會那麼大。這可能看起來微不足道,但在計算機發明出來之前的年代,這需要花費數小時來數文字,而馬爾可夫的觀點在當時則很新穎。如果母音i是一個布爾型變數,《尤金·奧涅金》的第i個字母是母音,則該變數為真,如果它是一個輔音則為假。
源於谷歌的 頁面排名 ,本身就是一條馬爾可夫鏈。拉里·佩奇認為, 含有許多鏈接的頁面,可能會比只含幾個的要重要,而且來自重要頁面的鏈接本身也更有價值 。這樣就形成了一種無限倒退,但我們可以利用馬爾可夫鏈來掌控這種倒退。想像一下,一個頁面搜索用戶通過隨機點擊鏈接來從這個頁面跳到另外一個頁面:這時馬爾可夫鏈的狀態就不是文字而是頁面了,這樣問題就變得更為復雜,但數學原理是一樣的。那麼每個頁面的得分就是搜索用戶花在該頁面上的時間,或者等於他徘徊很久後停留在該頁面上的概率。
如果我們測量的不僅僅是母音對輔音的概率,還有字母順序遵循字母表順序的概率,利用與《尤金·奧涅金》一樣的統計數據,我們可以很愉快地生成新的文本:選擇第一個字母,然後在第一個字母的基礎上選擇第二個字母,以此類推。當然結果是一堆沒有意義的數據,但如果我們讓每個字母都依照之前的幾個字母而不止一個字母,這個過程就開始聽起來更像一個酒鬼的瘋話,雖然從整體上看沒有意義,但從局部上看卻很連貫。雖然這還不足以通過圖靈測試,但像這樣的模型是機器翻譯系統的關鍵組成部分,比如谷歌翻譯可以讓你看到整版的英文頁面(或者幾乎整版),不管原頁面的語言是什麼。
如果某些狀態組成一條馬爾可夫鏈,但我們看不到它們,得從觀察中將它們推導出來。人們稱其為 隱藏的馬爾可夫模型 ,或者簡稱為HMM(有點誤導人,因為被隱藏的是狀態,而不是模型)。HMM和Siri一樣,處於語音識別系統的中心。在語音識別過程中,隱藏的狀態是書面形式的單詞,而觀察值則是對Siri說的聲音,而目標則是從聲音中推斷出單詞。模型有兩個組成部分:給定當前單詞的情況下,下一個單詞出現的概率和在馬爾可夫鏈中的一樣;在單詞被說出來的情況下,聽到各種聲音的概率。
HMM還是計算生物學家最為喜愛的工具。一個蛋白質分子是一個氨基酸序列,而DNA則是一個鹼基序列。舉個例子,如果我們想預測一個蛋白質分子怎樣才能形成三維形狀,我們可以把氨基酸當作觀察值,把每個點的褶皺類型當作隱藏狀態。同樣, 我們可以用一個HMM來確定DNA中基因開始轉錄的地點,還可以確定其他許多屬性。
如果狀態和觀察值都是連續而非離散變數,那麼HMM就變成人們熟知的卡爾曼濾波器。經濟學家利用卡爾曼濾波器來從數量的時間序列中消除冗餘,比如GDP(國內生產總值)、通貨膨脹、失業率。「真正的」GDP值屬於隱藏的狀態;在每一個時間點上,真值應該與觀察值相似,同時也與之前的真值相似,因為經濟很少會突然跳躍式增長。卡爾曼濾波器會交替使用這兩者,同時會生成流暢的曲線,仍與觀察值一致。
馬爾可夫鏈隱含這樣的猜想:考慮到現在,未來會有條件地獨立於過去。 此外,HMM假設每個觀察值只依賴於對應的狀態。貝葉斯網路對貝葉斯學派來說,就像邏輯與符號學者的關系:一種通用語,可以讓我們很好地對各式各樣的情形進行編碼,然後設計出與這些情形相一致的演算法。我們可以把貝葉斯網路想成「生成模型」,即從概率的角度,形成世界狀態的方法:首先要決定盜竊案或地震是否會發生,然後在此基礎上決定報警器是否會響起,再次在此基礎上決定鮑勃和克萊爾是否會打電話。貝葉斯網路講述這樣的故事:A發生了,接著它導致B的發生;同時,C也發生了,而B和C共同引起D的發生。為了計算特定事件的概率,我們只需將與之相關事件的概率相乘即可。
你身後有幾個士兵:假設夜深人靜時你正帶領排成縱隊的一個排,穿過敵人的領地,而你想確認所有士兵仍在跟著你。你可以停下,自己數人數,但那樣做會浪費太多時間。一個更聰明的辦法就是只問排在你後面的第一個兵:「你後面有幾個兵?」每個士兵都會問自己後面的士兵同一個問題,知道最後一個士兵回答「一個也沒有。」倒數第二個士兵現在可以說「一個」,以此類推,直到回到第一個士兵,每個士兵都會在後面士兵所報數的基礎上加一。現在你知道有多少兵還跟著你,你甚至都不用停下來。
語音識別的方法:Siri用同樣的想法來計算你剛才說的概率,通過它從麥克風中聽到的聲音來進行「報警」。把「Call the police」(報警)想成一排單詞,正以縱隊形式在頁面上行走,「police」想知道它的概率,但要做到這一點,它需要知道「the」的概率;「the」回過頭要知道「call」的概率。所以「call」計算它的概率,然後將其傳遞給「the」,「the」重復步驟並將概率傳遞給「police」。現在「police」知道它的概率了,這個概率受到句子中每個詞語的適當影響,但我們絕不必建立8個概率的完整表格(第一個單詞是否為「call」,第二個是否為「the」,第三個是否為「police」)。實際上,Siri考慮在每個位置中出現的所有單詞,而不僅僅是第一個單詞是否為「call」等,但演算法是一樣的。也許Siri認為,在聲音的基礎上,第一個單詞不是「call」就是「tell」,第二個不是「the」就是「her」,第三個不是「police」就是「please」。個別地,也許最有可能的單詞是「call」、「the」和「please」。但那樣會變成一句沒有意義的話「Call the please」,所以要考慮其他單詞,Siri得出結論,認為句子就是「Call the police」。
然而,最受人青睞的選擇就是借酒澆愁,喝得酩酊大醉,然後整夜都在跌跌撞撞。該選擇的技術術語為「馬爾可夫鏈蒙特卡洛理論」(Markov chain Monte Carlo,MCMC):有「蒙特卡洛」這個部分,是因為這個方法涉及機遇,比如到同名的賭場去,有「馬爾可夫鏈」部分,是因為它涉及採取一系列措施,每個措施只能依賴於前一個措施。MCMC中的思想就是隨便走走,就像眾所周知的醉漢那樣,以這樣的方式從網路的這個狀態跳到另一個狀態。這樣長期下來,每個狀態受訪的次數就與它的概率成正比。人們在談論MCMC時,往往把它當作一種模擬,但它其實不是:馬爾可夫鏈不會模仿任何真實的程序,我們將其創造出來,目的是為了從貝葉斯網路中有效生成樣本,因為貝葉斯網路本身就不是序變模式。
對於貝葉斯學派來說,知識越過模型的結構和參數,進入先驗分布中。原則上,之前的參數可以是任意我們喜歡的值,但諷刺的是,貝葉斯學派趨向於選擇信息量不足的先驗假設(比如將相同概率分配給所有假設),因為這樣更易於計算。在任何情況下,人類都不是很擅長估算概率。對於結構這方面,貝葉斯網路提供直觀的方法來整合知識:如果你認為A直接引起B,那麼應把箭頭從A指向B。
在生物信息中,貝葉斯學習能對單個數據表起作用,表中的每列表示一個變數(例如,一個基因的表達水平),而每行表示一個實例(例如,一個微陣列實驗,包含每個基因被觀察到的水平)。
『拾』 世界各地最大的搜索引擎
1. Yahoo!(http://www.yahoo.com)
Yahoo!是目前最常用的引擎之一,是Internet引擎的"元老"。
Yahoo!的使用很簡單,可以直接輸入查找關鍵字,也可以先選分類主題進行分類查詢
,它將返回三種信息:
1. 滿足查詢條件的Yahoo目錄(用戶可以利用它們進行交叉引用);
2. 滿足條件的實際站點;
3. 更廣泛的含有頁面索引的Yahoo!目錄,是一種更 廣泛的交叉引用。
Yahoo!也提供了一些簡單的高級查詢,其配置選項有:
S搜索的范圍:Yahoo(預設)、Usenet或E-mail Address;
S搜索詞之間的關系:OR或AND(預設);
S可以進行子串搜索,將其設置Substrings或Complete words兩種,其中Substrings將
我們輸入的詞作為一個子串,Complete words表示進行完整的單詞搜索,預設是子串搜索
·控制每頁顯示的結果數目:10、25(預設)、50或100。
Yahoo!在高級查詢上並不是很完善,但是Yahoo!在其主頁的末尾提供了其他引擎如A
ltaVista的超連接,如果用戶在Yahoo!查不到所需資料,Yahoo!可以到這些地方去搜索。
從而彌補了Yahoo!的一些缺陷。
2. InfoSeek(http://guide.infoseek.com)
InfoSeek是一個高效的搜索引擎,它的特點是:搜索精度高,查到的節點一般都與用
戶的要求相符。其搜索結果按照相關程度依次顯示。每一個結果顯示該HTML文件的標題
、摘要、大小。
InfoSeek引擎擁有最好的搜索參數的集成,它允許用戶在填寫查尋要求時可以隨心所
欲地不厭其詳,而它在後台則施以適當的邏輯組合。這就意味著,用戶可以忽略如何使用
搜索引擎,只要集中精力把自己想提的問題寫好就行了。
InfoSeek資料庫中每一網頁的所有文本都被檢索,它的搜索具有"事件敏感性"(case
sensitive),即對某些名字進行搜索時,搜索的效率會明顯提高。用戶輸入一個短語後,I
nfoseek會使用與短語最接近的排位方法,提高搜索結果的相關性。
InfoSeek可以提供以下的搜索范圍:
SWeb:在整個WWW信息系統內查找;
SNews:在實時新聞中查找;
SCompany:在公司名目中搜索;
SNewsgroups:在新聞組中搜索。
Infoseek的搜索方法包括:
1. 片語(短語)搜索 這時需對片語加上雙引號,以示與單個詞的區別;
2. 查找同時出現的詞 對所要搜索的關鍵詞加上[ ],表示括弧內的詞在文本中出現
時,其間隔不超過100個詞。
3. AltaVista(altavista.digital.com)
AltaVista自1996年12月開始服務以來,引起了世界各地網民的廣泛注意,每天都要
接受200萬次以上的訪問。AltaVista自詡擁有2100多萬全文索引的網頁,可以稱得上是最
大的網路搜索資料庫。
相對其他搜索引擎而言,AltaVista的搜索結果總是比其他任何站點的搜索結果內容
更豐富,AltaVista的搜索范圍大得驚人,有人說能對網路的天涯海角進行徹底搜索的僅此
一家,就連一些鮮為人知的偏僻站點也能找到。所以,使用AltaVista時,要花更多的時間
在搜索結果里尋找自己想要的信息。不過,如果你的目的就是想找到關於某個主題的站點
,多多益善,那麼AltaVista是最好的選擇。
根據檢索的對象,AltaVista搜索引擎提供三大類信息檢索:Web檢索和新聞組檢索、
商業檢索以及人物檢索。除公共檢索服務外,AltaVista還提供免費E-mail、頁面翻譯等
相關服務。它的搜索方法分為簡單和高級兩種。
1. 簡單搜索
AltaVista搜索引擎推薦使用的檢索方法, 是直接使用自然語言輸入檢索提問。檢索
提問可以是自然語言的單詞、片語或短語以及完整的問題。對使用AltaVista的最有用的
建議是, 由於它的索引是基於整個單詞的正文的,在描述查找的單詞時越精確越好,還要
去掉那些不感興趣的單詞。
2. 高級搜索
高級搜索包含了簡單搜索的所有特性,還可以有布爾和接近操作符、括起來的邏輯組
合等。AltaVista支持二元操作符AND、OR、NEAR和一元操作符NOT。
AltaVista的接近操作符(NEAR)很有特色。可以使用NEAR/n,n是兩個被搜索詞之間的
單詞的數目,如:Microsoft NEAR/5 Internet表示在"Microsoft"和"Internet"這兩個關
鍵字之間的單詞數目不得超過5個。如果不輸入n,表示兩個詞挨在一起。為了控制挨在一
起的兩個詞之間的順序,可以使用 ADJ 操作符,如:Microsoft ADJ Internet,表示Micro
soft 必須在Internet之前。
4. Lycos ( http://www.lycos.com)
Lycos是最老資格的搜索引擎之一,只要能給出准確的搜索結果,Lycos通常能給出最
全面的結果(基本上與AltaVista相同)。 Lycos的搜索范圍分的較細,這樣可以減少命中
的數量,可選擇的項目有:
The Web、Web Site Reviews、Personal Home- pages、Message Boards、Reuters
News、Weather (city)、Cities、Dictionary、Stock (symbol)、Music (artist)、B
ooks、Pictures、Sounds、Downloads、Recipes等。
Lycos不是周期性地更新資料庫,而是採用累積的形式構築資料庫。在對新的和原來
存在的資料庫進行信息升級時,Lycos軟體通過觀察其他站點通向某一站點的鏈接數而評
價這個站點的知名度。然後引擎在每次搜索時都使用這一知名度索引,所以每次搜索結果
的相關性在一定的程度上取決於站點的相對知名度。
Lycos搜索結果的容量非常之大,你如果試圖在網上迅速找到某個內容,Lycos不是最
好的選擇,如果你需要對網上的內容廣進博收,多多益善,Lycos可能會為你找到一些其他
站點找不到的內容。
Lycos在支持邏輯搜索和高級搜索功能方面較弱。
Lycos不提供要求/排除單詞的功能, 但可以在一個單詞前加一個"-"號,表示在給結
果定等級時,不考慮這個單詞。
Lycos的通配符是$符號。如gen$ 表示 genetic、 genesis、general等。它還提供
了英文句號(.)的使用,可以禁止擴展一個單詞。如gene.,只能得到gene,而得不到genet
ics和general。
5. Excite(http://www.excite.com)
Netscape在其Navigator瀏覽器的NetDirectory命令條中選中了Excite作為其中的一
個鏈接,這使Excite的知名度明顯提高。眾多的訪問大大提高了Excite站點的流通量。
Excite使用的是基於關鍵詞或基於概念的正文和主題搜索。概念搜索是指搜索引擎
不只簡單地查找含有要查找的單詞的文檔,同時還搜索與要查找的概念相關的文檔。預設
的查找是概念查找。Excite既提供網路搜索引擎,又提供以類目形式組織起來的網路目錄
(類似於Yahoo的目錄索引)。
Excite中要求的單詞和排除的單詞的使用方法同AltaVista一樣,使用+號和-號,Exc
ite支持二元操作符AND、OR 和一元操作符NOT,它也支持用括弧來構成邏輯組。
6. Webcrawler(http://www.webcrawler.com)
Webcrawler 是一個傑出的搜索引擎, 它的界面有些像 AltaVista。實際上,它在
高級搜索方面的功能要比AlataVista強。它提供事先分好類的19個主題,實現了基於主題
的搜索。
Webcrawler號稱支持"自然語言搜索",所以可以輸入像"highest mountain in the
world(世界上最高的山)"這樣的查詢條件。它拋棄了無意義的詞,對其餘的詞做模糊的A
ND搜索,含有所有的詞的頁面等級最高, 但也能查到只含一個詞的頁面,這是那些最佳引
擎的通用策略。
Webcrawler的片語、邏輯和接近操作符的使用類似於AltaVista。Webcrawler不支
持要求/排除的單詞的查找,也不支持通配符。
WebCrawler的主要缺點是,它對搜索到的每個條目都不顯示文本內容摘要。用戶只能
看到網頁題目和顯示WebCrawler相關性排名的數字。所以,除非網頁題目直接描述網頁內
容,否則用戶只能到這個站點訪問,才能得知其網頁內容。
在互聯網上,中文內容只佔約4%,絕大多數是英文內容,所以只有掌握英文搜索才能真正的深入互聯網。但是,英文搜索引擎很多,變化也很快,應該用哪個搜索,和怎麼搜索呢?今天,我就來介紹幾個最有代表性的英文搜索引擎。
Ask (www.ask.com,又名askjeeves)
Ask是一個支持自然提問的搜索引擎,它的資料庫里儲存了超過1000萬個問題的答案,只要你用英文直接輸入一個問題,它就會給出問題答案,如果你的問題答案不在它的資料庫中,那麼它會列出一串跟你的問題類似的問題和含有答案的鏈接,供你選擇。
根據網友們的使用經驗,當你遇到一些屬於事實型、原理型的問題時,使用Ask是最方便的。例如:「美國歷任總統中就任時年紀最輕的是誰?」、「阿富汗的首都叫什麼?」、「飛機是哪一年發明的?」、「雪為什麼是白的?」、「為什麼吃豆子的人愛放屁?」、「恐龍為什麼滅絕?」、「後街男孩的網站在哪裡?」。你還可以問它各種奇怪的問題,例如:「現在幾點了?」、「羅馬帝國為什麼崩潰?」、「聖誕老人住在哪兒?」,它都會給你答案的。
dmoz(www.dmoz.org,又名ODP)
有的網友不喜歡自己輸入英文單詞搜索,而是喜歡用滑鼠點擊分類目錄隨意瀏覽,那麼我向你推薦dmoz。
dmoz是互聯網合作共享精神的結晶,它的4萬多名志願編輯都是各行各業的專業人員,大家走到一起免費製作dmoz,提供給任何個人和組織免費使用。dmoz已經收錄了40多萬子目錄和近300萬個網站,是世界上最大的、也是最好的網站分類目錄,已經被世界各國400多個網站選做默認搜索引擎。dmoz使用起來非常方便,它提供相關目錄使你不容易漏掉其它目錄里的的相關內容,它還用一顆小星星推薦各個目錄下最好的網站,使初學者不會被太多的網站弄迷途。
另外,任何人都可以申請成為dmoz的搜索引擎編輯,你也可以去申請,嘗試一下親自做搜索引擎編輯的感覺,不過,要被批准可得有點實力才行哦。
Google(www.google.com)
Google是在國外很受歡迎的搜索引擎,界面簡潔,以搜索結果的准確性著稱,它的網頁快照和圖片搜索也很有特色。
網頁快照就是網頁的備份,你在Google搜索的時候,如果發現某條搜索結果點不進去,是死鏈接,那麼只要點擊搜索結果旁邊的網頁快照(Cached),就能看到Google保存的備份網頁。
Google還有世界上最大的圖片搜索引擎(images.google.com),收集了互聯網上3.3億張圖片,如果你想找哪個偶像的照片、想找某個名勝的風景照、想找軍事兵器圖片、、、只要輸入合適的英文單詞,很容易找到滿意的圖片。
search(www.search.com)
search屬於元搜索引擎,它收集了800多種專業搜索引擎和資料庫,分為商業金融、娛樂、健康醫葯、新聞媒體、評論、計算機、游戲、國際、尋人、購物、下載、政府、音樂、參考資料、旅行共15個大主題,每個大主題又分許多小主題。
當你進入任何一個主題搜索的時候,它都可以同時搜索這個主題下的多個專業搜索引擎和資料庫,然後在一個頁面上顯示來自不同搜索引擎的搜索結果。
比如進入大主題「新聞媒體」搜索,它把搜索結果分為頭條新聞、商業新聞、體育新聞、娛樂新聞、科技新聞、雜志、報紙,如果再進入小主題「科技新聞」搜索,那麼它可以同時搜索CNET、PC World、ZDNet、IDG.net、TechWeb這5個著名的科技新聞網站,足夠保證你得到最全最新的科技新聞。
好了,每個搜索引擎都有獨特的優缺點,不同的需要就應該使用不同的搜索引擎。
如果你搜索英文內容,那麼我給你推薦的使用習慣是:上網隨便逛逛就用dmoz,平時搜索就用google,有問題就問ask,要做特定的主題搜索就用search.com。
參考資料:http://..com/question/19723305.html?si=7