海量圖片資料庫
A. 識圖搜索的網站有哪幾個
Tineye:典型的以圖搜圖搜索引擎。
拓展內容
Tineye
TinEye是Idée公司於2008年5月6日上線的一個利用已有圖片搜索與此類似圖片的反向圖片搜索引擎搜索圖片的技術,同時提供其它特色搜索服務。
開始時Tineye是邀請注冊,後來是開放注冊,不過都需要注冊才能使用,現在終於完全放開,無需再注冊或登錄即可使用該搜索引擎。Tineye雖然是來自國外的搜索引擎,但它不僅可查找來自國外網站的圖片,對於國內圖片鏈接也支持,甚至可以搜索到國內各大論壇上的圖片。
參考資料網路——Tineye
B. 移動雲圖資料庫有哪些功能
移動雲圖資料庫主要有四大功能,分別是演算法分析功能、數據可視化功能、備份恢復功能和實例監控功能,能夠幫助企業打通數據孤島,構築全局視角。
C. 百度識圖的核心技術是什麼
網路識圖的核心技術原理:
對於這種網路,谷歌的圖像搜索一般由演算法實現,一般是三個步驟:
1. 將目標圖片進行特徵提取,描述圖像的演算法很多,用的比較多的是:SIFT描述子,指紋演算法函數,bundling features演算法,hash function(散列函數)等。也可以根據不同的圖像,設計不同的演算法,比如圖像局部N階矩的方法提取圖像特徵。
2. 將圖像特徵信息進行編碼,並將海量圖像編碼做查找表。對於目標圖像,可以對解析度較大的圖像進行降采樣,減少運算量後在進行圖像特徵提取和編碼處理。
3. 相似度匹配運算:利用目標圖像的編碼值,在圖像搜索引擎中的圖像資料庫進行全局或是局部的相似度計算;根據所需要的魯棒性,設定閾值,然後將相似度高的圖片預保留下來;最後應該還有一步篩選最佳匹配圖片,這個應該還是用到特徵檢測演算法。
其中每個步驟都有很多演算法研究,圍繞數學,統計學,圖像編碼,信號處理等理論進行研究。
D. 圖資料庫的應用場景
圖資料庫技術的應用場景比較多,包括但不限於以下幾種場景:
1. 欺詐檢測
無論面對詐騙集團、勾結團伙還是高知罪犯,圖資料庫技術可以實時揭露各種重要詐騙模式。所以越來越多的公司使用圖數據技術來解決各種關聯數據問題,包括欺詐檢測。
2. 實時推薦引擎
圖技術能夠根據用戶購買、交互和評論有效跟蹤這些關系,以提供對客戶需求和產品趨勢最有意義的深刻見解。Ebay等購物網站就在使用圖技術給用戶推薦產品。
3.知識圖譜
將圖技術用於知識圖譜能夠精確搜索查詢,消除搜索查詢的歧義,並且能夠適應不斷增長的數據資產規模。
E. 百度圖片搜索引擎原理是如何實現的
圖片搜索的原理有三個步驟
1. 將目標圖片進行特徵提取,描述圖像的演算法很多,用的比較多的是:SIFT描述子,指紋演算法函數,bundling features演算法,hash function(散列函數)等。也可以根據不同的圖像,設計不同的演算法,比如圖像局部N階矩的方法提取圖像特徵。
2. 將圖像特徵信息進行編碼,並將海量圖像編碼做查找表。對於目標圖像,可以對解析度較大的圖像進行降采樣,減少運算量後在進行圖像特徵提取和編碼處理。
3. 相似度匹配運算:利用目標圖像的編碼值,在圖像搜索引擎中的圖像資料庫進行全局或是局部的相似度計算;根據所需要的魯棒性,設定閾值,然後將相似度高的圖片預保留下來;最後應該還有一步篩選最佳匹配圖片,這個應該還是用到特徵檢測演算法。
其中每個步驟都有很多演算法研究,圍繞數學,統計學,圖像編碼,信號處理等理論進行研究。
根據Neal Krawetz博士的解釋,原理非常簡單易懂。我們可以用一個快速演算法,就達到基本的效果。
這里的關鍵技術叫做"感知哈希演算法"(Perceptual hash algorithm),它的作用是對每張圖片生成一個"指紋"(fingerprint)字元串,然後比較不同圖片的指紋。結果越接近,就說明圖片越相似。下面是一個最簡單的實現:
第一步,縮小尺寸。
將圖片縮小到8x8的尺寸,總共64個像素。這一步的作用是去除圖片的細節,只保留結構、明暗等基本信息,摒棄不同尺寸、比例帶來的圖片差異。
第二步,簡化色彩。
將縮小後的圖片,轉為64級灰度。也就是說,所有像素點總共只有64種顏色。
第三步,計算平均值。
計算所有64個像素的灰度平均值。
第四步,比較像素的灰度。
將每個像素的灰度,與平均值進行比較。大於或等於平均值,記為1;小於平均值,記為0。
第五步,計算哈希值。
將上一步的比較結果,組合在一起,就構成了一個64位的整數,這就是這張圖片的指紋。組合的次序並不重要,只要保證所有圖片都採用同樣次序就行了。
得到指紋以後,就可以對比不同的圖片,看看64位中有多少位是不一樣的。在理論上,這等同於計算"漢明距離"(Hammingdistance)。如果不相同的數據位不超過5,就說明兩張圖片很相似;如果大於10,就說明這是兩張不同的圖片。
具體的代碼實現,可以參見Wote用python語言寫的imgHash.py。代碼很短,只有53行。使用的時候,第一個參數是基準圖片,第二個參數是用來比較的其他圖片所在的目錄,返回結果是兩張圖片之間不相同的數據位數量(漢明距離)。
這種演算法的優點是簡單快速,不受圖片大小縮放的影響,缺點是圖片的內容不能變更。如果在圖片上加幾個文字,它就認不出來了。所以,它的最佳用途是根據縮略圖,找出原圖。
實際應用中,往往採用更強大的pHash演算法和SIFT演算法,它們能夠識別圖片的變形。只要變形程度不超過25%,它們就能匹配原圖。這些演算法雖然更復雜,但是原理與上面的簡便演算法是一樣的,就是先將圖片轉化成Hash字元串,然後再進行比較。
F. 存儲海量圖片數據用mongoDB還是Hbase呢
我所知道的FackBook、Instagram、Twitter 都是用的Redis,國內的新浪微博、騰訊微博、搜狐等也是用的它
G. 用c#將海量圖片導入sql server2008
看你是想把文件路徑存到資料庫還是把圖片轉成二進制後存到資料庫,方法都差不多
1把圖片放到一個文件夾裡面,然後枚舉路徑
2將圖片轉成二進制文件流 如果只存圖片路徑可跳過這一步
3存到資料庫
H. 計算機視覺應用之圖像檢索任務簡單介紹
圖像檢索演算法因何而起?
網路時代,隨著各種社交網路的興起,網路中圖片,視頻數據每天都以驚人的速度增長,逐漸形成強大的圖像檢索資料庫。針對這些具有豐富信息的海量圖片,如何有效地從巨大的圖像資料庫中檢索出用戶需要的圖片,成為信息檢索領域研究者感興趣的一個研究方向。
圖像檢索,簡單的說,便是從圖片檢索資料庫中檢索出滿足條件的圖片,圖像檢索技術的研究根據描述圖像內容方式的不同可以分為兩類:
一類是基於文本的圖像檢索技術,簡稱TBIR,
一類為基於內容的圖像檢索技術,簡稱CBIR。
隨著圖像檢索技術的發展和逐漸成熟,已經形成了多個基於圖像檢索的研究方向和應用場景,並且投入實用,在遙感影像、安防監控、檢索引擎、電子商務、醫學等方方面面起著十分重要的作用。
基於文本的圖像檢索(TBIR)技術,其主要原理為利用文本描述,如文本描述圖片的內容、作者等等的方式來檢索圖片;
基於圖像的內容語義的圖像檢索技術(CBIR),利用圖片的顏色、紋理及圖片包含的物體、類別等信息檢索圖片,如給定檢索目標圖片,在圖像檢索資料庫中檢索出與它相似的圖片。
基於圖像的內容語義的圖像檢索包括相同物體圖像檢索和相同類別圖像檢索,檢索任務分別為檢索同一個物體地不同圖片和檢索同一個類別地圖片。例如,行人檢索中檢索的是同一個人即同一個身份在不同場景不同攝像頭下拍得的圖片屬於相同物體的圖像檢索,而在3D形狀檢索中則是檢索屬於同一類的物品,如飛機等。
圖像檢索技術主要包含幾個步驟,分別為:輸入圖片、特徵提取、度量學習、重排序。
特徵提取:即將圖片數據進行降維,提取數據的判別性信息,一般將一張圖片降維為一個向量;
度量學習:一般利用度量函數,計算圖片特徵之間的距離,作為loss,訓練特徵提取網路,使得相似圖片提取的特徵相似,不同類的圖片提取的特徵差異性較大。
重排序:利用數據間的流形關系,對度量結果進行重新排序,從而得到更好的檢索結果。
隨著深度學習的引入,基於深度學習的圖像檢索技術,主要是將深度學習方法應用在圖像檢索中的特徵提取模塊,利用卷積神經網路提取圖片特徵。主要步驟即給定一張圖片,通過卷積神經網路對圖片進行特徵提取得到表徵圖片的特徵,利用度量學習方法如歐式距離對圖片特徵進行計算距離,對圖片距離進行排序,得到初級檢索結果,再根據圖片數據的上下文信息和流形結構對圖像檢索結果進行重排序,從而提高圖像檢索准確率,得到最終的檢索結果。
I. 圖計算代表廠商有哪些
近日,信通院發布了2022大數據十大關鍵詞,星環科技入選「圖計算平台」代表廠商。
在圖計算領域߅星環科技自主研發了分布式圖資料庫StellarDB,兼容openCypher查詢語言,提供海量圖數據的存儲和分析能力,支持原生圖存儲結構,支持萬億邊PB級數據存儲。同時,StellarDB具備毫秒級點邊查詢能力,10+層的深度鏈路分析能力,提供近40種的圖分析演算法,具備數據2D和3D展示能力。
StellarDB4.0版本更是在數據導入、多跳查詢和圖演算法性能方面實現了數倍升級,同時在易用性、安全性、運維管理、和開放性等方面全面升級,幫助企業用戶更快、更高效地挖掘海量數據互聯價值。
此外,星環科技StellarDB還獲得了多項行業權威認可:通過了中國信通院圖資料庫和圖計算平台基礎能力兩項專項測評;入選著名咨詢機構Gartner《中國資料庫市場指南》、《工具:中國資料庫管理系統供應商甄選》報告等,彰顯了其產品技術領先性。在國產化適配方面,可兼容銀河麒麟、中標麒麟等國產操作系統。
StellarDB克服了海量關聯圖數據存儲的難題,通過集群化存儲和豐富演算法,實現了傳統資料庫無法提供的低延時多層關系查詢,目前已經用於金融、政府、交通等眾多行業,用於反洗錢、風險控制、營銷等多種場景。