当前位置:首页 » 操作系统 » 知识图谱算法

知识图谱算法

发布时间: 2024-05-08 20:33:19

‘壹’ 鐭ヨ瘑锲捐氨钬滀笘鐣屾澂钬濇滃崟鎻鏅掳纴搴﹀皬婊TranS绠楁硶鍒锋柊涓栫晫绾褰

https://ogb.stanford.e/docs/leader_linkprop/#ogbl-wikikg2

OGB鏄鏂鍧︾忓ぇ瀛﹀彂甯幂殑锲介檯鐭ヨ瘑锲捐氨锘哄嗳鏁版嵁闆嗭纴涔熸槸锲剧炵粡缃戠粶棰嗗烟链𨱒冨▉銆佹渶鍏锋写鎴樻х殑钬灭珵鎶鍦衡濓纴姣忓勾Meta锛埚师Facebook锛夈佽挋鐗瑰埄灏斿ぇ瀛︺佽殏铓侀噾链嶃佺戝ぇ璁椋炵瓑浼楀氶《绾х爷绌舵満鏋勫拰浼佷笟閮戒细鍓嶆潵鍙傝禌銆

鍦ㄨ繖鍦衡滈珮镓嬩簯闆嗏濈殑锲介檯绔炶禌涓锛屽害灏忔弧鏁版嵁鏅鸿兘閮ˋI-Lab锲㈤槦鎻愬嚭鍒涙柊镐х煡璇嗗浘宓屽叆(KGE)妯″瀷TranS锛屽埛鏂颁简OGBL-Wikikg2锘哄嗳鏁版嵁闆嗘渶楂樿板綍銆傝ュ洟阒熻〃绀簑ikikg2锲炬暟鎹瑙勬ā宸ㄥぇ锛岃缁冭凯浠f椂闂撮暱锛屽湪鍒嗘暟浼桦寲绌洪棿宸叉帴杩戞瀬闄愮殑𨱍呭喌涓嬶纴浠栦滑浠呬娇鐢╒100-16G鏄惧瓨镄凣PU灏辨墦璐ヤ简鍏朵粬浣跨敤A100-40G镄勫洟阒熴

搴﹀皬婊$殑AI鍐呭姛

锲剧炵粡缃戠粶灏辨槸锲炬暟鎹涓庣炵粡缃戠粶镄勭粨钖堛傚叾涓锛屽浘鏁版嵁鍙浠ョ亩鍗旷悊瑙d负涓绉岖嫭鐗逛俊鎭琛ㄧ幇褰㈠纺钬斺斿浘镄勬疮涓鑺傜偣鐪嫔仛鏄涓绉嶅疄浣掳纴姣斿备竴涓鐢ㄦ埛銆佷竴涓鍟嗗搧锛屾垨钥呬竴涓浜嬩欢锛屽浘镄勮竟鍒栾〃绀轰笉钖屽疄浣揿拰浜嬩欢涔嬮棿镄勫叧绯汇

锲炬暟鎹鍦ㄧ幇瀹炰笘鐣屾棤澶勪笉鍦锛岄珮搴︾粨鏋勫寲镄勫浘鏁版嵁褰㈡垚浜嗗签澶х殑鐭ヨ瘑锲捐氨锛岃繖绉岖煡璇呜〃绀哄舰寮忥纴涓篈I绯荤粺鎻愪緵浜嗗彲瀛︿範镄勫厛楠岀煡璇嗭纴鑳藉熻幏寰楀勭悊澶嶆潅浠诲姟镄勮兘锷涖傚洜姝わ纴锲剧炵粡缃戠粶绠楁硶鍦ㄩ噾铻嶉庢带棰嗗烟链夌潃骞挎硾镄勫簲鐢ㄥ墠鏅銆


姣斿傞噾铻嶉庢带棰嗗烟寰寰渚濊禆浜庡ぇ閲忕殑鏂囨湰淇℃伅锛岃屽疄闄呬笂杩桦瓨鍦ㄧ潃澶ч噺镄勭粨鏋勫寲镄勭煡璇嗗浘璋变俊鎭寰呴庢带妯″瀷浣跨敤銆傚逛簬锘轰簬绁炵粡缃戠粶镄勯庢带妯″瀷𨱒ヨ达纴濡备綍灏嗙绘暎镄勫浘淇℃伅杞鎹㈡垚杩炵画镄勫悜閲忚〃绀哄崄鍒嗛吨瑕併傝岄氲繃TranS妯″瀷鍙浠ユ湁鏁堟彁鍗囧浘缁撴瀯涓瀹炰綋鍜屽叧绯荤殑琛ㄧず鏁堟灉锛岃繘钥屾寲鎺樻綔钘忕殑澶嶆潅鍏崇郴锛屾彁鍗囬庢带妯″瀷镄勫嗳纭搴︿笌鍖哄垎搴︺


搴炲ぇ鏁版嵁閲忥纴鏄閲戣瀺琛屼笟AI鍖栫殑澶╃劧浼桦娍锛屼絾鏁版嵁镄勫嶆潅镐э纴澶氱淮镐э纴浠ュ强闅愮佺瓑闂棰树篃涓洪噾铻崭紒涓氩甫𨱒ヤ简涓嶅皬镄勬写鎴樸傚害灏忔弧AI-Lab锲㈤槦钖屽﹁〃绀猴纴锲剧炵粡缃戠粶鎶链锛岃兘澶熷府锷╄屼笟闄嶆湰澧炴晥銆佽В鍐虫暟鎹瀛ゅ矝鍜屽畨鍏ㄩ梾棰桡纴鍦ㄦ櫤鑳借幏瀹銆佹櫤鑳介庢带銆佹櫤鑳界粡钀ャ佹櫤鑳芥満鍣ㄤ汉绛夊簲鐢ㄦ柟闱㈠彂鎸ョ潃閲嶈佷綔鐢ㄣ

鍦ㄥ浘绁炵粡缃戠粶涔嫔栵纴搴﹀皬婊AI-Lab鍦ㄦ繁搴﹀︿範銆佽$畻链鸿呜夈佽嚜铹惰瑷澶勭悊锛屽寘𨰾鏂囨湰钖戦噺鍖栥佹枃链鍒嗙被銆佷俊鎭鎶藉彇绛夋柟钖戜笂涔熸棭链夊竷灞銆傚幓骞3链堬纴璇ュ洟阒熷嚟鍊烡ML绠楁硶銮峰缑MSMARCO锲介檯姣旇禌涓鏂囨。鎺掑簭浠诲姟镄勫啝鍐涖傚幓骞12链堬纴璇ュ洟阒熷张镰斿彂浜呜僵杈(XuanYuan)棰勮缁冩ā鍨嬶纴鍦ㄥ浗闄呮潈濞佹祴璇勫熀鍑咰LUE1.1姒滃崟涓銆屽姏铡嬬兢闆勚嶆柀銮风涓锛岃窛绂讳汉绫昏〃鐜颁粎宸3.38鍒嗐

钬沧湭𨱒ュ害灏忔弧AI-Lab锲㈤槦灏嗙户缁锲寸粫鐭ヨ瘑锲捐氨琛ュ叏銆佸疄浣揿归绨绛夊叿浣挞梾棰桦𪾢寮娣卞叆镰旂┒锛屽悓镞跺吋椤炬洿骞夸箟镄勫浘缃戠粶鍦ㄩ噾铻嶉庢带鏂瑰悜镄勫簲鐢锛屽笇链涢氲繃璇稿傜ぞ浜ゅ叧绯汇佷氦鏄揿叧绯汇佸湴鐞嗗叧绯荤瓑淇℃伅鏋勫缓镄勫ぇ瑙勬ā锲剧绣缁滐纴杩愮敤锲剧炵粡缃戠粶绛夌畻娉曟彁鍗囨ā鍨嫔湪淇$敤椋庨橹璇勪及鍜屽弽娆鸿痪绛夋柟闱㈢殑浣跨敤鏁堟灉銆傗濆害灏忔弧鏁版嵁鏅鸿兘閮ㄨ礋璐d汉𨱒ㄩ潚璇淬

‘贰’ 鐭ヨ瘑锲捐氨

锲犱负宸ヤ綔涓鍙备笌浜嗕竴涓鏅鸿兘闂绛旂浉鍏崇殑椤圭洰锛屾墍浠ラ渶瑕佷简瑙b灭煡璇嗗浘璋扁濈殑鐩稿叧鐭ヨ瘑銆备綔涓轰竴涓闱炴妧链绫荤殑B绔浜у搧缁忕悊锛屽垰娑夎冻AI棰嗗烟锛屾湁浜涢檶鐢熷拰涓崭範𨱍銆

浜庢槸鎴戠湅浜嗗緢澶氭枃鐚鍜屾妧链绉戞櫘锛屼篃鍜ㄨ浜呜韩杈归兘鏄疉I镄勬妧链鐢燂纴浠庝腑澶ц嚧浜呜В浜嗏灭煡璇嗗浘璋扁濈殑涓浜涘师鐞嗭纴鏁寸悊浜嗕互涓嬫枃绔犮

甯屾湜鎴戠殑鏂囩珷鑳藉府锷╅潪鎶链浜у搧缁忕悊锛屾垨钥呭叾浠栧矖浣岖殑钖屽︼纴镟寸亩鍗曞揩鎹风殑鐞呜В浠涔堟槸钬灭煡璇嗗浘璋扁濄

鍦ㄤ粙缁岖煡璇嗗湴锲句箣鍓嶏纴鍏堣翠竴涓嬬煡璇嗗湴锲惧湪镞ュ父鐢熸椿涓镄勪娇鐢ㄣ

鍐嶆瘆濡傦纴鍦ㄧ嚎鍖荤枟琛屼笟锛屾偅钥呮兂鎸傚彿鍗翠笉鐭ラ亾鎸傚摢涓绉戝ょ殑镞跺欙纴鍙浠ラ氲繃棰勮瘖锷╂坠銮峰彇绉戝や俊鎭銆傞勮瘖锷╂坠锘轰簬涓扑笟鍖荤枟鐭ヨ瘑锲捐氨锛岄噰鐢ㄥ氱岖畻娉曟ā鍨嫔拰澶氲疆鏅鸿兘娌熼氢简瑙f偅钥呯梾𨱍咃纴镙规嵁鎭h呯梾𨱍呯簿鍑嗗尮閰嶅氨璇婄戝ゃ

浠ユ敮浠桦疂涓轰緥銆傚湪鏀浠桦満鏅涓嬶纴鍒╃敤鐭ヨ瘑锲捐氨灏嗙エ鎹璇堥獥銆佷俊鐢ㄥ崱濂楃幇绛夎屼负镓兼潃鍦ㄦ憞绡閲屻傞氲繃鐭ヨ瘑锲捐氨镄勫浘璋辨暟鎹搴掳纴阍埚逛笉钖岀殑涓浣揿拰缇や綋杩涜屽叧镵斿垎鏋愶纴浠庝汉鐗╁湪鎸囧畾镞堕棿鍐呯殑琛屼负𨱒ュ垽鏂鐢ㄦ埛锛屾瘆濡傚幓杩囩殑鍦版柟镄処P鍦板潃锛屼娇鐢ㄨ繃镄凪AC鍦板潃(鍖呮嫭镓嬫満銆丳C銆乄IFI绛夈)锛岀ぞ浜ょ绣缁灭殑鍏宠仈搴﹀垎鏋愶纴阈惰岃处鎴蜂箣闂存槸钖︽湁铡嗗彶浜ゆ槗淇℃伅銆

鍦ㄦ弿杩板畾涔変箣鍓嶏纴鎴戜滑鍏堟潵鐪嬬湅鐭ヨ瘑锲捐氨3354 [E-R锲纶镄勮〃鐜板舰寮忥细

浠庝笂锲惧彲浠ュ彂鐜帮纴镞犺篍-R锲惧彉鎹㈡垚浠涔埚舰鐘讹纴澶栬傚备綍涓嶅悓锛岄兘鏄鐢卞氢釜镣瑰拰绾胯繛鎺ヨ屾垚镄勫叧绯荤绣缁溿

鎴戜滑绉颁箣涓虹偣[瀹炰綋]鍜岀嚎[鍏崇郴]锛屾疮涓瀹炰綋鍙鑳戒笌涓涓鎴栧氢釜瀹炰綋链夊叧绯汇傚熀浜庢わ纴瑕佸舰鎴愭渶绠鍗旷殑鍏崇郴缃戠粶锛屽彧闇瑕佷笁涓瑕佺礌锛氢袱涓瀹炰綋鍜屼竴涓鍏崇郴銆傝繖绉岖粨鏋勶纴鎴戜滑绉颁箣涓衡滀笁鍏幂粍钬濓纴澶氢釜涓夊厓缁勫舰鎴愪竴涓鐭ヨ瘑锲捐氨銆

(涓夊)

姣斿傦细钬滃皬鏂瑰拰灏忔槑鏄钖屼簨锛屼袱浜洪兘鏄锲犱负宸ヤ綔闇瑕佷拱绗旇版湰銆傚皬鏄庤夊缑鐢ㄨ娴鏋灭玛璁版湰浼氭洿链夎存湇锷涳纴浜庢槸涓嬫坠浜嗭纴钥屽皬鏂硅夊缑镵旀兂绗旇版湰镟翠究瀹滐纴镓浠ラ夋嫨浜呜仈𨱍炽傚悗𨱒ュ皬鏂瑰彂鐜帮纴钖屼簨瀹夊埄杩囩殑杞浠秙ketch锛屽彧链夎娴鏋灭数鑴戞墠链夈傚畠姣擜xure镟存櫤鑳姐佹洿瀹规槗浣跨敤銆傗濅粠杩椤彞璇濅腑锛屾垜浠鍙浠ユ媶瑙e嚭澶氢釜涓夊厓缁勶细

鐭ヨ瘑鍦板浘涓夊厓缁勪笉浠呭彲浠ヨ〃杈惧疄浣挞棿镄勫叧绯讳互澶栵纴杩樿兘琛ㄧず瀹炰綋镄勬煇绉嶅睘镐с傛瘆濡傗滃皬鏄庘濇槸瀹炰綋锛屼粬镄勨沧у埆銆佸嚭鐢熸棩链熴佺睄璐钬濈瓑鍙鍒掍负灞炴с

浜嬬墿琚瀹氢箟涓哄疄浣撶殑钬滃睘镐р濓纴链変袱涓锘烘湰铡熷垯锛

钖屾椂鍊煎缑娉ㄦ剰镄勬槸锛屾牴鎹瀹为檯𨱍呭喌锛屽疄浣撴湁镞跺彲浠ユ槸灞炴э纴灞炴т篃鍙浠ユ槸瀹炰綋銆

涓嫔浘鏄涓涓渚嫔瓙锛气滃憳宸モ濇槸涓涓瀹炰綋锛屸滃憳宸ョ紪鍙枫佸揿悕銆佸勾榫勨濇槸锻桦伐镄勫睘镐с傚傛灉钬滆亴绉扳濇病链変笌钬滃伐璧勚佸矖浣嶆触璐淬佺忓埄钬濇寕阍╋纴鎹㈠彞璇濊达纴瀹冩病链夊彲浠ヨ繘涓姝ユ弿杩扮殑鐗瑰緛锛岄偅涔堟牴鎹鍑嗗垯1锛屽畠鍙浠ヤ綔涓哄憳宸ュ疄浣撶殑涓涓灞炴с

浣嗘槸锛屽傛灉涓嶅悓镄勮亴绉版湁涓嶅悓镄勫伐璧勚佸矖浣嶆触璐村拰涓嶅悓镄勯梼锷犵忓埄锛岄偅涔堟妸镵岀О浣滀负涓涓瀹炰綋𨱒ュ瑰緟灏辨洿钖堥备简銆

璇翠简杩欎箞澶氾纴浣犲簲璇ヨ兘镟村ソ镄勭悊瑙c愮煡璇嗗湴锲俱戠殑瀹氢箟浜嗭细鐭ヨ瘑鍦板浘鏄涓涓缁撴瀯鍖栫殑璇涔夌煡璇嗗簱锛岀敤𨱒ヤ互绗﹀彿镄勫舰寮忔弿杩扮墿鐞嗕笘鐣屼腑镄勬傚康鍙婂叾鍏崇郴銆傚畠镄勫熀链鏋勬垚鍗曚綅鏄钬滃疄浣-鍏崇郴-瀹炰綋钬濅笁鍏幂粍锛屼互鍙婂疄浣揿强鍏剁浉鍏崇殑灞炴-鍊煎广傚疄浣挞氲繃鍏崇郴鐩镐簰杩炴帴锛屽舰鎴愮绣缁灭煡璇嗙粨鏋勚

浜呜В鐭ヨ瘑鍦板浘镄勬瀯寤哄彲浠ュ府锷╂垜浠镟村ソ鍦扮悊瑙g煡璇嗗湴锲剧殑浣跨敤铡熺悊銆

鐭ヨ瘑鍦板浘镄勬瀯寤鸿繃绋嫔彲浠ユ傛嫭涓轰笁绉嶆柟寮忥细

涓轰简浠嬬粛姣忎竴姝ュ强鍏舵剰涔夛纴鎴戠紪鍒朵简涓嬭〃锛

闱炲晢涓氲浆杞借锋敞鏄庡嚭澶勚

涓嫔浘鏄鐭ヨ瘑鍦板浘镄勬妧链妗嗘灦锛屽彲浠ュ府锷╀綘镟村ソ镄勭悊瑙g煡璇嗗湴锲炬瀯寤虹殑杩囩▼銆傝櫄绾挎嗕腑镄勯儴鍒嗘槸鐭ヨ瘑鍦板浘鏋勫缓镄勮繃绋嬶纴涔熸槸鐭ヨ瘑鍦板浘镟存柊镄勮繃绋嬨

1锛夎佹瀯寤虹煡璇嗗浘璋憋纴闇瑕佹庢牱镄勬暟鎹锻锛

绛旀堟槸锛氱粨鏋勫寲鏁版嵁銆

涓鑸𨱒ヨ达纴鐭ヨ瘑鍦板浘镄勫师濮嬫暟鎹链変笁绉岖被鍨嬶细缁撴瀯鍖栨暟鎹銆侀潪缁撴瀯鍖栨暟鎹

镓璋撶粨鏋勫寲鏁版嵁锛屾槸鎸囬珮搴︾粍缁囧寲銆佹牸寮忔暣榻愮殑鏁版嵁锛屾槸涓绉嶅彲浠ユ斁鍏ョ数瀛愯〃镙肩殑鏁版嵁绫诲瀷銆傚吀鍨嬬殑缁撴瀯鍖栨暟鎹鍖呮嫭锛氢俊鐢ㄥ崱鍙枫佹棩链熴佽储锷¢噾棰濄佺数璇濆彿镰併佸湴鍧銆佷骇鍝佸悕绉扮瓑銆

鐩告瘆涔嬩笅锛岄潪缁撴瀯鍖栨暟鎹鏄鎸囦笉瀹规槗缁勭粐鎴栨牸寮忓寲镄勬暟鎹銆傚畠娌℃湁棰勫畾涔夌殑鏁版嵁妯″瀷锛屼笉鏂逛究浣跨敤鏁版嵁搴撶殑浜岀淮阃昏緫琛ㄦ潵琛ㄧず鏁版嵁銆傚畠鍙浠ユ槸鏂囨湰镄勬垨闱炴枃链镄勶纴浜哄伐镄勬垨链哄櫒鐢熸垚镄勚

绠鍗曟潵璇达纴闱炵粨鏋勫寲鏁版嵁灏辨槸鍏锋湁鍙鍙桦瓧娈电殑鏁版嵁锛屼富瑕佹槸涓浜涙枃妗c佹枃妗g瓑銆傛瘆濡备竴浜涘悎钖屾枃浠躲佹枃绔犮丳DF鏂囨。绛夈

钥屽崐缁撴瀯鍖栨暟鎹鏄闱炲叧绯诲瀷镄勶纴鍏锋湁锘烘湰镄勫浐瀹氱粨鏋勬ā寮忥纴濡傛棩蹇楁枃浠躲乆ML鏂囨。銆丣SON鏂囨。绛夈

瀵逛簬闱炵粨鏋勫寲鏁版嵁鍜屽崐缁撴瀯鍖栨暟鎹锛屾垜浠闇瑕佺‘璁ゅ彲浠ヤ粠涓鎻愬彇鍝浜涘彲鐢ㄤ俊鎭锛屽苟鍒跺畾淇℃伅褰曞叆瑙勫垯銆傚熷姪NLP绛夋妧链锛屽彲浠ュ皢链夋晥淇℃伅鐢熸垚缁撴瀯鍖栨暟鎹锛岃繘钥岀撼鍏ョ煡璇嗗湴锲俱

2锛夊浘鏁版嵁搴揿强鍏崇郴鍨嬫暟鎹搴撶殑宸鍒

鐭ヨ瘑鍦板浘鏄锘轰簬锲炬暟鎹搴揿瓨鍌ㄦ暟鎹镄勚傛墍璋揿浘鏁版嵁搴掳纴涓嶆槸鎸囧瓨鍌ㄥ浘鐗囥佸浘镀忕殑鏁版嵁搴掳纴钥屾槸鎸囧瓨鍌ㄥ浘杩欑嶆暟鎹缁撴瀯镄勬暟鎹搴撱备箣鍓嶆垜浠璇寸殑E-R锲撅纴灏辨槸锲炬暟鎹镄勫彲瑙嗗寲灞旷ず銆傜殑

涓庝紶缁熺殑鍏崇郴鏁版嵁搴扑娇鐢ㄤ簩缁磋〃瀛桦偍鏁版嵁涓嶅悓锛屽浘鏁版嵁搴扑紶缁熶笂琚褰掔被涓篘oSQ銆

L锛圢ot Only SQL锛夋暟鎹搴撶殑涓绉嶏纴涔熷氨鏄璇村浘鏁版嵁搴揿睘浜庨潪鍏崇郴鍨嬫暟鎹搴撱备负浜嗛伩鍏嶅唴瀹瑰お杩囨妧链镐э纴杩欓噷涓崭细瀵瑰浘鏁版嵁杩涜屾繁鍏ョ殑浠嬬粛锛屽彧绠鍗曡翠笅锲炬暟鎹搴揿强鍏崇郴鍨嬫暟鎹搴撶殑宸鍒銆

鍏崇郴鍨嬫暟鎹搴扑笉镎呴暱澶勭悊鏁版嵁涔嬮棿镄勫叧绯伙纴钥屽浘鏁版嵁搴揿湪澶勭悊鏁版嵁涔嬮棿鍏崇郴鏂归溃𨱔垫椿涓旈珮镐ц兘銆

浼犵粺镄勫叧绯诲瀷鏁版嵁搴揿湪澶勭悊澶嶆潅鍏崇郴镄勬暟鎹涓婅〃鐜板緢宸锛岃繖鏄锲犱负鍏崇郴鍨嬫暟鎹搴撴槸阃氲繃澶栭敭镄勭害𨱒熸潵瀹炵幇澶氲〃涔嬮棿镄勫叧绯诲紩鐢ㄧ殑銆傛煡璇㈠疄浣扑箣闂寸殑鍏崇郴闇瑕丣OIN镎崭綔锛岃孞OIN镎崭綔阃氩父闱炲父钥楁椂銆

钥屽浘鏁版嵁搴撶殑铡熷嬭捐″姩链猴纴灏辨槸镟村ソ鍦版弿杩板疄浣扑箣闂寸殑鍏崇郴銆傚浘鏁版嵁搴扑笌鍏崇郴鍨嬫暟鎹搴撴渶澶х殑涓嶅悓灏辨槸鍏岖储寮曢偦鎺ワ纴锲炬暟鎹妯″瀷涓镄勬疮涓鑺傜偣閮戒细缁存姢涓庡畠鐩搁偦镄勮妭镣瑰叧绯伙纴杩椤氨镒忓懗镌镆ヨ㈡椂闂翠笌锲剧殑鏁翠綋瑙勬ā镞犲叧锛屽彧涓庢疮涓鑺傜偣镄勯偦镣规暟閲忔湁鍏筹纴杩欎娇寰楀浘鏁版嵁搴揿湪澶勭悊澶ч噺澶嶆潅鍏崇郴镞朵篃鑳戒缭鎸佽坛濂界殑镐ц兘銆

鍙﹀栵纴锲剧殑缁撴瀯鍐冲畾浜嗗叾鏄扑簬镓╁𪾢镄勭壒镐с傛垜浠涓嶅繀鍦ㄦā鍨嬭捐′箣鍒濆氨鎶婃墍链夌殑缁呜妭閮借冭槛鍒帮纴锲犱负鍦ㄥ悗缁澧炲姞鏂扮殑鑺傜偣銆佹柊镄勫叧绯汇佹柊镄勫睘镐х敋镊虫柊镄勬爣绛鹃兘寰埚规槗锛屼篃涓崭细镰村潖宸叉湁镄勬煡璇㈠拰浣跨敤锷熻兘銆

钥屽叧绯诲瀷鏁版嵁搴掳纴濡傛灉涓寮濮嫔氨璁捐″ソ鏁版嵁瀛楁靛苟璺戜简涓娈垫椂闂存暟鎹锛屾兂鍐嶅炲姞瀛楁靛氨浼氶潪甯搁夯鐑︼纴闇瑕佸紑鍙戜汉锻樻垨浜у搧缁忕悊鍦ㄥ紑鍙戝埯链熷氨璁炬兂濂芥湭𨱒ュ彲鑳戒细鏂板炵殑瀛楁碉纴骞舵彁鍓嶅姞鍏ュ埌鏁版嵁琛ㄤ腑銆

neo4j-锲炬暟鎹搴

阃氢织鏄撴哕瑙i喷鐭ヨ瘑锲捐氨锛𪢮nowledge Graph锛

锲炬暟鎹搴撴槸浠涔堬纻

棰桦浘𨱒ヨ嚜 Unsplash锛屽熀浜嶤C0鍗忚銆

鐩稿叧闂绛旓细PC绔锛屾槸浠涔堟剰镐濓纻

PC绔鏄鍜岀Щ锷ㄧ粓绔鐩稿瑰簲镄勫悕璇嶏纴灏辨槸鎸囩绣缁滀笘鐣岄噷鍙浠ヨ繛鎺ュ埌鐢佃剳涓绘満镄勯偅涓绔鍙o纴鏄锘轰簬鐢佃剳镄勭晫闱浣撶郴锛屽畠链夊埆浜庣Щ锷ㄧ镄勬坠链虹晫闱浣撶郴銆 鍏跺疄PC镄勮嫳鏂囧叏绉版槸锛歅ersonal Computer 缈昏疟鎴愪腑鏂囩殑镒忔濇槸锛氢釜浜鸿$畻链烘垨钥呬釜浜虹数鑴戙侾C鏄涓涓鍏锋湁骞挎硾钖涔夌殑璇嶈锛屼篃鏄鐢佃剳镄勭粺绉般傚氨鐩鍓嶈岃█涓浜虹数鑴戠岖被链夊緢澶氾纴姣斿备紶缁熺殑鍙板纺鐢佃剳銆丏IY鐢佃剳銆佺玛璁版湰鐢佃剳銆佷互鍙婅繎骞存潵寮濮嬫祦琛岀殑骞虫澘鐢佃剳銆佷竴浣撴満鐢佃剳銆佽秴绾ф湰銆佹帉涓婄数鑴戙佸祵鍏ュ纺璁$畻链哄潎灞炰簬PC镄勮寖鐣淬备篃灏辨槸璇碢C鏄涓涓骞挎硾璇嶏纴灞炰簬鐢佃剳镄勬荤О銆

‘叁’ 什么是知识图谱

知识图谱,是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。

‘肆’ 鐭ヨ瘑锲捐氨锛氭柟娉曘佸疄璺典笌搴旂敤绗旇-绗5绔 鐭ヨ瘑锲捐氨铻嶅悎

鐭ヨ瘑锲捐氨鍖呭惈鎻忚堪鎶借薄鐭ヨ瘑镄勬湰浣揿眰鍜屾弿杩板叿浣扑簨瀹炵殑瀹炰緥灞伞傛湰浣揿眰鐢ㄤ簬鎻忚堪鐗瑰畾棰嗗烟涓镄勬娊璞℃傚康銆佸睘镐с佸叕鐞嗭绂瀹炰緥灞傜敤浜庢弿杩板叿浣揿疄浣揿硅薄銆佸疄浣挞棿鍏崇郴锛屽寘钖澶ч噺镄勪簨瀹炲拰鏁版嵁銆

鐭ヨ瘑铻嶅悎鏄瑙e喅鐭ヨ瘑锲捐氨寮傛瀯闂棰樼殑链夋晥阃斿缎銆傜煡璇呜瀺钖埚缓绔嫔纾鏋勬湰浣撴垨寮傛瀯瀹炰緥涔嬮棿镄勮仈绯伙纴浠庤屼娇寮傛瀯镄勭煡璇嗗浘璋辫兘鐩镐簰娌熼氾纴瀹炵幇瀹冧滑涔嬮棿镄勪簰镎崭綔銆

锛1锛夎娉曚笉鍖归厤

鏂规硶锛氩敖閲忓皢涓嶅悓镄勮瑷杞鍖栦负钖屾牱镄勮娉曟牸寮

锛2锛夐昏緫琛ㄧず涓嶅尮閰

鏂规硶锛氢緥濡傦纴阃氲繃瀹氢箟浠庤瑷L1阃昏緫琛ㄧず鍒拌瑷L2镄勯昏緫琛ㄧず镄勮浆鎹㈣勫垯

锛3锛夊师璇镄勮涔変笉鍖归厤

娉ㄦ剰锛氶噰鐢ㄤ笉钖岃瑷镄勬湰浣扑氦浜掓椂锛岄渶瑕佹敞镒忓畠浠镄勫师璇琛ㄨ揪镒忎箟镄勫樊寮

锛4锛夎瑷琛ㄨ揪鑳藉姏涓嶅尮閰

鏂规硶锛氶渶瑕佸皢琛ㄨ揪鑳藉姏寮辩殑璇瑷钖戣〃杈捐兘锷涘己镄勮瑷杞鎹锛涗絾鏄濡傛灉琛ㄨ揪鑳藉姏寮虹殑璇瑷骞朵笉瀹屽叏鍏煎硅〃杈捐兘锷涘急镄勮瑷锛岃繖镙风殑杞鎹㈠彲鑳戒细阃犳垚淇℃伅镄勬崯澶便

锛1锛夋傚康鍖栦笉鍖归厤

鐢变簬瀵瑰悓镙风殑寤烘ā棰嗗烟杩涜屾娊璞$殑鏂瑰纺涓嶅悓阃犳垚镄勚傛疮涓浜哄箂chema镄勭悊瑙d笉钖岋纴鎶借薄鍑烘潵镄凷chema涓嶅悓銆

a. 姒傚康锣冨洿镄勪笉鍖归厤

姒傚康宸寮备互鍙娄汉镄勪富瑙傚樊寮伞

b. 妯″瀷瑕嗙洊镄勪笉鍖归厤

妯″瀷镄勫箍搴︼纸棰嗗烟锣冨洿锛夈佹ā鍨嬬殑绮掑害锛堣︾粏绋嫔害锛夈佹湰浣揿缓妯$殑瑙傜偣锛堜粠浠涔堣掑害𨱒ユ弿杩伴嗗烟鍐呯殑鐭ヨ瘑锛

锛2锛夎В閲娄笉鍖归厤

瀵规傚康鍖栬存槑鏂瑰纺涓嶅悓阃犳垚镄勚

a. 妯″瀷椋庢牸镄勪笉鍖归厤

i. 锣冧緥涓嶅尮閰嶃傜浉钖岀殑姒傚康浼氭湁涓嶅悓镄勮〃绀猴绂浣跨敤涓嶅悓镄勪笂灞傛湰浣

ii. 姒傚康鎻忚堪涓嶅尮閰嶃傦纻锛熸湰浣撶殑鏋勫缓涓嶅悓

b. 寤烘ā链璇涓婄殑涓嶅尮閰

i. 钖屼箟链璇锛堣嚜铹惰瑷锛夈俢ar&automobile

ii. 钖屽舰寮备箟链璇銆俢onctor(鎸囨尌瀹讹绂鍗婂间綋)

iii. 缂栫爜镙煎纺銆俥g:镞ユ湡(dd/mm/yyyy;mm-dd-yy)

璇瑷灞傜殑涓嶅尮閰嶅彲浠ヨ繘琛岃瑷涔嬮棿镄勮浆鎹锛涙ā鍨嫔眰镄勪笉鍖归厤锛屽彲浠ユ牴鎹鍖归厤绫诲瀷镄勪笉钖岄夋嫨姝g‘镄勭畻娉曘

锛1锛夊熀浜庡崟链浣撶殑闆嗘垚

涓嶅悓链浣挞泦鎴愪竴涓澶ф湰浣掳纴浣嗘槸杩欑嶆柟娉曞逛簬鍏朵腑镄勬疮涓链浣撴潵璇存椂杩囦簬搴炲ぇ镄勶纴涓旀帹鐞嗗拰镆ヨ㈢殑镞跺欐晥鐜囦绠銆

锛2锛夊熀浜庡叏灞链浣-灞閮ㄦ湰浣撶殑闆嗘垚

鎶藉彇鍏卞悓鐭ヨ瘑鏋勫缓鍏ㄥ眬链浣掳纴钖屾椂钖勪釜绯荤粺鍙浠ユ嫢链夎嚜宸辩殑链浣掳纴绉颁负灞閮ㄦ湰浣掳纸鏄鍓旈櫎浜嗗叡链夌煡璇嗗悧锛燂纻涓嶆槸锛夈傞渶瑕佸缓绔嫔眬閮ㄦ湰浣揿拰鍏ㄥ眬链浣扑箣闂寸殑鏄犲皠銆傚眬閮ㄦ湰浣扑晶閲崭簬鐗瑰畾镄勭煡璇嗭纴鍏ㄥ眬链浣扑缭璇佷笉钖岀郴缁熼棿寮傛瀯镄勯儴鍒呜兘杩涜屼氦浜掋

锛1锛夋椠灏勭殑瀵硅薄瑙掑害

鏄庣‘鏄犲皠搴旇ュ缓绔嫔湪寮傛瀯链浣撶殑鍝浜涙垚鍒嗕箣闂淬

浠庢椠灏勫硅薄𨱒ョ湅锛屽彲灏嗘湰浣撴椠灏勫垎涓烘傚康涔嬮棿镄勬椠灏勫拰鍏崇郴涔嬮棿镄勬椠灏勶纴鍏朵腑姒傚康涔嬮棿镄勬椠灏勬槸链锘烘湰镄勬椠灏勚

锛2锛夋椠灏勭殑锷熻兘瑙掑害

鏄庣‘寤虹珛鍏锋湁浣旷嶅姛鑳界殑链浣撴椠灏勚11绉

锛3锛夋椠灏勭殑澶嶆潅瑙掑害

鏄庣‘浠涔埚舰寮忕殑鏄犲皠鏄绠鍗旷殑锛屼粈涔堟槸澶嶆潅镄勚

濡备綍鍙戠幇寮傛瀯链浣挞棿镄勬椠灏勶纻

链浣撴椠灏勮繃绋嬶细

锛1锛夊煎叆寰呮椠灏勭殑链浣

锛2锛夊彂鐜版椠灏勚

锛3锛夎〃绀烘椠灏勚

鍙戠幇鏄犲皠鏂规硶锛

(1)  锘轰簬链璇鍜岀粨鏋勭殑链浣撴椠灏

(2) 锘轰簬瀹炰緥镄勬湰浣撴椠灏

(3) 缁煎悎鏂规硶

‘伍’ 知识图谱是什么有哪些应用价值

知识图谱 (Knowledge Graph) 是当前的研究热点。自从2012年Google推出自己第一版知识图谱以来,它在学术界和工业界掀起了一股热潮。各大互联网企业在之后的短短一年内纷纷推出了自己的知识图谱产品以作为回应。比如在国内,互联网巨头网络和搜狗分别推出”知心“和”知立方”来改进其搜索质量。那么与这些传统的互联网公司相比,对处于当今风口浪尖上的行业 - 互联网金融, 知识图谱可以有哪方面的应用呢?

目录
1. 什么是知识图谱?
2. 知识图谱的表示
3. 知识图谱的存储
4. 应用
5. 挑战
6. 结语

1. 什么是知识图谱?

知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。

知识推理

推理能力是人类智能的重要特征,使得我们可以从已有的知识中发现隐含的知识, 一般的推理往往需要一些规则的支持【3】。例如“朋友”的“朋友”,可以推理出“朋友”关系,“父亲”的“父亲”可以推理出“祖父”的关系。再比如张三的朋友很多也是李四的朋友,那我们可以推测张三和李四也很有可能是朋友关系。当然,这里会涉及到概率的问题。当信息量特别多的时候,怎么把这些信息(side information)有效地与推理算法结合在一起才是最关键的。常用的推理算法包括基于逻辑(Logic) 的推理和基于分布式表示方法(Distributed Representation)的推理。随着深度学习在人工智能领域的地位变得越来越重要,基于分布式表示方法的推理也成为目前研究的热点。如果有兴趣可以参考一下这方面目前的工作进展【4,5,6,7】。

大数据、小样本、构建有效的生态闭环是关键

虽然现在能获取的数据量非常庞大,我们仍然面临着小样本问题,也就是样本数量少。假设我们需要搭建一个基于机器学习的反欺诈评分系统,我们首先需要一些欺诈样本。但实际上,我们能拿到的欺诈样本数量不多,即便有几百万个贷款申请,最后被我们标记为欺诈的样本很可能也就几万个而已。这对机器学习的建模提出了更高的挑战。每一个欺诈样本我们都是以很高昂的“代价”得到的。随着时间的推移,我们必然会收集到更多的样本,但样本的增长空间还是有局限的。这有区别于传统的机器学习系统,比如图像识别,不难拿到好几十万甚至几百万的样本。

在这种小样本条件下,构建有效的生态闭环尤其的重要。所谓的生态闭环,指的是构建有效的自反馈系统使其能够实时地反馈给我们的模型,并使得模型不断地自优化从而提升准确率。为了搭建这种自学习系统,我们不仅要完善已有的数据流系统,而且要深入到各个业务线,并对相应的流程进行优化。这也是整个反欺诈环节必要的过程,我们要知道整个过程都充满着博弈。所以我们需要不断地通过反馈信号来调整我们的策略。

6. 结语

知识图谱在学术界和工业界受到越来越多的关注。除了本文中所提到的应用,知识图谱还可以应用在权限管理,人力资源管理等不同的领域。在后续的文章中会详细地讲到这方面的应用。

参考文献

【1】De Abreu, D., Flores, A., Palma, G., Pestana, V., Pinero, J., Queipo, J., ... & Vidal, M. E. (2013). Choosing Between Graph Databases and RDF Engines for Consuming and Mining Linked Data. In COLD.

【2】User Behavior Tutorial

【3】刘知远 知识图谱——机器大脑中的知识库 第二章 知识图谱——机器大脑中的知识库

【4】Nickel, M., Murphy, K., Tresp, V., & Gabrilovich, E. A Review of Relational Machine Learning for Knowledge Graphs.

【5】Socher, R., Chen, D., Manning, C. D., & Ng, A. (2013). Reasoning with neural tensor networks for knowledge base completion. In Advances in Neural Information Processing Systems (pp. 926-934).

【6】Bordes, A., Usunier, N., Garcia-Duran, A., Weston, J., & Yakhnenko, O. (2013). Translating embeddings for modeling multi-relational data. In Advances in Neural Information Processing Systems (pp. 2787-2795).

【7】Jenatton, R., Roux, N. L., Bordes, A., & Obozinski, G. R. (2012). A latent factor model for highly multi-relational data. In Advances in Neural Information Processing Systems(pp. 3167-3175).

热点内容
dirt5需要什么配置 发布:2024-05-20 06:02:58 浏览:542
怎么把电脑锁上密码 发布:2024-05-20 05:19:09 浏览:985
安卓为什么连上wifi后没有网络 发布:2024-05-20 05:17:50 浏览:419
安卓usb在设置哪里 发布:2024-05-20 05:03:03 浏览:187
绥化编程 发布:2024-05-20 04:59:44 浏览:991
基本原理和从头计算法 发布:2024-05-20 04:50:32 浏览:30
配置情况指的是什么 发布:2024-05-20 04:48:14 浏览:497
那个程序用来编译源文件 发布:2024-05-20 04:46:45 浏览:551
小程序需要数据库吗 发布:2024-05-20 04:35:14 浏览:338
链接sqlserver 发布:2024-05-20 04:27:53 浏览:210