布加迪腳本
A. 想編個「心理測試.vbe」的小腳本 請大俠指教
Problem0 = "你最喜歡什麼山:" & chr(13) & "1.喜馬拉雅山" & chr(13) & "2.阿爾卑斯山"
Dim Problem(10)
Dim Result(4)
Problem(1) = "你最喜歡的花是:1.玫瑰 2.茉莉 3.紫羅蘭 4.鬱金香"
Problem(2) = "你最喜歡的車是:1.寶馬 2.賓士 3.布加迪威龍 4.賓利"
Problem(3) = "你最喜歡的人是:1.爸爸 2.媽媽 3.張三 4.李四"
Result(1) = "A"
Result(2) = "B"
Result(3) = "C"
Result(4) = "D"
Dim Answer
Dim Index
Index = 0
Do Until Index > 5
Answer = InputBox(Problem0)
Select Case Answer
Case "1"
Answer = InputBox(Problem(1))
Case "2"
Answer = InputBox(Problem(2))
Case "3"
Answer = InputBox(Problem(3))
Case "4"
MsgBox("給我重新好好答!")
End Select
Index = Index + 1
Loop
MsgBox(Result(CInt(Answer)))
自己改改吧,
0分,不太厚道!
B. 請問QQ軍刀 的主要用法~~
1 // 這里是需要換的舊車車牌號換車=1 // 1表示開啟換車功能新車=64 // 新車的代碼,代碼可以在車市中查看,這里的64代表布加迪威航顏色=1 // 新車的顏色 1=黑色 2= 白色 3= 灰色 4=藍色 5=紅色 6=黃色 7=綠色提示:不要在每輛車上使用自動換車功能,你不可能一次就能換10輛車,但是程序還是會嘗試去換車,這樣就影響了腳本執行速度不要在短時間執行多個次腳本,這樣極大的可能只能執行其中一次,應確保每個觸發時間至少間隔3到5分鍾以上原則上應該避免在網路高峰期時進行腳本停車,停車失敗率相對來說要高,當然也有應對的辦法就是隔幾分鍾再執行一次腳本,以確保萬無一失
我告訴你新版的普通應用其他的你可以慢慢摸索出來的先登錄你的大號和你的小號在下面就有你登錄的賬號了而且右邊的列表有大號應用和小號應用你登好QQ右擊QQ有選項的你選擇執行大號就行了大號完了點另一個號,同樣右擊,選擇執行小號
大號就是你用的有用那個QQ小號就是為你大號做輔助作用的沒什麼用的號根據號來選擇執行大號應用還是小號應用列表都寫有選項
C. 俠盜飛車5,像蘭博基尼,布加迪之類的在哪找,有沒有什麼秘籍之類的,求大神指點
要內置修改器才能刷出
D. 為什麼我的QQ搶車位換車時顯示系統繁忙已經半個月了天天這樣
QQ搶車位免費換車順序表:
二手奧拓(5金/分鍾) → 吉利自由艦(9金/分鍾) → 桑特那 (13盡/分鍾) → POLO(14金/分鍾) → 標志307(15金/分鍾) → S-MAX(18金/分鍾) → Mini Cooper(20金/分鍾) → 奧迪A6(24金/分鍾) → 悍馬(25金/分鍾) → 瑪莎(30金/分鍾) → 阿斯頓馬丁(32金/分鍾) → 邁巴赫62(34金/分鍾) → 雅緻728(38金/分鍾) → 布加迪威航(50金/分鍾) 。
經過計算,這是2009年4月13日後最科學的QQ空間搶車位換車攻略,不過要說明的是,在這搶車位換車順序中,如果錢不夠不要去攢到錢夠,能早一分鍾換個盈利更高點的車就先換,接著再換順序表的車,如果一直攢著錢,那上面的方法就不是最有效的了。
有很多人到換Mini Cooper不買Mini Cooper,而是換寶馬320,或許認為之間只差1W,建議大家還是換Mini Cooper,這樣10輛Mini Cooper比10輛寶馬320節省了10W,節省10W用來換車,在所有玩家排行中也許1金就差了好幾個名次。
那麼,更新以後如果想最快擁有一輛布加迪威航該怎樣呢?
和以前一樣,買夠10輛奧迪A6,直接沖威航(不要攢錢,有多少錢先以舊換新),也就是說,一直換一輛車,其他9輛奧迪A6不換!這樣做可以最快的買到威航,但不是最賺錢最省錢的方法。
由於QQ搶車位玩家的劇增,我也來談談我的經驗,首先要明白一點想賺錢快,必須先擁有10輛2手車 起步 估計1天換2次車不到半個月就能換10台標致307 ,如果你像有些人就為了買一輛自己喜歡的車 拚命的賺啊 賺啊那樣 很慢啊,這樣是非常慢的
3輛車賺錢 和10輛車你說哪個快?
傻瓜都知道
下面是換車表本人覺得這個表不錯 標紅字的 是換的車 沒錢 就1天換1台
如果錢多可以多換哈
--------------------------------------------------------------------------------
黑字→擁有10輛車的基礎上
紅字→把其中一輛車逐步的換成下一個最理想的
第一輪二手奧拓→江南奧拓→夏利→奇瑞QQ→spark樂馳→吉利自由艦
第二輪吉利自由艦→富康→雨燕→標志206→雪鐵龍C2→名爵3SW→桑塔納
第三輪 桑塔納→POLO→福田歐馬可→別克凱越→標致307
第四輪 標致307→寶來→賽拉圖→福特福克斯→飛度→卡羅拉→速騰→斯柯達明銳→高爾夫→本田CIVIC→騏達→朗逸→新畢加索→馬自達6→帕薩特→現代酷派→邁騰→雅閣→S-MAX
第五輪 S-MAX→蒙迪歐致勝→本田CRV→斯巴魯翼豹→PT漫步者→途勝→甲殼蟲→奧迪A4→指南者→哈雷摩托→MiniCooper
第六輪 MiniCooper→寶馬320→切諾基→牧馬人→寶馬Z4→奧迪A6
第七輪 奧迪A6→奧迪TT→悍馬→凱迪拉克→寶馬730→沃爾沃XC90→奧迪Q7→路虎→寶馬X5→林肯加長→保時捷911→RIMOR賓士房車→捷豹XK→保時捷卡宴→途銳→雷克薩斯LS600→奧迪R8→瑪莎拉蒂
第八輪 瑪莎拉蒂→賓士S600→賓士豪華大巴→法拉利F430→阿斯頓馬丁
第九輪阿斯頓馬丁→蘭博基尼→邁巴赫62
第十輪邁巴赫62→勞斯萊斯→帕加尼→雅緻728
第十一輪雅緻728→布加迪威龍→
終極布加迪威航。
一:起步時期
以最快的速度,60小時刷夠10輛車
條件:一個大號QQ,三個小號QQ
開始0-12小時:
起步是最關鍵的全速全效運行的話,2天48小時可以弄到6輛車。開始就是開小號或停在別人的車場里刷錢。初始狀態下系統贈送一輛二手奧托+1000金。開3個小號,把小號的車放在自己的車場。自己的二手奧托停在小號那裡。4輛車,每輛每分鍾5金。每部12小時4輛=14400金,加上系統贈送的1000本金。12小時後你就有15400了.然後把4輛車再停幾分鍾那就夠16000元。然後立刻再買一兩二手奧托。
12-24小時:這時候你有5輛車(大號兩輛+小號3輛)。12小時後就是:5輛×3600元=18000元。給大號買第三部車。還剩2000金。
24-36小時:6輛×3600元=21600金+餘款2000=22600。買第四部車還剩6600
36-48小時:7輛×3600元=25200金+餘款6600=31800。這時買第5第6輛車。
48-60小時:9輛×3600元=32400金,買第10輛車。
二:車輛升級
(買夠10輛二手奧托,以後都是只換不買,換車時原車可以以原價沖抵,交差價就行了)
在買夠10輛二手奧拓後。車輛依次換購順序為:二手奧拓→吉利自由艦→桑塔納→標致307→S-MAX→MiniCooper→奧迪A6→瑪莎拉蒂→阿斯頓馬丁→邁巴赫62→雅緻728→布加迪威航(從開始到圓滿最科學的方法是換購11次)
理由及數據請看另一篇《車輛換購順序表》
三:話外題(搶車位的可玩性在哪裡?)
其實之所以這個游戲吸引我的地方就是因為它符合了一切現實中的資金運作規律。即「2080法則」有錢的越有錢,窮的越窮。 它同樣符合社會主義經濟的中國市場的發展規律:「讓一部分人,先富起來」和「發展才是硬道理」
什麼是2080法則?即「二八法則」
1897年,義大利經濟學家帕列托在對19世紀英國社會各階層的財富和收益統計分析時發現:80%的社會財富集中在20%的人手裡,而80%的人只擁有社會財富的20%,這就是「二八法則」。「二八法則」反應了一種不平衡性,但它卻在社會、經濟及生活中無處不在。而「二八法則」恰恰指出了在原因和結果、投入和產出、努力和報酬之間存在這樣一種典型的不平衡現象:80%的成績,歸功於20%的努力;市場上80%的產品可能是20%的企業生產的;20%的顧客可能給商家帶來80%的利潤。
搶車位的游戲中同樣。人有錢的越有錢,窮的越窮。 它同樣符合社會主義經濟的中國市場的發展規律:「讓一部分人,先富起來」和「發展才是硬道理」 20%玩家的洞悉了游戲潛規則的人,在利用規則讓自己的10部車每分鍾都生錢。而80%的普通玩家為了面子,想要好車。在辛辛苦苦的拚命賺錢想把自己唯一的一部車換成好車。確怎麼也沒有人家生錢的速度快。還要擔心停哪不被罰?不貼朋友的條賺不來錢,貼的多了又沒人往自己家停車等問題。還有更可愛的朋友,想靠舉報發財。確完全不知道自己找到10輛舉報車輛,可能只有2輛舉報成功。而在他辛苦奔波的這些時間里,別人的10部車每分鍾都在生錢,他賺了200元罰款提成和朋友的責罵。別人賺了幾十萬和眾人的羨慕。(註:舉報只能舉報自己的好友,也就上說你要在某人的停車場發現自己QQ好友的車。此車的旁邊才會有個舉報點擊標志)
以下是我把所有車輛的車名、車價、每分鍾盈利金額、幾小時回本、推薦更換星級等數據全部匯總給大家。這些數據是在換車的時候參考的。
例:花79000換每分鍾贏利12金的雪鐵龍C2,當然不如花80000買每分鍾贏利13的桑塔納,每分鍾多賺1金,10輛車每分鍾就是10金,每天就多14400元啊。因為從數據上明顯可以看見桑塔納的回本時間是103小時,明顯比雪鐵龍C2的110賺的快
四:《QQ搶車位車輛性價比表格》
此表用於10輛車刷滿以後換車時參考
QQ搶車位今天更新舉報新玩法,下午看了看發現,舉報新玩法還沒有進行更新,卻發現一些車輛的盈利又變了,比如悍馬,由4月9日的24金/分鍾,又恢復成了25金/分鍾,既然如此,QQ搶車位換車次序相應的需要進行改動,具體如下所示。
車名 價格(金) 盈利
二手奧拓 16,000 5金/分鍾
吉利自由艦 48,000 9金/分鍾
桑特那 80,000 13金/分鍾
POLO 91,000 14金/分鍾
標志307 110,000 15金/分鍾
S-MAX 219,800 18金/分鍾
Mini Cooper 320,000 20金/分鍾
奧迪A6 620,000 24金/分鍾
悍馬 800,000 25金/分鍾
瑪莎拉蒂 1,790,000 30金/分鍾
阿斯頓馬丁 3,620,000 32金/分鍾
邁巴赫62 6,180,000 34金/分鍾
雅緻728 13,880,000 38金/分鍾
布加迪威航 43,000,000 50金/分鍾
根據調整盈利後,換車次序和以前大致沒改變,但是也有不同,下面是計算出的換車次序:
二手奧拓(5金/分鍾) → 吉利自由艦(9金/分鍾) → 桑特那 (13盡/分鍾) → POLO(14金/分鍾) → 標志307(15金/分鍾) → S-MAX(18金/分鍾) → Mini Cooper(20金/分鍾) → 奧迪A6(24金/分鍾) → 悍馬(25金/分鍾) → 瑪莎(30金/分鍾) → 阿斯頓馬丁(32金/分鍾) → 邁巴赫62(34金/分鍾) → 雅緻728(38金/分鍾) → 布加迪威航(50金/分鍾) 。
經過計算,這是4月23日後最科學的換車次序,不過要說明的是,在這換車次序中,如果錢不夠不要去攢到錢夠,能早一分鍾換個盈利更高點的車就先換,接著再換次序表的車,如果一直攢著錢,那上面的方法就不是最有效的了。比如A6換悍馬後(十輛全換成悍馬),有足夠的錢換寶馬730或保時捷911(單輛單輛依次換),則先換成盈利更高的車輛,存夠了換瑪莎的錢後再依次序表中的順序進行更換。
簡單比較:
A6到悍馬中間差價18W,可每分鍾多增1金
而A6到寶馬中間差價46W,每分鍾多增2金(即相當於23W多增1金,那麼當然是全換成悍馬要劃算啦)
所以,先由A6十輛全換成悍馬是最劃算的。
後面的換車走勢從悍馬到寶馬730(差價28W增1金)、保時捷911(差價42W增2金,即21W增1金)、瑪莎(差價29W增2金,即14.5W增1金)
PS:以上僅為本人計算換車次序,歡迎大家砸磚頭
E. 什麼GPU最好
根據全面定性定量的實驗結果,截至2018年10月8日,NVIDIA RTX 2080 Ti是現在最好的深度學習GPU(用單個GPU運行Tensoflow)。以單GPU系統的性能為例,對比其他GPU,它的優劣分別是:
FP32時,速度比1080 Ti快38%;FP16時,快62%。在價格上,2080 Ti比1080 Ti貴25%
FP32時,速度比2080快35%;FP16時,快47%。在價格上,2080 Ti比2080貴25%
FP32時,速度是Titan V的96%;FP16時,快3%。在價格上,2080 Ti是Titan V的1/2
FP32時,速度是Tesla V100的80%;FP16時,是Tesla V100的82%。在價格上,2080 Ti是Tesla V100的1/5
請注意,所有實驗都使用Tensor Core(可用時),並且完全按照單個GPU系統成本計算。
深入分析
實驗中,所有GPU的性能都是通過在合成數據上訓練常規模型,測量FP32和FP16時的吞吐量(每秒處理的訓練樣本數)來進行評估的。為了標准化數據,同時體現其他GPU相對於1080 Ti的提升情況,實驗以1080 Ti的吞吐量為基數,將其他GPU吞吐量除以基數計算加速比,這個數據是衡量兩個系統間相對性能的指標。
訓練不同模型時,各型號GPU的吞吐量
對上圖數據計算平均值,同時按不同浮點計算能力進行分類,我們可以得到:
FP16時各GPU相對1080 Ti的加速比
FP32時各GPU相對1080 Ti的加速比
可以發現,2080的模型訓練用時和1080 Ti基本持平,但2080 Ti有顯著提升。而Titan V和Tesla V100由於是專為深度學習設計的GPU,它們的性能自然會比桌面級產品高出不少。最後,我們再將每個GPU的平均加速情況除以各自總成本:
FP16時各GPU相對1080 Ti的每美元加速情況
FP32時各GPU相對1080 Ti的每美元加速情況
根據這個評估指標,RTX 2080 Ti是所有GPU中最物有所值的。
2080 Ti vs V100:2080 Ti真的那麼快嗎?
可能有人會有疑問,為什麼2080 Ti的速度能達到Tesla V100的80%,但它的價格只是後者的八分之一?答案很簡單,NVIDIA希望細分市場,以便那些有足夠財力的機構/個人繼續購買Tesla V100(約9800美元),而普通用戶則可以選擇在自己價格接受范圍內的RTX和GTX系列顯卡——它們的性價比更高。
除了AWS、Azure和Google Cloud這樣的雲服務商,個人和機構可能還是買2080 Ti更劃算。但這不是說亞馬遜、微軟、Google這些公司「人傻錢多」,Tesla V100確實有一些其他GPU所沒有的重要功能:
如果你需要FP64計算。如果你的研究領域是計算流體力學、N體模擬或其他需要高數值精度(FP64)的工作,那麼你就得購買Titan V或V100s。
如果你對32 GB的內存有極大需求(比如11G的內存都不夠存儲模型的1個batch)。這類情況很少見,它面向的是想創建自己的模型體系架構的用戶。而大多數人使用的都是像ResNet、VGG、Inception、SSD或Yolo這樣的東西,這些人的佔比可能不到5%。
面對2080 Ti,為什麼還會有人買Tesla V100?這就是NVIDIA做生意的高明之處。
2080 Ti是保時捷911,V100是布加迪威龍
V100有點像布加迪威龍,它是世界上最快的、能在公路上合法行駛的車,同時價格也貴得離譜。如果你不得不擔心它的保險和維修費,那你肯定買不起這車。另一方面,RTX 2080 Ti就像一輛保時捷911,它速度非常快,操控性好,價格昂貴,但在炫耀性上就遠不如前者。
畢竟如果你有買布加迪威龍的錢,你可以買一輛保時捷,外加一幢房子、一輛寶馬7系、送三個孩子上大學和一筆客觀的退休金。
原始性能數據
FP32吞吐量
FP32(單精度)演算法是訓練CNN時最常用的精度。以下是實驗中的具體吞吐量數據:
FP16吞吐量(Sako)
FP16(半精度)演算法足以訓練許多網路,這里實驗用了Yusaku Sako基準腳本:
FP32(Sako)
FP16時訓練加速比(以1080 Ti為基準)
FP32時訓練加速比(以1080 Ti為基準)
價格表現數據(加速/$1,000)FP32
價格表現數據(加速/$1,000)FP16
實驗方法
所有模型都在合成數據集上進行訓練,這能將GPU性能與CPU預處理性能有效隔離開來。
對於每個GPU,對每個模型進行10次訓練實驗。測量每秒處理的圖像數量,然後在10次實驗中取平均值。
計算加速基準的方法是獲取的圖像/秒吞吐量除以該特定模型的最小圖像/秒吞吐量。這基本上顯示了相對於基線的百分比改善(在本實驗中基準為1080 Ti)。
2080 Ti、2080、Titan V和V100基準測試中考慮到了Tensor Core。
實驗中使用的batch size
此外,實驗還有關於硬體、軟體和「什麼是典型的單GPU系統」的具體設置,力求盡量還原普通用戶的模型訓練環境,充分保障了結果的准確性。
F. 《龍族》作者江南的簡介
江南,真名楊治,2013第八屆中國作家富豪榜首富、暢銷小說領軍人物、內地幻想文學代表,《九州志》主編,媒體公司總經理。
1977年7月13日生於安徽舒城縣,高中就讀安徽名校、李克強總理母校合肥八中,後考入北京大學化學系,留學於美國名校Washington University in St Louis。
師從質譜科學代表人物Michael L. Gross,憑借回憶北大生活的小說《此間的少年》踏入文壇,作品情節多變、熱血勵志、文字細膩,在高校青年學生中有持續的影響力。
幻想作品《九州·縹緲錄》系列構建了以中國歷史和神話為原型的架空世界、青春作品《龍族》系列在中國創下了單本即銷售200萬冊的記錄,中國出版界官方媒體《中國新聞出版報》撰文探討《龍年再說「龍族現象」》。

(6)布加迪腳本擴展閱讀:
《龍族》是作家江南創作的系列長篇魔幻小說,由《龍族Ⅰ火之晨曦》、《龍族Ⅱ悼亡者之瞳》、《龍族Ⅲ黑月之潮》、《龍族Ⅳ奧丁之淵》,《龍族Ⅴ:悼亡者的歸來》組成,2009年10月1日開始在小說繪上連載。
第一部於2010年04月首次出版,第二部於2011年05月出版,第三部上篇於2012年12月出版,第三部中篇於2013年07月出版,第三部下篇於2013年12月出版,第四部則於2015年10月出版,第五部於2018年5月15日在QQ閱讀平台開始連載 。
作品講敘了少年路明非在申請國外大學時收到了來自芝加哥遠郊處的一所私立大學:卡塞爾學院的邀請函,隨著路明非同學坐上去往芝加哥的CC1000次列車,踏上了與龍族爭鋒的征程。
G. chatgpt用了多少gpu
謝關於ChatGPT這件事,首先我先幫助大家普及下InstructGPT (Instruct GPT trainning with Human Feed back) 和 Reinforcement Learning,做一個簡單的分析。接著,希望通過對英國技術行業,起死回生的故事,給大家關於中國大模型事業帶一點點有益的啟發。但行勝於言,很多事情原理是清晰的,卻不是每一個人都可以做出來。
比如ChatGPT堅持使用開源數據集 TruthfulQA 和 RealToxicity ,比如國內廠商以雲計算公司為代表在GPU集群上也早已經有了豐厚的儲備,那麼做不做,以什麼路徑做就特別關鍵。
Before Prompt GPT
我的切入點是大模型訓練的數學原理,以及基於Transform, self-attention的基點的歷史演變,歡迎其他夥伴來繼續補充。
# InstructGPT [Training language models to follow instructions with human feedback, Long Quyang]
* GPT (Generative Pre-trained Transfomer)
Bert開始NLP有一個任務叫做MLM, 即 Masked Language Model 和 NSP,即Next Sentence Prediction 。所以NLR任務開始前先通過這個兩個任務對應的腳本工具生成被遮擋的上下文,和答案。因此又稱自監督。
這樣做有什麼問題呢?從過去的實驗上看生產的內容包含了大量的,重復,無意義,負面,甚至危險⚠️的回復。這些內容往往在預訓練語料里覆蓋不足。
由於自監督特性,和生成模型(Generative Models)一樣,「Unsupervised Training」 是可以應用的。舉個例子,imageNet 有一個 image-1k數據集,為什麼會有這個數據集呢?圖像在神經網路G裡面的表徵就是特徵向量(feature map),如果你對圖片做各種處理,通個訓練讓這個網路輸出的特徵向量數值穩定下來,其實說明網路G學到了最本質的圖像特徵影射 :G(img) ~ G(Transform(img)):
min
注意在這個過程中,我們並沒有用到標注。所以Image-1k的作用就是初始化參數,啟發這個無監督訓練過程。
GAN loss
即訓練的本質是訓練隨機變數分布M,而如果這個分布一旦被找到,所有的M(img),都是從這個隨機分布的一個采樣。
當我們將分布M的輸入調整為文字,其輸出調整為應答,就對應從所有可能的回答中采樣一個最好的回答。一旦你接受這個思路走下去,就會越來約認同,DeepMind和OpenAI的通用人工智慧,也或許一切就起源於此。
所以生成文字,生產圖片並不是僅僅為了好玩,方法上是革命性的。OpenAI的所有作品都可以用一句話來形容:Sample from true data distribution
由於是無監督的,為了讓結果更好,類似Teacher - Student模式對抗生成網路開始登場。Ian Fellow火了。OpenAI在很長一段時間致力於GAN,VAE等用於生成模型的工作,如果我們不理解這點,我們是無分理解ChatGPT的。GPT的主角不是Transformer是Generative Models Unsupervised training, 雖然訓練好的GPT確實使用了「多頭自注意力」(Multi-head Self-Attention Decode + MLP)解碼器塔。
在GPT2 (Hugging Face)中我們仔細看下loss:
loss_fct = CrossEntropyLoss() loss = loss_fct(shift_logits.view(-1, shift_logits.size(-1)), shift_labels.view(-1))
當一句話的數字特徵表示向量,通過decoder得到,"abcd[e]",和自身的偏移「[a]bcde」 錯峰開做CrossEntropy loss,自監督就很形象了。
* InstructGPT : Fine tuning with human feedback [RLHM]
由於MLM限制,Predict next words Loss有沒有問題?如果回答是負面的,危險的,重復自身且無意義的怎麼辦?在訓練上引入了一個新的技巧叫做 Prompt 或者 Instruction template.
注意這個技巧是Finetuning,所以是載入訓練好的GPT-3參數,然後再通過一組人工標記的數據微調參數,使得模型表現更符合預期:
InstructGPT
由於label是明確人工給出的loss應該就是我們通常的softmax loss. 這個做法有沒有問題?評測數據表明InstructGPT在四個任務(TruthfulQA,惡意詞彙回答, 客戶助手,陪伴)有超凡脫俗的表現。
* Replace self-supervised unsupervised training with RL
強化學習有一個特點和自監督,無監督學習很像:無需label.
像人體分泌多巴胺一樣,強化學習通過反饋模型(Reward Model)來模擬基於多巴胺的生物學習機制 -- 不一定是最優解。在關於如何表現的像人一樣這個話題,這個目標很合適,因為我們也無法定義什麼的目標函數的最優解最合適人類,也許多個目標的中庸解,恰恰就是人類最合適的反應。
ChatGPT通過模型針對一個Prompt作出多種回答的排序,成為了Reward model的關鍵。排序怎麼處理?如果你知道很多年前MSR的Rank from Learning,就不會驚訝,有對應的loss,這是很成熟的技術,總之這不是問題。簡單說全排序,由局部排序給出;局部排序,由兩兩排序給出,也就是相對強弱給出:
如果我們能給出 A > B, B > C, C > D, 我們就能給出全排序 A > B > C > D, 注意在inference階段這是通過比較特徵瞬間給出的,無需Topk機制。
有了Reward model 就開展可以更新參數。在RL更新模塊叫做Policy Gradient. 在數學優化方法中有一種叫做Proximal optimization, 即wolf-powell條件進行梯度方向的一維線性搜索。
# British Tech Review from the past
2017 年紐博格林(Nurburging)最快單圈紀錄 :6 min 45.90 s
2017 年2月蔚來汽車在德國正式出圈,以6 min 45.90 刷新紐博格林單圈賽道紀錄 (Nurburging Lap Record)。這樣一樣造型超前的蔚來藍,迅速刷遍全球。當時蔚來的設計團隊主要在德國和上海,不知道大家有沒有想過:
「為什麼NIO已經在汽車王國德國成立設計團隊,卻單單將超跑EP9的設計, 車輛製造,以及發動機引擎調校放在英國完成?」
這就不得不提及英聯邦畢業生經常可以看到的幾個符號 R&R, RCA, Dyson, Inmos (敲重點), ARM, Lloyd, DeepMind(敲重點) :
勞斯萊斯(羅爾斯-羅伊斯) 簡稱R&R,中文羅羅
碰巧的是歷史上還有幾個大家所熟悉汽車品牌也是來自英國本土 :
天命不凡的 Rolls-Royce (R&R)
1904Rolls製作了勞斯萊斯汽車最初的原型,後來他和Royce於1906年在英國德比共同創立汽車品牌「勞斯萊斯」。這個品牌還包含了「勞斯萊斯」和「賓利」(1930年收購)兩個子品牌。隨著在發動機技術進步,勞斯萊斯在航空發動機技術領域取得了成功,R&R與位於英國南部布里斯托(Bristol)的希得來(Bristol Siddeley Engines Ltd)公司合並達到巔峰。時至今日布里斯托仍然保留了發動機設計方面的精華。滄海桑田,汽車業務在70年代後,分別被大眾(Volk wgen)和寶馬(BWM)收購,留下了我們現在所了解的汽車拼圖。
由於Rolls-Royce的設計和發動機技術,十分獨特,使得Rolls-Royce品牌得以在收購後保留。收購的導火索是,70年代由於航空發動機業務(Rolls-Royce Aerospace)業務導致財務困境,勞斯萊斯被國有化為勞斯萊斯有限責任控股(R&R Limited)。汽車業務(R&R motors)隨後被被剝離。
以發動機著稱的Rolls-Royce控股將MK202的生產專利權, 以及大名鼎鼎的燃氣渦輪發動機RB211技術轉讓給中國,歷史在一個不經意間,推動了中國航空發動機研發進度。
2018年一組全新的的燃氣渦輪組項目在北京西北旺地區開始落成,在源源不斷地給北京輸出動力的同時,代替傳統煤炭火電給北京一個綠色的天空。
RB211渦輪發動機葉片
另一方面被拆分出來的勞斯萊斯汽車則保留在英國最關鍵的生產車間和研發中心 - 克魯(Crewe)工廠(生產賓利)和古德伍德(Goodwood)工廠,由於實體製造業消退,汽車發動機和主要零部件由寶馬供應。
2. 創始人才是最值錢的賓利:
勞斯萊斯包含兩個子品牌,一個是勞斯萊斯,一個是賓利。賣掉賓利的創始人,賓利先生(Walter Owen Bentley), 自身一個傑出的工程師和汽車發燒友。他設計的汽車,在和法國品牌布加迪在早期比賽中多次取勝(24 Hours of Le Mans)。
賣掉賓利後,閑不住的賓利先生開始為倫敦其他汽車品牌設計發動機,由於其傑出的工作,被看重的賓利先生,連帶公司一起被阿斯頓馬丁收購。收購完成後, 阿斯頓馬丁迫不及待地為新車更換上賓利先生設計的直列六缸發動機(straight 6 engine):
新的發動機在日後幫助阿斯頓馬丁贏得24 Hours of Le Mans賽事冠軍 。這些炫酷的倫敦超跑,造型獨特,線條優美,動力十足。雖然他們有不同的名字,但他們有一個共同的起源:RCA(皇家藝術學院)
3. RCA :權利和榮譽無處不在
RCA全名 Royal Colledge of Art,現任(2022)校長(Chancellor)是曾經蜚聲寰宇,在蘋果主導Mac系列設計的英國設計師喬納森:
RCA的傑出校友包括 Dyson的創始人,工業設計師,發明家Dyson博士:
除了本土汽車品牌R&R, 路虎(Land Rover),阿斯頓馬丁,Mini品牌,還有一眾德系汽車設計師也傳承於此:
韓國起亞的首席設計師 Peter Schreyer
回到最開始的問題:
「為什麼NIO已經在汽車王國德國成立設計團隊,卻單單將超跑EP9的設計, 車輛製造,以及發動機引擎調校單獨在英國完成?」
似乎答案已經躍躍欲出:英國保留了百年汽車工業設計傳承,汽車設計學院不斷輸出設計人才,讓英國在這個領域仍然充滿活力;保留下來的發動機和製造車間,像火種 一樣,還在在每天不間斷生產 -- 雖然進度十分緩慢:
大部分生產車間仍然保留了手工打造的痕跡,即使是勞斯萊斯它那擁有1400人研發中心古德,每天也只能生產20輛 -- 這才是價格昂貴的來源。僅僅誕生不足7年的蔚來,今天已經已經交付了20萬輛中高端車型,按照勞斯萊斯的速度,得生產33年!
到底是什麼導致了這么高的成本?有經濟學家分析,是過度擴張的資本導致的脫實向虛。這里大家可能會疑惑,首先我們有一個問題☝️要解決:
在中國可以看到早早押注中國並獲利巨億的新加坡主權基金淡馬錫,也可以看到在教育,軟體起早貪黑的日系資本,更有實力強勁出手闊綽的美國資本高盛,黑石,摩根大通等。
英國資本像是大洋上的一艘郵輪 ,它就在那,但你就是看不見。
4. 天才的離岸架構設計
既然有資本,就要有為資本服務的便利,英國有三個地方吸引離岸資本注冊,並對外國資本提供稅收豁免,分別是:
* 百慕大群島
* 開曼群島
* 英屬維爾京群島 (也在加勒比海古巴南端)
三島功能近似,其中又以開曼最為有名。在《實質經濟法案》推出前,倫敦和香港的會計師每年會絞盡腦汁將離岸架構設計下的公司注冊在英國開曼這個巴掌大的地方 -- 阿格蘭屋:
這個5層小樓登記了超過18000注冊公司和經濟實體的注冊地址。很快歐盟和其他主要大國盯上了這塊稅外之地,2020年開曼順應形勢推出了《實質經濟法案》,以確保「反映經濟活動」。
這些注冊活動都和審計有關,4大國際審計擔保公司四有其三就是英國公司:
四大雖然享譽全球,但畢竟是以勞動換報酬的服務公司,錢生錢才是荷蘭人和英國人津津樂道的資本主義:銀行,保險,投資和債券。最近幾年,更多地可以看到中國對英國的投資公司比如亞投行,國家開發銀行,中金等,但是鮮見英國資本。這是因為大部分的英國投資銀行主要活動在歐洲, 北非和東南亞市場。
5. 健康環保M&G
在撒切爾夫人時期,英國通過海外投資獲取了巨大的收益,巨大的海外投資收益帶了巨大的消費,但是投資收益和消費並沒有反哺到本土生產和技術提高上,這導致英國本土的生產成本不斷攀升,以至於什麼都比較貴。
和勞斯萊斯同期,1901年M&G投資管理公司在倫敦正式成立,後被英國保誠(PRUDENTIAL)收購,主要市場在歐洲, 北非和東南亞,關注新能源市場:
M&G是一種共同基金,專業的經理人通過收取一定的手續費,幫助公眾打理海外資產投資。獲取的巨度收益,一部分分用於本土消費進口商品,一部分繼續用於海外投資追加。
6. 非洲大鏢客巴萊克
巴萊克是英國僅次於匯豐(HSBC)控股的投資銀行。2008年雷曼兄弟破產,巴克萊趁機提出收購雷曼兄弟,以獲取在北非的業務,但是第二天雷曼兄弟就提交破產保護,收購無疾而終。其旗下巴克萊投資管理公司(BGI)資管規模巨大,管理著約1.5萬億美元資產,這已經遠遠超美國黑石。
除了老派的做法,金融創新業從未停止。除了共同基金(Mutual Funds),英國還有一家新興對沖基金公司(Hedge Funds),打理著約200億美元資產:。
對沖基金,以其兇猛,冒險的風格,在市場里迅速翻騰,通過其強悍的收益在市場里迅速積累了迷妹迷弟,風光無兩。
其他較小規模的銀行保險投資機構,比如如渣打(Standard Charter)等,便不再一一細說。雖然英國經濟在金融投資上一路高歌,但投資沒有服務實體經濟,龐大的消費導致英國工業陷入高成本困境,但是隨著半導體技術發展,英國避開製造短板,在設計業方面出現了新轉機。
7. 南部小矽谷:布里斯托鎮
這是一個十分緊湊和優美的城市,整個城市圍繞布里斯託大學展開。從火車站(Temple Meads)下來, 過了河,迎面是KMPG大樓,掠過綠地,大教堂,總共約莫30分鍾便來到了布里斯託大學。這里除了享譽的精算科學(actuarial science),還是一個有著工業基礎,歷史悠久的科研密集型大學。一戰後航空工業,半導體產業紛紛遷入布里斯托,為布里斯託大學注入新生機:
* 勞斯萊斯控股在當地擁有約5000名員工,以及超過75年的發動機生產歷史
* 1980年位於布里斯托的Inmos創新地提出了一種近存晶元,用於並行計算技術:這種晶元有自己獨立的片上存儲。這一發明極大地影響了後世的晶元設計。意法半導體隨後收購了這家公司,主要設計家用視頻產品專用晶元。
2011年英偉達收購了Bristol當地的一家手機基帶晶元設計半導體企業Icera,於是便有了在Bristol一家辦公樓:
由於Inomos,Icera在手機基帶晶元設計領域的影響, 2014年huawei在布里斯托啟動了設計研發(R&D)中心:
8. 大器晚成:手機和伺服器晶元新霸主ARM
在個人電腦興起前,整個電腦市場由大型機,微形機霸主IBM統治,隨著蘋果 帶起個人PC風標,Curry and Hauser 在劍橋創立了劍橋處理器有限責任公司 (Cambridge Processor Unit Ltd., CPU)後,於1978年啟用了Acorn Computers品牌正式開展個人電腦業務, 形成了ARM (Acorn RISC Machine)的前身。
個人電腦業務不斷發展,IBM在大型機上製造CPU的技術,開始以更低成本被引入到個人電腦。蘋果Lisa的成功同時讓Acorn工程師覺得,通過現有晶元開發窗口圖形操作系統,並不是那麼容易。於是,一個大膽的計劃誕生了:
受到Berkerly RISC V項目啟示,他們開始著手設計新的晶元架構。
ARM在成功開發後,馬上就被用到Apple 2系統,從此ARM搭上了蘋果的順風車,在隨後的IPhone系列,大展拳腳。
隨著蘋果和ARM聯合開發的推進,ARM架構所展示的低功耗優勢愈加明顯,不僅僅是在手機市場取得了壓倒性的成功,在伺服器市場也開始占據一定份額。和Intel有自己fab工廠不一樣,ARM晶元生產得益於全球化生產體系,隨著台灣半導體在工藝上取得大幅領先,Fabless逐漸取得優勢,ARM彷彿如天選之子,又像直勾垂釣的老者,逐漸掌控局勢。
9. Imagination Technology : 起源英國落花中國的GPU IP
1993春,Jensen Huang(老黃)穿著皮大衣離開了起源於仙童的LSI ,相比於在AMD短暫2年,老黃在這個中國人並不熟悉的公司里,真正掌控制了ASIC設計。帶著新願景,他和合夥人隨後創立了NVIDIA,也帶來了NVIDIA新經濟學,一路裂變:
The more you buy, the more you save
但是就在老黃下定決心的8年前,英國就已經有一家叫做Imagination的公司嗅到了圖形處理器機會。這是一家真正的起源英倫,卻花開中國的GPU設計公司,多少年後,為中國GPU崛起立下汗馬功勞,中國GPU公司無一例外採用了Imagination的GPU電路板IP授權,開始自主研發之路。
在蘋果一路崛起的道路上,有兩家英國公司參與了進來,一個是ARM,另一個就是Imigination。和ARM一樣,Imigniation也留下了豐厚的遺產,MIPS架構CPU和GPU ASIC電路板設計。
在Fabless模式下,每天都有從英國發訂單到台灣進行生產,通過航運將產品運送到英國本土進行最後的測試,軟體適配和調校。
中國正式重啟絲綢之路,歐洲列車直達連雲港前,一個世紀里,遠洋運輸仍然是大宗商品的主要運輸通道。在東亞,中東的石油通過天險馬六甲海峽在新加坡卸貨,通過當地離島,石油工業工程完成石油煉化加工,分發到東亞國際。而運往地中海的主要通過亞丁灣走蘇伊士運河。
10. 直布羅陀天險:北大西洋上永不沉沒的收費站
英國 資本主要在歐洲,北非和東南亞活動,自從開辟了蘇伊士運河,直布羅陀作為地中海的西出口,似乎沒有那麼重要了。但是西非,北歐,以及大西洋洲貿易仍然需要途徑英屬直布羅陀海峽。
事實上也由於前往西非的便利,英國投資銀行持續在非洲下注獲取必要的礦石原材料。原材料像養分,而海事就是活躍經濟的血液。
作為英國一個關鍵支柱產業,曾經容納了大量就業人口。但是隨著船舶噸位下降,大量水手移民,造船業和航運有所衰落。蘇伊士運河又進一步加劇了這種情況。
但憑借軟實力,倫敦港優越條件和配套完善的海事金融服務,大量英國居民開始從事海事經紀服務。最為代表的就是國際船舶協會IACS和英國勞氏(Lloyd's Register Group Limited)解決方案兩大機構:
11. 太陽花下的經濟血脈:
科技,文化,還有原材料組成了經濟。原材料順著大洋補充到英國經濟利益的各個方位。原材料,主要包括高純度礦石,石油,以及加工品。
由於澳大利亞和英國過於緊密的歷史關系,全球鐵礦石廠商力拓(Rio Tinto) 和必和必拓同時在倫敦和墨爾本上市,也同時建立實體。在相當長的時間,很多人都分不清這是一家澳洲公司還是一家英國公司。
其實在必和必拓創立之初,英國實體曾貢獻高達40%的收益,隨著英國影響力下降,英國實體貢獻逐步降低,2022年必和必拓正式從倫敦交易所退市,英澳實體分離。力拓同樣是英國,澳洲投資者聯合創立的公司。英國投資者在兩家公司上有非常深厚的利益。
在加工方面,殼牌石油由荷蘭皇家石油公司和英國殼牌石油合並而成,總部位於倫敦。殼牌擁有領先的潤滑油提煉技術。
除此之外,英國石油(British Petroleum),是世界六大石油公司之一。1908年一群英國地質學家在伊朗發現的一處油田,經伊朗同意,英國人開始開采當地的石油資源。這次地理發現導致了石油工業的發展,是中東第一次開採石油。隨後昂格魯-波斯(Anglo-Persian)石油公司正式成立,在1954年更稱現在這個名字。
12. Deep Mind : 人工智慧皇冠上的寶石
願景風投(Horizon Ventures,香港李嘉誠創辦),創始人基金(Founder Funds)以及個人投資者Elen Musk等參與到了Deep Mind的創建。
聖經典籍記載,神用希伯來語說要有光,於是就沒有了黑暗;接著抓起一把沙子,操著英語說,要有智慧,於是Deep Mind誕生了。
2010年哈薩比斯(Hassabis) 和 勒格(legg)在UCL相遇, 經過不為人知的討論,他們創立了一家初創公司(start up),隨後他們制定了DeepMind的主要方向 - 通用人工智慧。
2014 年 AlphaGo發布,16年擊敗李世石,登頂頭條,同年發布WaveNet,大模型首次解決TTS問題,語音助手精度大幅提升。
兩年後AlphaFold發布,問鼎CASP從此改變生物制葯格局。DeepMind正在沿著通用智能的道路不斷探索邊界,孕育出新的智慧。
能源,發動機,設計支持著第一代汽車工業的發展,英國趕上了。一戰結束後一大波代表性企業在英倫三島雨後春筍般崛起。
二戰結束後,曼哈頓工程遺產開始軍轉民,個人PC興起,英國亦步亦趨,留下了ARM, MIPS, RISC V精簡指令集, 以及以SRAM著稱的Inmos設計。英國以彈丸之地緊追,並沒有走遠。
這些企業幾經波折,無論是專賣也好,還是重組,通過資本的廣泛參與,一方面分散了風險,一方面傳承了技術和品牌為下一個十年不斷蓄力。
時至今日大模型智能日新月異,DeepMind與OpenAI花開兩朵,中國的大模型在哪裡?
