編譯器n

發布時間: 2022-04-22 23:20:50

『壹』編譯器中都有哪些演算法

詞法/語法分析、程序分析與程序變換、代碼生成、內存管理、虛擬機、函數式語言的實現與優化。。。每個話題都能出不止一本書。

用到的演算法/數據結構多如牛毛：

各種樹、圖為主，其他如棧、隊列、散列表、並查集。。。

貪心、回溯、動態規劃、遺傳演算法、矩陣變換。。

在一個問題下很難回答好。。先簡單介紹一下和圖相關的。

1. 和什麼圖打交道
CFG(Control Flow Graph)
控制流圖是對程序中分支跳轉關系的抽象，描述程序所有可能執行路徑

節點是語句集合（basic block)；

每個basic block有唯一入口和出口；

如果A到B有邊，表示A執行完後可能執行B

PDG(Program Dependence Graph)
PDG在編譯器中用得不多，常見於軟體工程/安全相關的應用（程序切片、安全信息流等）

SSA(Single Static Assignment)
SSA簡化了很多數據流分析問題。

其他圖
DJ Graph, Loop Nesting Forest, Program Structure Tree等等。

可參考：IR for Program Analysis。下面主要介紹CFG

2. CFG初步處理
CFG構造

dominator樹生成
在CFG中，如果A是B的dominator，則從程序入口執行到B的任意路徑一定經過A

控制依賴分析
根據dominator和post-dominator分析依賴關系。數據依賴、控制依賴信息在自動並行化中尤其重要（如果循環的每次迭代都沒有依賴，那麼可以並行處理）

控制流圖化簡
在復雜度相同的情況下，CFG的規模影響演算法的效果。如果一個CFG僅通過如下變換能化簡為一個節點，則它是可化簡的：

如果節點n有唯一的前驅，那麼將其和其前驅合並為一個節點

如果節點存在到自身的邊，那麼將該邊刪除
構造SSA
SSA可以由CFG構造。

3. CFG與數據流分析
下面才進入主題。。
一般的文獻介紹DFA（Data flow analysis），都會用幾個基礎的分析為例：Constant Propagation，Range propagation，Avaliable expressions，Reaching Definition。而Reaching Definition的一個應用，就是大家喜聞樂見的「跳轉到定義處」（真要做到「智能」跳轉並不簡單）

這部分涉及東西較多，一些演算法也和」圖「並不直接相關，不再展開。

PS，很多DFA問題可以用graph reachability統一建模，強烈推薦此文：
Program analysis via graph reachability

『貳』編譯器本身是如何進行測試的

編譯器最重要的性質就是保證語義的正確。比如，從高級語言翻譯到機器指令之後，指令必須正確的表達原來程序的意思。所以一般編譯器測試都包含一些源程序，用來覆蓋可能出現的各種情況。基本的原則是：原來程序的結果 = 編譯後機器指令運行的結果。機器指令運行的結果很容易知道，運行一下就知道了。可是原來程序的結果你怎麼知道呢？
為了解決這個「原來程序語義」的問題，最好是寫一個解釋器，准確無誤的表達原來的代碼的語義。所以我們的要求就是：
高級語言解釋器（源程序） = 機器執行（機器代碼）
由於處理器其實就是一個用來執行機器代碼的解釋器，這里有一個很美好的對稱關系：
interp1(L1) = interp2(L2)
另外還有一個問題，就是編譯器一般需要經過多個轉化步驟（叫做 pass）才能最後編譯為機器指令。比如，
L2 = pass1(source)
L3 = pass2(L2)
L4 = pass3(L3)
Ln = passN(Ln-1)
machine_code = codegen(Ln)
由於源程序經過了很多步驟猜得到最後的機器指令，如果你使用上面的公式，就會出現以下一些情況：
1. 知道結果錯了，但是卻不知道到底是哪一個 pass 錯了。
2. 結果沒有錯，但是中間卻有 pass 實際上是錯的。但是由於之前的 pass 把輸入程序的一些結構給「優化」掉了，所以錯的那個 pass 其實沒能得到觸發錯誤的那個數據結構。所以測試沒能發現錯誤。如果以後前面的那個 pass 被修改，錯誤就會暴露出來。這是非常難以發現的潛伏的危險。
為了防止這些情況出現，一些編譯器（比如 Chez Scheme 和 Kent Dybvig 的課程編譯器）使用了對每一個 pass 進行測試的做法。具體的方法就是為每一個中間語言都寫一個解釋器，把這語言的語義完全的表示出來。這樣我們就需要檢查一組等式：
L2 = pass1(source)
高級語言編譯器（源程序） = interp2(L2) // 測試 pass1 的正確性
L3 = pass2(L2)
interp2(L2) = interp3(L3) // 測試 pass2 的正確性
這樣一來我們就能獨立的判斷每一個 pass 的正確性了。
這些是基本的語義測試原理。另外除了語義，可能還有一些「表面」一些的測試，它們看代碼本身，而不只看它的語義。比如尾遞歸優化的測試應該確保輸出程序的尾遞歸得到正確的處理，等等。這些是語義測試檢查不到的，因為尾遞歸沒有正確處理的程序大部分也能輸出正確的結果。
普通的單元測試方法也可以用來測試一些編譯器里的輔助函數，但那些不是編譯器特有的，所以就不講了。
另外，就像所有測試的局限性一樣，你沒法枚舉所有可能出現的輸入，所以以上的測試方法其實也不能保證編譯器的完全正確。

『叄』編譯器Dev_C++5.11中新建單元[n]的作用

已經安裝了gcc的編譯器了，並且有默認的包含路徑（編譯，連接需要的lib和include等），但是你可能已經卸載了原來的版本，所以路徑找不到了。如果你現在正在安裝的不僅僅只是一個編譯器，而是一個完整的dev的話，直接點Yes吧。
如果只是一個編譯器，那麼重新下一個完整版的吧，因為你的編譯依賴文件可能也已經被你卸載掉了。

『肆』 C++編譯器哪個比較好

編譯器有很多，但是比較好用的還是microsoft visual c++ 。

具體如下：

1、簡介

Microsoft Visual C++是Microsoft公司推出的開發Win32環境程序，面向對象的可視化集成編程系統。

2、特點

它不但具有程序框架自動生成、靈活方便的類管理、代碼編寫和界面設計集成交互操作、可開發多種程序等優點，而且通過簡單的設置就可使其生成的程序框架支持資料庫介面、OLE2，WinSock網路、3D控制界面。它以擁有「語法高亮」，IntelliSense（自動編譯功能）以及高級除錯功能而著稱。比如，它允許用戶進行遠程調試，單步執行等。

3、編譯

允許用戶在調試期間重新編譯被修改的代碼，而不必重新啟動正在調試的程序。其編譯及建置系統以預編譯頭文件、最小重建功能及累加連結著稱。這些特徵明顯縮短程式編輯、編譯及連結的時間花費，在大型軟體計劃上尤其顯著。

『伍』為什麼有的編譯器支持cin>>n;int a[n];有的不可以

這是動態分配數組大小，有的編譯器支持有的不支持。
通用的話是
cin >> n;
int* a = (int*)malloc(n*sizeof(int));

最後用過後要釋放 free(a)

『陸』怎麼告訴編譯器我要輸入n個數

int n;
cin>>n;
for(int i=0;i<n;i++){
int x=0;
cin>>x;
}

『柒』什麼是GCC編譯器

Linux系統下的Gcc（GNU C Compiler）是GNU推出的功能強大、性能優越的多平台編譯器，是GNU的代表作品之一。gcc是可以在多種硬體平台上編譯出可執行程序的超級編譯器，其執行效率與一般的編譯器相比平均效率要高20%~30%。
Gcc編譯器能將C、C++語言源程序、匯程式化序和目標程序編譯、連接成可執行文件，如果沒有給出可執行文件的名字，gcc將生成一個名為a.out的文件。在Linux系統中，可執行文件沒有統一的後綴，系統從文件的屬性來區分可執行文件和不可執行文件。而gcc則通過後綴來區別輸入文件的類別，下面我們來介紹gcc所遵循的部分約定規則。
.c為後綴的文件，C語言源代碼文件；
.a為後綴的文件，是由目標文件構成的檔案庫文件；
.C，.cc或.cxx 為後綴的文件，是C++源代碼文件；
.h為後綴的文件，是程序所包含的頭文件；
.i 為後綴的文件，是已經預處理過的C源代碼文件；
.ii為後綴的文件，是已經預處理過的C++源代碼文件；
.m為後綴的文件，是Objective-C源代碼文件；
.o為後綴的文件，是編譯後的目標文件；
.s為後綴的文件，是匯編語言源代碼文件；
.S為後綴的文件，是經過預編譯的匯編語言源代碼文件。
Gcc的執行過程
雖然我們稱Gcc是C語言的編譯器，但使用gcc由C語言源代碼文件生成可執行文件的過程不僅僅是編譯的過程，而是要經歷四個相互關聯的步驟∶預處理(也稱預編譯，Preprocessing)、編譯(Compilation)、匯編(Assembly)和連接(Linking)。
命令gcc首先調用cpp進行預處理，在預處理過程中，對源代碼文件中的文件包含(include)、預編譯語句(如宏定義define等)進行分析。接著調用cc1進行編譯，這個階段根據輸入文件生成以.o為後綴的目標文件。匯編過程是針對匯編語言的步驟，調用as進行工作，一般來講，.S為後綴的匯編語言源代碼文件和匯編、.s為後綴的匯編語言文件經過預編譯和匯編之後都生成以.o為後綴的目標文件。當所有的目標文件都生成之後，gcc就調用ld來完成最後的關鍵性工作，這個階段就是連接。在連接階段，所有的目標文件被安排在可執行程序中的恰當的位置，同時，該程序所調用到的庫函數也從各自所在的檔案庫中連到合適的地方。

Gcc的基本用法和選項
在使用Gcc編譯器的時候，我們必須給出一系列必要的調用參數和文件名稱。Gcc編譯器的調用參數大約有100多個，其中多數參數我們可能根本就用不到，這里只介紹其中最基本、最常用的參數。
Gcc最基本的用法是∶gcc [options] [filenames]
其中options就是編譯器所需要的參數，filenames給出相關的文件名稱。
-c，只編譯，不連接成為可執行文件，編譯器只是由輸入的.c等源代碼文件生成.o為後綴的目標文件，通常用於編譯不包含主程序的子程序文件。
-o output_filename，確定輸出文件的名稱為output_filename，同時這個名稱不能和源文件同名。如果不給出這個選項，gcc就給出預設的可執行文件a.out。
-g，產生符號調試工具(GNU的gdb)所必要的符號資訊，要想對源代碼進行調試，我們就必須加入這個選項。
-O，對程序進行優化編譯、連接，採用這個選項，整個源代碼會在編譯、連接過程中進行優化處理，這樣產生的可執行文件的執行效率可以提高，但是，編譯、連接的速度就相應地要慢一些。
-O2，比-O更好的優化編譯、連接，當然整個編譯、連接過程會更慢。
-Idirname，將dirname所指出的目錄加入到程序頭文件目錄列表中，是在預編譯過程中使用的參數。C程序中的頭文件包含兩種情況∶
A)#include
B)#include 「myinc.h」
其中，A類使用尖括弧(< >)，B類使用雙引號(「」)。對於A類，預處理程序cpp在系統預設包含文件目錄(如/usr/include)中搜尋相應的文件，而對於B類，cpp在當前目錄中搜尋頭文件，這個選項的作用是告訴cpp，如果在當前目錄中沒有找到需要的文件，就到指定的dirname目錄中去尋找。在程序設計中，如果我們需要的這種包含文件分別分布在不同的目錄中，就需要逐個使用-I選項給出搜索路徑。
-Ldirname，將dirname所指出的目錄加入到程序函數檔案庫文件的目錄列表中，是在連接過程中使用的參數。在預設狀態下，連接程序ld在系統的預設路徑中(如/usr/lib)尋找所需要的檔案庫文件，這個選項告訴連接程序，首先到-L指定的目錄中去尋找，然後到系統預設路徑中尋找，如果函數庫存放在多個目錄下，就需要依次使用這個選項，給出相應的存放目錄。
-lname，在連接時，裝載名字為「libname.a」的函數庫，該函數庫位於系統預設的目錄或者由-L選項確定的目錄下。例如，-lm表示連接名為「libm.a」的數學函數庫。
上面我們簡要介紹了gcc編譯器最常用的功能和主要參數選項，更為詳盡的資料可以參看Linux系統的聯機幫助。
假定我們有一個程序名為test.c的C語言源代碼文件，要生成一個可執行文件，最簡單的辦法就是∶
gcc test.c
這時，預編譯、編譯連接一次完成，生成一個系統預設的名為a.out的可執行文件，對於稍為復雜的情況，比如有多個源代碼文件、需要連接檔案庫或者有其他比較特別的要求，就要給定適當的調用選項參數。再看一個簡單的例子。
整個源代碼程序由兩個文件testmain.c 和testsub.c組成，程序中使用了系統提供的數學庫，同時希望給出的可執行文件為test，這時的編譯命令可以是∶
gcc testmain.c testsub.c □lm □o test
其中，-lm表示連接系統的數學庫libm.a。

Gcc的錯誤類型及對策
Gcc編譯器如果發現源程序中有錯誤，就無法繼續進行，也無法生成最終的可執行文件。為了便於修改，gcc給出錯誤資訊，我們必須對這些錯誤資訊逐個進行分析、處理，並修改相應的語言，才能保證源代碼的正確編譯連接。gcc給出的錯誤資訊一般可以分為四大類，下面我們分別討論其產生的原因和對策。

第一類∶C語法錯誤
錯誤資訊∶文件source.c中第n行有語法錯誤(syntex errror)。這種類型的錯誤，一般都是C語言的語法錯誤，應該仔細檢查源代碼文件中第n行及該行之前的程序，有時也需要對該文件所包含的頭文件進行檢查。有些情況下，一個很簡單的語法錯誤，gcc會給出一大堆錯誤，我們最主要的是要保持清醒的頭腦，不要被其嚇倒，必要的時候再參考一下C語言的基本教材。
第二類∶頭文件錯誤
錯誤資訊∶找不到頭文件head.h(Can not find include file head.h)。這類錯誤是源代碼文件中的包含頭文件有問題，可能的原因有頭文件名錯誤、指定的頭文件所在目錄名錯誤等，也可能是錯誤地使用了雙引號和尖括弧。

第三類∶檔案庫錯誤
錯誤資訊∶連接程序找不到所需的函數庫，例如∶
ld: -lm: No such file or directory
這類錯誤是與目標文件相連接的函數庫有錯誤，可能的原因是函數庫名錯誤、指定的函數庫所在目錄名稱錯誤等，檢查的方法是使用find命令在可能的目錄中尋找相應的函數庫名，確定檔案庫及目錄的名稱並修改程序中及編譯選項中的名稱。
第四類∶未定義符號
錯誤資訊∶有未定義的符號(Undefined symbol)。這類錯誤是在連接過程中出現的，可能有兩種原因∶一是使用者自己定義的函數或者全局變數所在源代碼文件，沒有被編譯、連接，或者乾脆還沒有定義，這需要使用者根據實際情況修改源程序，給出全局變數或者函數的定義體；二是未定義的符號是一個標準的庫函數，在源程序中使用了該庫函數，而連接過程中還沒有給定相應的函數庫的名稱，或者是該檔案庫的目錄名稱有問題，這時需要使用檔案庫維護命令ar檢查我們需要的庫函數到底位於哪一個函數庫中，確定之後，修改gcc連接選項中的-l和-L項。
排除編譯、連接過程中的錯誤，應該說這只是程序設計中最簡單、最基本的一個步驟，可以說只是開了個頭。這個過程中的錯誤，只是我們在使用C語言描述一個演算法中所產生的錯誤，是比較容易排除的。我們寫一個程序，到編譯、連接通過為止，應該說剛剛開始，程序在運行過程中所出現的問題，是演算法設計有問題，說得更玄點是對問題的認識和理解不夠，還需要更加深入地測試、調試和修改。一個程序，稍為復雜的程序，往往要經過多次的編譯、連接和測試、修改。下面我們學習的程序維護、調試工具和版本維護就是在程序調試、測試過程中使用的，用來解決調測階段所出現的問題。窗體頂端
窗體底端

閱讀全文

熱點內容

java返回this 發布：2025-10-20 08:28:16 瀏覽：1082

製作腳本網站發布：2025-10-20 08:17:34 瀏覽：1361

python中的init方法發布：2025-10-20 08:17:33 瀏覽：1046

圖案密碼什麼意思發布：2025-10-20 08:16:56 瀏覽：1222

怎麼清理微信視頻緩存發布：2025-10-20 08:12:37 瀏覽：1089

c語言編譯器怎麼看執行過程發布：2025-10-20 08:00:32 瀏覽：1440

郵箱如何填寫發信伺服器發布：2025-10-20 07:45:27 瀏覽：647

shell腳本入門案例發布：2025-10-20 07:44:45 瀏覽：544

怎麼上傳照片瀏覽上傳發布：2025-10-20 07:44:03 瀏覽：1218

python股票數據獲取發布：2025-10-20 07:39:44 瀏覽：1242

編譯器n

與編譯器n相關的資訊