linuxfault
Ⅰ linux出現segment fault怎麼解決
linux
系統下面出現:segment
fault(段錯誤)提示信息,有時候是由於你悉此自己在編寫程序的過程中,有數組越界、或者是內存泄漏(例如:
引用了空指針)等原因造成睜稿迅的。具體是敬旦哪一種情況,就需要自己仔細查看自己編寫的源程序,到底哪裡有程序漏洞。
Ⅱ linux 出現segment fault怎麼解決
Linux 系統下面出現:Segment fault(段錯誤)提示信息,有時候是由於你自己在編寫程序的過程中,有數組越燃讓界、或者是內存泄漏(例如: 引用了空指針)等原因造成的。具體是哪一種情況,就肢神需要自己仔細查看自己編歷段虧寫的源程序,到底哪裡有程序漏洞。
Ⅲ linux 出現 segment fault怎麼解決
1. 段錯誤是什麼如凳
一句話來說,段錯誤是指訪問的內存超出了系統給這個程序所設定的內存空間,例如訪問了不存在的內存地址、訪問了系統保護的內存地址、訪問了只讀的渣答旅內存地址等等情況。這里貼一個對於「段錯誤」的准確定義(參考Answers.com):
A segmentation fault (often shortened to segfault) is a particular error condition that can occur ring the operation of computer software. In short, a segmentation fault occurs when a program attempts to access a memory location that it is not allowed to access, or attempts to access a memory location in a way that is not allowed (e.g., attempts to write to a read-only location, or to overwrite part of the operating system). Systems based on processors like the Motorola 68000 tend to refer to these events as Address or Bus errors.
Segmentation is one approach to memory management and protection in the operating system. It has been superseded by paging for most purposes, but much of the terminology of segmentation is still used, "segmentation fault" being an example. Some operating systems still have segmentation at some logical level although paging is used as the main memory management policy.
On Unix-like operating systems, a process that accesses invalid memory receives the SIGSEGV signal. On Microsoft Windows, a process that accesses invalid memory receives the STATUS_ACCESS_VIOLATION exception.
2. 段錯誤產生的原因
2.1 訪問不存在的內存地址
#include<stdio.h>
#include<stdlib.h>
void main()
{
int *ptr = NULL;
*ptr = 0;
}
2.2 訪問系統保護的內存地址
#include<stdio.h>
#include<stdlib.h>
void main()
{
int *ptr = (int *)0;
*ptr = 100;
}
2.3 訪問只讀的內存地址
#include<stdio.h>
#include<stdlib.h>舉缺
#include<string.h>
void main()
{
char *ptr = "test";
strcpy(ptr, "TEST");
}
2.4 棧溢出
#include<stdio.h>
#include<stdlib.h>
void main()
{
main();
}
等等其他原因。
3. 段錯誤信息的獲取
程序發生段錯誤時,提示信息很少,下面有幾種查看段錯誤的發生信息的途徑。
3.1 dmesg
dmesg可以在應用程序crash掉時,顯示內核中保存的相關信息。如下所示,通過dmesg命令可以查看發生段錯誤的程序名稱、引起段錯誤發生的內存地址、指令指針地址、堆棧指針地址、錯誤代碼、錯誤原因等。以程序2.3為例:
panfeng@ubuntu:~/segfault$ dmesg
[ 2329.479037] segfault3[2700]: segfault at 80484e0 ip 00d2906a sp bfbbec3c error 7 in libc-2.10.1.so[cb4000+13e000]
3.2 -g
使用gcc編譯程序的源碼時,加上-g參數,這樣可以使得生成的二進制文件中加入可以用於gdb調試的有用信息。以程序2.3為例:
panfeng@ubuntu:~/segfault$ gcc -g -o segfault3 segfault3.c
3.3 nm
使用nm命令列出二進制文件中的符號表,包括符號地址、符號類型、符號名等,這樣可以幫助定位在哪裡發生了段錯誤。以程序2.3為例:
panfeng@ubuntu:~/segfault$ nm segfault3
08049f20 d _DYNAMIC
08049ff4 d _GLOBAL_OFFSET_TABLE_
080484dc R _IO_stdin_used
w _Jv_RegisterClasses
08049f10 d __CTOR_END__
08049f0c d __CTOR_LIST__
08049f18 D __DTOR_END__
08049f14 d __DTOR_LIST__
080484ec r __FRAME_END__
08049f1c d __JCR_END__
08049f1c d __JCR_LIST__
0804a014 A __bss_start
0804a00c D __data_start
08048490 t __do_global_ctors_aux
08048360 t __do_global_dtors_aux
0804a010 D __dso_handle
w __gmon_start__
0804848a T __i686.get_pc_thunk.bx
08049f0c d __init_array_end
08049f0c d __init_array_start
08048420 T __libc_csu_fini
08048430 T __libc_csu_init
U __libc_start_main@@GLIBC_2.0
0804a014 A _edata
0804a01c A _end
080484bc T _fini
080484d8 R _fp_hw
080482bc T _init
08048330 T _start
0804a014 b completed.6990
0804a00c W data_start
0804a018 b dtor_idx.6992
080483c0 t frame_mmy
080483e4 T main
U memcpy@@GLIBC_2.0
3.4 ldd
使用ldd命令查看二進製程序的共享鏈接庫依賴,包括庫的名稱、起始地址,這樣可以確定段錯誤到底是發生在了自己的程序中還是依賴的共享庫中。以程序2.3為例:
panfeng@ubuntu:~/segfault$ ldd ./segfault3
linux-gate.so.1 => (0x00e08000)
libc.so.6 => /lib/tls/i686/cmov/libc.so.6 (0x00675000)
/lib/ld-linux.so.2 (0x00482000)
4. 段錯誤的調試方法
4.1 使用printf輸出信息
這個是看似最簡單但往往很多情況下十分有效的調試方式,也許可以說是程序員用的最多的調試方式。簡單來說,就是在程序的重要代碼附近加上像printf這類輸出信息,這樣可以跟蹤並列印出段錯誤在代碼中可能出現的位置。
為了方便使用這種方法,可以使用條件編譯指令#ifdef DEBUG和#endif把printf函數包起來。這樣在程序編譯時,如果加上-DDEBUG參數就能查看調試信息;否則不加該參數就不會顯示調試信息。
4.2 使用gcc和gdb
4.2.1 調試步驟
1、為了能夠使用gdb調試程序,在編譯階段加上-g參數,以程序2.3為例:
panfeng@ubuntu:~/segfault$ gcc -g -o segfault3 segfault3.c
2、使用gdb命令調試程序:
panfeng@ubuntu:~/segfault$ gdb ./segfault3
GNU gdb (GDB) 7.0-ubuntu
Copyright (C) 2009 Free Software Foundation, Inc.
License GPLv3+: GNU GPL version 3 or later <http://gnu.org/licenses/gpl.html>
This is free software: you are free to change and redistribute it.
There is NO WARRANTY, to the extent permitted by law. Type "show ing"
and "show warranty" for details.
This GDB was configured as "i486-linux-gnu".
For bug reporting instructions, please see:
<http://www.gnu.org/software/gdb/bugs/>...
Reading symbols from /home/panfeng/segfault/segfault3...done.
(gdb)
3、進入gdb後,運行程序:
(gdb) run
Starting program: /home/panfeng/segfault/segfault3
Program received signal SIGSEGV, Segmentation fault.
0x001a306a in memcpy () from /lib/tls/i686/cmov/libc.so.6
(gdb)
從輸出看出,程序2.3收到SIGSEGV信號,觸發段錯誤,並提示地址0x001a306a、調用memcpy報的錯,位於/lib/tls/i686/cmov/libc.so.6庫中。
4、完成調試後,輸入quit命令退出gdb:
(gdb) quit
A debugging session is active.
Inferior 1 [process 3207] will be killed.
Quit anyway? (y or n) y
4.2.2 適用場景
1、僅當能確定程序一定會發生段錯誤的情況下使用。
2、當程序的源碼可以獲得的情況下,使用-g參數編譯程序。
3、一般用於測試階段,生產環境下gdb會有副作用:使程序運行減慢,運行不夠穩定,等等。
4、即使在測試階段,如果程序過於復雜,gdb也不能處理。
4.3 使用core文件和gdb
在4.2節中提到段錯誤會觸發SIGSEGV信號,通過man 7 signal,可以看到SIGSEGV默認的handler會列印段錯誤出錯信息,並產生core文件,由此我們可以藉助於程序異常退出時生成的core文件中的調試信息,使用gdb工具來調試程序中的段錯誤。
4.3.1 調試步驟
1、在一些Linux版本下,默認是不產生core文件的,首先可以查看一下系統core文件的大小限制:
panfeng@ubuntu:~/segfault$ ulimit -c
0
2、可以看到默認設置情況下,本機Linux環境下發生段錯誤時不會自動生成core文件,下面設置下core文件的大小限制(單位為KB):
panfeng@ubuntu:~/segfault$ ulimit -c 1024
panfeng@ubuntu:~/segfault$ ulimit -c
1024
3、運行程序2.3,發生段錯誤生成core文件:
panfeng@ubuntu:~/segfault$ ./segfault3
段錯誤 (core mped)
4、載入core文件,使用gdb工具進行調試:
panfeng@ubuntu:~/segfault$ gdb ./segfault3 ./core
GNU gdb (GDB) 7.0-ubuntu
Copyright (C) 2009 Free Software Foundation, Inc.
License GPLv3+: GNU GPL version 3 or later <http://gnu.org/licenses/gpl.html>
This is free software: you are free to change and redistribute it.
There is NO WARRANTY, to the extent permitted by law. Type "show ing"
and "show warranty" for details.
This GDB was configured as "i486-linux-gnu".
For bug reporting instructions, please see:
<http://www.gnu.org/software/gdb/bugs/>...
Reading symbols from /home/panfeng/segfault/segfault3...done.
warning: Can't read pathname for load map: 輸入/輸出錯誤.
Reading symbols from /lib/tls/i686/cmov/libc.so.6...(no debugging symbols found)...done.
Loaded symbols for /lib/tls/i686/cmov/libc.so.6
Reading symbols from /lib/ld-linux.so.2...(no debugging symbols found)...done.
Loaded symbols for /lib/ld-linux.so.2
Core was generated by `./segfault3'.
Program terminated with signal 11, Segmentation fault.
#0 0x0018506a in memcpy () from /lib/tls/i686/cmov/libc.6
從輸出看出,同4.2.1中一樣的段錯誤信息。
5、完成調試後,輸入quit命令退出gdb:
(gdb) quit
4.3.2 適用場景
1、適合於在實際生成環境下調試程序的段錯誤(即在不用重新發生段錯誤的情況下重現段錯誤)。
2、當程序很復雜,core文件相當大時,該方法不可用。
4.4 使用objmp
4.4.1 調試步驟
1、使用dmesg命令,找到最近發生的段錯誤輸出信息:
panfeng@ubuntu:~/segfault$ dmesg
... ...
[17257.502808] segfault3[3320]: segfault at 80484e0 ip 0018506a sp bfc1cd6c error 7 in libc-2.10.1.so[110000+13e000]
其中,對我們接下來的調試過程有用的是發生段錯誤的地址:80484e0和指令指針地址:0018506a。
2、使用objmp生成二進制的相關信息,重定向到文件中:
panfeng@ubuntu:~/segfault$ objmp -d ./segfault3 > segfault3Dump
其中,生成的segfault3Dump文件中包含了二進制文件的segfault3的匯編代碼。
3、在segfault3Dump文件中查找發生段錯誤的地址:
panfeng@ubuntu:~/segfault$ grep -n -A 10 -B 10 "80484e0" ./segfault3Dump
121- 80483df: ff d0 call *%eax
122- 80483e1: c9 leave
123- 80483e2: c3 ret
124- 80483e3: 90 nop
125-
126-080483e4 <main>:
127- 80483e4: 55 push %ebp
128- 80483e5: 89 e5 mov %esp,%ebp
129- 80483e7: 83 e4 f0 and $0xfffffff0,%esp
130- 80483ea: 83 ec 20 sub $0x20,%esp
131: 80483ed: c7 44 24 1c e0 84 04 movl $0x80484e0,0x1c(%esp)
132- 80483f4: 08
133- 80483f5: b8 e5 84 04 08 mov $0x80484e5,%eax
134- 80483fa: c7 44 24 08 05 00 00 movl $0x5,0x8(%esp)
135- 8048401: 00
136- 8048402: 89 44 24 04 mov %eax,0x4(%esp)
137- 8048406: 8b 44 24 1c mov 0x1c(%esp),%eax
138- 804840a: 89 04 24 mov %eax,(%esp)
139- 804840d: e8 0a ff ff ff call 804831c <memcpy@plt>
140- 8048412: c9 leave
141- 8048413: c3 ret
通過對以上匯編代碼分析,得知段錯誤發生main函數,對應的匯編指令是movl $0x80484e0,0x1c(%esp),接下來打開程序的源碼,找到匯編指令對應的源碼,也就定位到段錯誤了。
4.4.2 適用場景
1、不需要-g參數編譯,不需要藉助於core文件,但需要有一定的匯編語言基礎。
2、如果使用了gcc編譯優化參數(-O1,-O2,-O3)的話,生成的匯編指令將會被優化,使得調試過程有些難度。
4.5 使用catchsegv
catchsegv命令專門用來撲獲段錯誤,它通過動態載入器(ld-linux.so)的預載入機制(PRELOAD)把一個事先寫好的庫(/lib/libSegFault.so)載入上,用於捕捉斷錯誤的出錯信息。
panfeng@ubuntu:~/segfault$ catchsegv ./segfault3
Segmentation fault (core mped)
*** Segmentation fault
Register mp:
EAX: 00000000 EBX: 00fb3ff4 ECX: 00000002 EDX: 00000000
ESI: 080484e5 EDI: 080484e0 EBP: bfb7ad38 ESP: bfb7ad0c
EIP: 00ee806a EFLAGS: 00010203
CS: 0073 DS: 007b ES: 007b FS: 0000 GS: 0033 SS: 007b
Trap: 0000000e Error: 00000007 OldMask: 00000000
ESP/signal: bfb7ad0c CR2: 080484e0
Backtrace:
/lib/libSegFault.so[0x3b606f]
??:0(??)[0xc76400]
/lib/tls/i686/cmov/libc.so.6(__libc_start_main+0xe6)[0xe89b56]
/build/buildd/eglibc-2.10.1/csu/../sysdeps/i386/elf/start.S:122(_start)[0x8048351]
Memory map:
Ⅳ Linux下出現Segmentation fault (core mped)
是不是薯嫌dict.txt文件輪謹有問臘手基題?
Ⅳ Linux C++:Segmentation fault 問題
SegmentationFault這樣的提示通常出現在linux機器上,估計你們的伺服器就是(絕絕絕大多數如消都是),一般來說當函數庫發現空指針,就會發出這樣的錯誤消息來。看起來是你在某個步驟內存分配失敗(你手頭的都是小數據,這種情況概率很低,所以才碰渣燃知不上)。你可以檢查每次分配是否成功,當發現失敗,在製造一個純粹的WA,程序退出。如此即可判斷是否為段模分配失敗導致。另外演算法注意不要過分消耗棧空間
Ⅵ linux segmentation fault怎麼解決
段錯誤是嚴重問題,並耐飢解決辦法只能是要麼找人重新閱讀源代碼找到演算法錯誤(指針操作出錯導絕返致的居多,這種錯誤編譯器是檢查不出來的,只能靠人肉)。
要麼就畝喚是用 gdb 跟蹤找錯誤點。
Ⅶ Linux環境下運行.cpp文件出現Segmentation Fault錯誤
段錯誤可以主要關昌唯嘩注
指針初始化問題
訪問未知內存或者數耐行組越界導致
可以增加調試日誌排查山衡
Ⅷ Linux下出現Segmentation fault (core mped)
是蠢跡滾帶余不州跡是dict.txt文件有問題?
Ⅸ Linux內存,PageFault與SwapOut
「內存並不一定總是快」
Linux 中內存主要有匿名內存和 Page Cache 兩種。
Linux操作系統內存管理策略是會盡可能的利用內存來做各種緩存,所以一般來說伺服器所謂的free內存都會較少,當應用alloc申請內存的時候,如果free內存不足就會引發內存回收,這就是所謂的PageFault缺頁,這時候系統會先使用非同步方式的後台回收來提高應用申請內存這個操作的響應速度。但是如果應用申請內存的速度大於系統後台回收的速度的話,就會進入所謂直接回收(Direct Reclaim)模式,這是一個同步的過程,應用會大搭友自旋等待內存回收完畢,產生比較大的延遲。見下圖:
另一方面,內核會回收匿名內存頁,並將其置換到磁碟里(這是Linux所謂虛擬內存的管理方式,磁碟上的這部分用來跟內存做交換的空間稱為swap空間),匿名內存頁一旦被換出然後再次被訪問的時候,就會產生文件IO了(要從swap空間里把頁載入回內存里),這也會導致滾槐比較大的延遲。見下圖:
vm.extra_free_kbytes 和 vm.swappiness 兩個內核參數可以針對PageFault和SwapOut兩種內存訪問延遲做調優。mlock 系統調用可以讓應用程序「鎖定」一塊內存空間而不被內核swap出去。
萬億級數據洪峰下的分布式消息引擎-InfoQ
後記:
這篇小文來自於學習RocketMQ開發團隊的技術分享文章(見參考),里邊的「內存沒那麼快」觀點筆者認為更確切說法應該是「內存並不總是那麼快」,里邊的Linux內存管理的一小段說明加深了筆者對之前了解的概念的理解,這些東西可能平時工作未必有什麼用,但了解底層的東西總是會讓人產生求知求所得的愉悅感受。看了阿里褚霸的個人背景簡介,「14年c開發經枝攔驗, 12年網路開發經驗, 3年Linux內核開發」,他也遇到過「底層 IO(Input/Output) 技術。IO 技術涉及面非常廣,驅動,塊設備,文件系統,內存關系等等」 ,做專家終歸是要走入底層,到最後考驗的是對系統、對計算機的理解。本文很水,而腳下這條路不知能走多遠,但是想想不為什麼就算只為求知的喜悅我也是願意走下去的啊。這也是我為什麼要建「系統底層」這個專題
Ⅹ linux出現initsocketfault
系統問題。linux是操作系統,其出現initsocketfault是系統問題,修復信首即芹芹可。Linux是一種自由和開放源代碼的類UNIX操作系統。該滑首數操作系統的內核由林納斯托瓦茲在1991年10月5日首次發布。