當前位置:首頁 » 操作系統 » linuxocr

linuxocr

發布時間: 2022-11-14 19:43:39

❶ 如何在linux中安裝Ocrale資料庫

網上有很多教程,網路裡面有安裝文檔。找對版本就行

❷ OCR文字識別軟體哪個易用可網上下載

OCR文字識別軟體 Mini Ocr

xdowns.com/view_soft/3/7/OCRwenzishibieruanjian Mini Ocr.html



本軟體是飛濤軟體工作室開發的一款免費Ocr軟體,主要用於識別圖像文件之中,出現
的漢字顯示字體。Ocr的中文含意是光學字元識別。
為什麼叫Mini呢?因為現有的識別漢字的商業Ocr軟體,動輒二三十兆,而本軟體解
壓後,也不過三兆多,身材比較纖小,再加上本軟體主要用於識別字體比較小的漢字,所
以叫Mini,中文的發音是「迷你」,中文含義是超小型。

既然有了商業Ocr軟體,為什麼還要開發這個軟體?

不同於商業Ocr軟體,本軟體是免費的,可以自由使用。第二個不同之處,本軟體的
識別對象是屏幕出現的「顯示漢字」,而不是針對掃描儀掃出來的「列印漢字」。二者有什
么不同呢?最重要的一點: 掃描出來的列印漢字的高度和寬度一般都在30多個像素點之
上,這是我用畫圖軟體,打開某個商業Ocr的samples\sample1.tif,然後一點一點數出
來的。從文件名和目錄名的中文含意可以看出,這個點數應該是一個典型值。那麼,如果
用商業Ocr識別屏幕上出現的小五號字,漢字的高度是12個像素點,會出現什麼情況呢?
測試方法:用記事本隨便寫幾行漢字,設置字體為小五號字。這大概是看著還算舒服
的最小號的漢字字體了(高度是12個像素點),如果再小,字體就很難看了。然後,按拷
屏鍵PrtSc,把屏幕的圖像拷貝、粘貼到畫圖軟體中,修剪尺寸後,保存為bmp的格式。
然後,我找了兩個國內最著名的Ocr軟體進行測試,結果讓人大吃一驚,識別率幾乎為零。
把圖像放大兩倍,再測試,結果仍然很不理想,大概也只有百分之二三十的樣子。

開發Mini Ocr軟體的由來

我在開發護花使者反黃圖像識別軟體的時候,遇到有些圖像里,嵌有某些文字,如果能
把文字識別出來,圖像的含義就很容易讓計算機理解了。預算有限,我連掃描儀都捨不得
買,就更別想買商業Ocr的開發包了,大概幾十萬,或者更多,或者別人壓根就不賣。況且
它們的識別率對小字體幾乎為零,不符合我的要求。看來,只好自力更生,重新寫一個了。

開發Mini Ocr的歷程

經過三個多月的努力,終於誕生了這款Mini Ocr 軟體。第1個月做出了漢字識別的
核心模塊,第2個月做出了文章段落切分的演算法,並加入了對英文,數字,標點的支持,
第三個月繼續調整英漢混排和漢字切分的演算法,並用MFC 做了一個界面。

Mini Ocr的軟體架構

為了讓更多的人能使用到這個軟體,我在windows系統下,採用VC進行編程,界面當
然只好用MFC寫了。軟體架構是一個SDI框架下的多窗口切分界面,左上角的窗口是一個
CFormView,用來顯示常用的按鈕;左下角是一個CEditView,用來顯示幫助信息;右上角
是一個CView,用來顯示要識別的圖像;右下角是一個CEditView,用來存放識別出來的文
字。識別部分採用了工作者線程,以避免顯示界面的主線程僵掉。識別部分是整個軟體的
核心,與操作系統無關,可以單獨摘出來放在dos窗口裡跑,也可以移植到Linux系統中跑。

漢字識別軟體的難點所在:

英文識別有一些開放源碼的軟體,我看過的軟體,主要採取兩種識別方法:基於規則
的方法,和採用神經網路方法。而這兩種方法,在識別漢字時,都不宜採用。因為漢字數
目眾多,最常用的國標2312的一級漢字就有3755個。如果借用基於規則的方法,需要對
三千多個漢字,逐一人工寫出分類規則,工作量太大,我一個人無法完成;如果採用神經
網路的方法,這么多漢字,我不敢想像,需要多少層網路和神經節點呀!如果採用網格法,
抗位移的效果太差;而採用不變矩法,識別人和入,土和士,相似度又難於控制。除此之
外,漢字切分也是一大難題。英文寬度大概只有漢字一半,標點符號大概只有漢字三分之
一寬,數字大概只有四分之一的寬度。而漢字本身又有二分字,和三分字。某些字,如「啊」,
字體小時可能是獨體字,字體大些,變為二分字,字體再大,又變為三分字。加上漢字與
漢字之間的粘連、漢字與英文的混排,英文與英文的粘連,造成漢字切分模塊的演算法,甚
至比漢字識別模塊的演算法還要復雜得多。為了克服這些難點,並加快識別速度,我在演算法
設計時,採用了一些優化和簡化的策略。經過實踐檢驗,證明行之有效。

Mini Ocr進行漢字識別的策略:
1) 採用復合特徵的分類方法。
2) 字元集選擇3755個一級漢字。
3) 字體選擇最常用的宋體。
4) 字型大小選擇從小五號到一號漢字,主要針對20個點之內的小字體。
5) 英漢混排時,漢語優先。
6) 漢字粘連時,進行動態優化切分。

展望與下一步的開發計劃:
1) 重新優化英文識別的演算法;
2) 對英文粘連的切分演算法進行調整;
3) 移植進入Linux;

選擇Ocr軟體的建議:

如果您選擇Ocr軟體,目的是用來識別掃描儀出來列印字體,推薦還是選用知名的商業Ocr。
如果您要識別屏幕上顯示的漢字,Mini Ocr是一個比較不錯的選擇。真誠地希望您在使用
中,能喜歡上它

❸ linux oracle10G 頻頻掉線

存儲的設備掉了吧?

❹ 我們公司想做門禁考勤系統,要做那種離線的,有人知道哪裡可以下載人臉識別離線的sdk嗎linux的

雲脈OCR SDK開發者平台支持下載離線人臉識別SDK,可以先接入人臉識別api 使用下,支持個各種系統,不過門禁考勤系統如果想有人臉識別功能可以直接安裝雲脈人臉識別門禁考勤系統,無感考勤不用可以配合就可以識別員工進出

❺ linux如何設置密碼規則

准備工作:

安裝 PAM 的 cracklib 模塊,cracklib 能提供額外的密碼檢查能力。

Debian、Ubuntu 或 Linux Mint 系統上:

$ sudo apt-get install libpam-cracklib

CentOS、Fedora、RHEL 系統已經默認安裝了 cracklib PAM 模塊,所以在這些系統上無需執行上面的操作。

為了強制實施密碼策略,我們需要修改 /etc/pam.d 目錄下的 PAM 配置文件。一旦修改,策略會馬上生效。

注意:此教程中的密碼策略只對非 root 用戶有效,對 root 用戶無效。

禁止使用舊密碼

找到同時有 「password」 和 「pam_unix.so」 欄位並且附加有 「remember=5」 的那行,它表示禁止使用最近用過的5個密碼(己使用過的密碼會被保存在 /etc/security/opasswd 下面)。

Debian、Ubuntu 或 Linux Mint 系統上:

$ sudo vi /etc/pam.d/common-password

❻ 關於linux下安裝tesseract-ocr的問題:進行./configure的時候,出現下圖結果,然後無法進行下一步。

c編譯環境有問題。。樓主如果不會弄,建議重新安裝操作系統,在安裝時一般的linux操作系統會提示你選擇安裝的相關的包,可以按照自己開發的需求選擇不同的開發包。

❼ 在linux中 要設置個密碼策略 讓用戶名和密碼不能一致

1、Linux對應的密碼策略模塊有:pam_passwdqc 和 pam_pwquality 。其中pam_passwdqc模塊對應的是/etc/login.defs,pam_pwquality對應的是/etc/security/pwquality.conf , 我記得默認就包含用戶名與密碼不能一致。linux設置密碼復雜程度

2、模塊的添加方法:/etc/pam.d/passwd



password required pam_pwquality.so retry=3

3、模塊的配置方法有兩種:

一、password required pam_pwquality.so dcredit=-1 ucredit=-1 ocredit=-1 lcredit=0

二、添加到/etc/security/pwquality.conf 中

4、/etc/security/pwquality.conf詳解:retry=N:定義登錄/修改密碼失敗時,可以重試的次數;Difok=N:定義新密碼中必須有幾個字元要與舊密碼不同。但是如果新密碼中有1/2以上的字元與舊密碼不同時,該新密碼將被接受;minlen=N:定義用戶密碼的最小長度;dcredit=N:定義用戶密碼中必須包含多少個數字;ucredit=N:定義用戶密碼中必須包含多少個大寫字母;lcredit=N:定義用戶密碼中必須包含多少個小些字母;ocredit=N:定義用戶密碼中必須包含多少個特殊字元(除數字、字母之外);其中 =-1表示,至少有一個5、/etc/login.defs詳解:PASS_MAX_DAYS 99999 #密碼的最大有效期, 99999:永久有期PASS_MIN_DAYS 0 #是否可修改密碼,0可修改,非0多少天後可修改PASS_MIN_LEN 5 #密碼最小長度,使用pam_cracklib mole,該參數不再有效PASS_WARN_AGE 7 #密碼失效前多少天在用戶登錄時通知用戶修改密碼6、實際生產環境配置/etc/security/pwquality.conf :minlen = 8minclass = 1maxrepeat = 0maxclassrepeat = 4lcredit = -1ucredit = -1dcredit = -1ocredit = -1difok=5/etc/login.defs:PASS_MAX_DAYS 90PASS_MIN_LEN 12PASS_MIN_DAYS 7PASS_WARN_AGE 30UMASK 077

一、password required pam_pwquality.so dcredit=-1 ucredit=-1 ocredit=-1 lcredit=0

二、添加到/etc/security/pwquality.conf 中

4、/etc/security/pwquality.conf詳解:

retry=N:定義登錄/修改密碼失敗時,可以重試的次數;

Difok=N:定義新密碼中必須有幾個字元要與舊密碼不同。但是如果新密碼中有1/2以上的字元與舊密碼不同時,該新密碼將被接受;

minlen=N:定義用戶密碼的最小長度;

dcredit=N:定義用戶密碼中必須包含多少個數字;

ucredit=N:定義用戶密碼中必須包含多少個大寫字母;

lcredit=N:定義用戶密碼中必須包含多少個小些字母;

ocredit=N:定義用戶密碼中必須包含多少個特殊字元(除數字、字母之外);

其中 =-1表示,至少有一個

5、/etc/login.defs詳解:

PASS_MAX_DAYS 99999 #密碼的最大有效期, 99999:永久有期


PASS_MIN_DAYS 0 #是否可修改密碼,0可修改,非0多少天後可修改


PASS_MIN_LEN 5 #密碼最小長度,使用pam_cracklib mole,該參數不再有效

PASS_WARN_AGE 7 #密碼失效前多少天在用戶登錄時通知用戶修改密碼

6、實際生產環境配置

/etc/security/pwquality.conf :

minlen = 8

minclass = 1

maxrepeat = 0

maxclassrepeat = 4

lcredit = -1

ucredit = -1

dcredit = -1

ocredit = -1

difok=5

/etc/login.defs:

PASS_MAX_DAYS 90

PASS_MIN_LEN 12

PASS_MIN_DAYS 7

PASS_WARN_AGE 30

UMASK 077

❽ 如何在 Linux 為系統用戶設置密碼復雜度策略

假設你已經在你的 Linux 系統上使用了 PAM (Pluggable Authentication Moles,插入式驗證模塊),因為這些年所有的 Linux 發行版都在使用它。 一、准備工作 安裝 PAM 的 cracklib 模塊,cracklib 能提供額外的密碼檢查能力。 Debian、Ubuntu 或 Linux Mint 系統上: 1 $ sudo apt-get install libpam-cracklib CentOS、Fedora、RHEL 系統已經默認安裝了 cracklib PAM 模塊,所以在這些系統上無需執行上面的操作。 為了強制實施密碼策略,我們需要修改 /etc/pam.d 目錄下的 PAM 配置文件。一旦修改,策略會馬上生效。 注意:此教程中的密碼策略只對非 root 用戶有效,對 root 用戶無效。 二、禁止使用舊密碼 找到同時有 「password」 和 「pam_unix.so」 欄位並且附加有 「remember=5」 的那行,它表示禁止使用最近用過的5個密碼(己使用過的密碼會被保存在 /etc/security/opasswd 下面)。 Debian、Ubuntu 或 Linux Mint 系統上: 1 2 $ sudo vi /etc/pam.d/common-password password [success=1 default=ignore] pam_unix.so obscure sha512 remember=5 CentOS、Fedora、RHEL 系統上: 1 2 $ sudo vi /etc/pam.d/system-auth password sufficient pamunix.so sha512 shadow nullok tryfirstpass useauthtok remember=5 三、設置最短密碼長度 找到同時有 「password」 和 「pam_cracklib.so」 欄位並且附加有 「minlen=10」 的那行,它表示最小密碼長度為(10 - 類型數量)。這里的 「類型數量」 表示不同的字元類型數量。PAM 提供4種類型符號作為密碼(大寫字母、小寫字母、數字和標點符號)。如果你的密碼同時用上了這4種類型的符號,並且你的 minlen 設為10,那麼最短的密碼長度允許是6個字元。 Debian、Ubuntu 或 Linux Mint 系統上: 1 2 $ sudo vi /etc/pam.d/common-password password requisite pam_cracklib.so retry=3 minlen=10 difok=3 CentOS、Fedora、RHEL 系統上: 1 2 $ sudo vi /etc/pam.d/system-auth password requisite pam_cracklib.so retry=3 difok=3 minlen=10 四、設置密碼復雜度 找到同時有 「password」 和 「pam_cracklib.so」 欄位並且附加有 「ucredit=-1 lcredit=-2 dcredit=-1 ocredit=-1」 的那行,它表示密碼必須至少包含一個大寫字母(ucredit),兩個小寫字母(lcredit),一個數字(dcredit)和一個標點符號(ocredit)。 Debian、Ubuntu 或 Linux Mint 系統上: 1 2 $ sudo vi /etc/pam.d/common-password password requisite pam_cracklib.so retry=3 minlen=10 difok=3 ucredit=-1 lcredit=-2 dcredit=-1 ocredit=-1 CentOS、Fedora、RHEL 系統上: 1 2 $ sudo vi /etc/pam.d/system-auth password requisite pam_cracklib.so retry=3 difok=3 minlen=10 ucredit=-1 lcredit=-2 dcredit=-1 ocredit=-1 五、設置密碼過期期限 編輯 /etc/login.defs 文件,可以設置當前密碼的有效期限,具體變數如下所示: 1 2 $ sudo vi /etc/login.defs PASSMAXDAYS 150 PASSMINDAYS 0 PASSWARNAGE 7 這些設置要求用戶每6個月改變他們的密碼,並且會提前7天提醒用戶密碼快到期了。 如果你想為每個用戶設置不同的密碼期限,使用 chage 命令。下面的命令可以查看某個用戶的密碼限期: $ sudo chage -l xmolo Last password change : Dec 30, 2013 Password expires : never Password inactive : never Account expires : never Minimum number of days between password change : 0 Maximum number of days between password change : 99999 Number of days of warning before password expires : 7 默認情況下,用戶的密碼永不過期。 下面的命令用於修改 xmolo 用戶的密碼期限: 1 $ sudo chage -E 6/30/2014 -m 5 -M 90 -I 30 -W 14 xmolo 上面的命令將密碼期限設為2014年6月3日。另外,修改密碼的最短周期為5天,最長周期為90天。密碼過期前14天會發送消息提醒用戶,過期後帳號會被鎖住30天。

熱點內容
安卓和csharp哪個發展好 發布:2024-05-18 18:09:30 瀏覽:526
換編程題庫 發布:2024-05-18 18:00:58 瀏覽:562
如何使用伺服器ip直連網站 發布:2024-05-18 18:00:49 瀏覽:432
三星n7100哪個安卓版本好用 發布:2024-05-18 17:55:41 瀏覽:489
萬國覺醒採集腳本源碼 發布:2024-05-18 17:55:39 瀏覽:947
sqlserver加欄位 發布:2024-05-18 17:54:53 瀏覽:928
安卓手機如何清除應用記錄 發布:2024-05-18 17:31:37 瀏覽:639
查看存儲過程許可權 發布:2024-05-18 17:18:33 瀏覽:192
php類self 發布:2024-05-18 17:15:03 瀏覽:895
手機2b2t的伺服器地址是多少 發布:2024-05-18 17:14:56 瀏覽:189