筆畫輸入演算法
⑴ 手機上哪一種輸入法最好用
這次就以個人名義來談談最好的輸入法吧。我接觸的第一個輸入法是谷歌拼音輸入法,那時的谷歌拼音輸入法還很簡陋,我是指皮膚不支持自定義,默認皮膚還很醜、詞庫近乎全無、字母略粗,簡直難以忍受。
於是換了搜狗輸入法、網路輸入法、手心、觸寶等等,彈窗、配色不搭、功能冗雜、布局不合理等各種原因(搜狗輸入法是集大成者)讓我懷著絕望的情緒換回了谷歌拼音輸入法。
這樣的經歷在我用智能手機輸入法的頭四年裡反復出現了大概二三十次,終於去年,我恍然大悟,放下正在學習的五筆輸入法回歸谷歌拼音輸入法,我將這個過程稱為返樸歸真。
其實我只是想要一款簡潔的輸入法,雖然智能手機代替我們做了許多事,但是寫字這件事我還是要一點點自己來。慢慢打字可以讓我思考我在說什麼做什麼,以及使輸入法更了解我的使用習慣。無數次試驗後,谷歌輸入法的簡陋竟然是最合適的,就因為它簡陋,除了打字什麼都不會。
這么說似乎不是為谷歌拼音輸入法宣傳,倒像是貶低它不是十項全能,落後於主流輸入法。
在認真審視谷歌拼音輸入法後,我發現了一些驚喜,這些驚喜隱藏的太深了,一旦挖出來就會產生愛不釋手之感。基本的導入詞典,自定義詞典,emoji豐富,符號齊全,可換皮膚就不提了。
第一項依然是「劃行輸入」,劃行輸入幾乎每家輸入法都有,但是我敢說谷歌拼音輸入法是做的最好的一個,以至於我一字(母)一鍵用了這么多年穀歌拼音輸入法,谷歌拼音輸入法學習了我的使用習慣這么多年,隨便劃兩下的准確率依然秒殺之,不但秒殺我,還秒殺一眾跟隨者,操作方法就是隨便劃,整個過程的精確度簡直堪比讀心術,有一種潑墨揮毫的快感。
按鍵就像瑞士軍刀一樣全能是另一個驚喜。是的,不必切換鍵盤,可以打出有音調的拼音,數字、符號等等,所謂混輸就是這樣。在使用其他輸入法時按鍵功能就比較單一,在不同鍵盤間來回切換需要的學習成本不低。
第三個驚喜是單手模式,可以左右切換,大屏愛好者福音。筆者手指不算長,一直以來是谷歌拼音輸入法給了我使用6英寸屏幕的勇氣。調用單手模式也很簡單,點擊左上角箭頭即可,但我希望谷歌可以為單手模式配一個快捷鍵,比如長按空格鍵。
谷歌拼音輸入法某一次更新中,貿然刪掉了五筆和手寫兩個輸入版塊,粉絲們頓時原地爆炸,此事發生一段時間後谷歌拼音輸入法更新頻繁,漸漸變成現在簡單優雅、秀外慧中的樣子,不過有一點,它還是很沉默很聰明。
最好的輸入法不就是既聰明又安靜嗎?當然顏值高就再好不過了。
為谷歌拼音輸入法正名:現在的谷歌拼音輸入法詞庫很強大,日常使用不會影響輸入速度,聯想能力也不錯,自己導入詞庫更好,為了簡單優雅鍛煉動手能力是值得的。
其實對於我們這么多手機用戶來說,使用自己最適用的輸入法就是最好的輸入法,在這里我發現了三個不同的輸入方式,一、拼音輸入;二、語音輸入;三、那就是使用率最少的五筆了。其中對於拼音輸入法就我曾經使用過的輸入法當中手機上的我覺得谷歌的輸入法還不錯,主要是拼音糾錯的效率比較高;還有一個就是搜狗輸入法,搜狗使用的人群還是比較多的,自然而然,搜狗的詞庫這些非常方便,長期使用搜狗的還是可以堅持使用,畢竟還是它更懂你;而相對於語音輸入我還是推薦訊飛,我現在手機裡面有兩種輸入法,都擁有語音輸入包括曾經使用過的搜狗都擁有語音的輸入,而語音識別率最高的就是訊飛,平時在走路的過程中不習慣發語音的,推薦訊飛輸入法,畢竟是專做語音輸入的;三、對於習慣於五筆或希望嘗試學習五筆輸入的朋友,在下就只有推薦一種了,那就是網路輸入法,畢竟我在手機五筆輸入法裡面就只找到了它。其實每個人都有自己喜歡的輸入法,它和你的生活習慣息息相關,主要是適合自己的就是最好的。
輸入法是智能手機上最為常用的工具,輸入法的好壞決定著你打字的速度和聊天的速度。可以說好的高效的輸入法是手機使用效率的一大重要因素。我就來聊聊自己用的輸入法。
由於我用的手機是360手機,手機上自帶的輸入法是手心輸入法。剛開始用的還不是太喜歡,因為一直用搜狗輸入法,打字速度還可以,皮膚也比較豐富,打字的習慣一時間難以適應,設置也比較方便。所以用了一段時間的搜狗輸入法。可是突然我用了手心輸入法,感覺也還可以,還是有許多特點和優勢的。
首先,輸入法自帶表情。手心輸入法里的表情跟qq里的表情一樣,萌得可愛,表達感情無壓力。
其次,語音輸入辨識度較高。輸入法自帶語音輸入,而且只要你的普通話不是太離譜,它識別的還是可以的。這對你這文件,或者是回答問題很有用處,起碼節省時間咯。
再次,還有密文傳送。這個可能比較新穎,由於360是安全公司,做安全這方面的事還是挺靠譜的,如果你有東西不想被人看到,用密文傳送可以保護隱私哦。
最後,輸入法自帶計算機。有個題不會,算不準,直接用輸入法里的計算機就能計算,還不用再開計算機的軟體,省時省力,你值得擁有。
總之,手心輸入法還是不錯的,可能因為360手機的原因,起碼用起來占內存小,各種操作極為方便,你值得試試。。
補充:
評論里說訊飛的,確定沒有被老羅洗腦嗎。
我承認訊飛語音輸入法很牛逼,但是綜合來看,他的傳統輸入法的交互真心一般,用起來非常不順手,我確實用過一陣才這么說的,沒辦法習慣他們的邏輯,設置也不是很貼心。
不過我手機里確實裝了訊飛,也只會在不想打字記便簽的時候換成訊飛用一會,不會一直用。
所以我確實想說,不要盲目崇拜,一些產品好是好,但是一定要適合自己,如果你不會拼音,只會說話,那訊飛絕對是首選,但是如果你追求高效的打字速度,我認為無論搜狗還是網路,都可以在這方面秒殺。
最後,無論什麼輸入法,都有語音輸入的功能,准確性不比訊飛差。還是那句話,理性選擇適合自己的產品,不要盲目相信,盲目崇拜。
——————————————————————————————
以下為原答案:
我知道有很多人吐槽小米手機自帶的輸入法,可是我確實沒有覺得難用,反而這個系統自帶的輸入法很讓我喜歡。
被吐槽之後,小米立刻又和搜狗合作有了搜狗小米版輸入法,其實就是搜狗輸入法,但是和MIUI系統結合的更好了。
不過我還是喜歡網路給小米專門做的輸入法。(當然我已經說了小米自帶的都是很好用的,我只是更喜歡網路做的
喜歡網路小米輸入法的一大原因是可以用emoji表情。表情包簡直是人類溝通的又一大橋梁,可以說如果沒有表情的支撐,我和別人聊天,可能不到三句話就會徹底垮掉了。文字聊天的兩大弊端就是不能聽到對方的語氣,不能感受到對方在說話時的表情,沒有這兩個信息,很容易會錯他人的意圖,而有了表情包,特別是豐富的表情包,它能幫你節省很多交流的 情感 ,一個表情就能說通。
這也是我真正喜歡網路小米輸入法的一個原因。
你會說,其他的輸入法一樣能用emoji表情。
不,其他的輸入法能用是能用,但是emoji表情成百上千,非IOS系統的用戶能用的很少,而網路小米輸入法是目前我發現emoji表情在安卓手機上使用最全最新的。
展示一下:
很少一部分,還有一些動物食物的,我就不放了。
emoji表情經常更新,網路基本都會實時跟進,可以說這是熱愛表情的安卓用戶的首選輸入法了。
我用的最久的就是搜狗輸入法了。
先說說搜狗輸入法的優勢吧。我認為搜狗輸入法的鍵盤布局很符合我的使用習慣,各種功能鍵以及拼音鍵布局合理,除了前些日子有個反人類的語音鍵但是後來又修正了,沒有任何其他毛病。然後最開始還認為搜狗輸入法的皮膚很多,什麼類型的都有,很容易輕松下載到,雖然現在已經用最基本款了,但不得不承認開始也被這個因素吸引了。第三一點就是詞庫很完整,智能聯想以及雲功能都非常好用。
不足的地方也是比較明顯的,搜狗輸入法似乎一直跟其他app兼容性不是很好,不知道是不是我的個例,有時候在qq或者微信輸入的時候,輸入法總是崩潰要重新切換。還有一點就是現在搜狗輸入法的功能確實是越來越多了,但實際上能用得上的很少,功能一多佔用的運行內存也多了,估計這也是愛崩潰的原因之一吧,要是能有個簡化版的就好了。
搜狗吧,因為個人手機不一樣自帶的輸入法我就不說了、第三方軟體輸入法大大小小好幾十種但大都被幾個輸入法壟斷了市場比如搜狗網路訊飛等等,之前一直用的是搜狗個人感覺搜狗還不錯,就自定義的角度來說它的皮膚主題有好多種比如說你想讓鍵盤透明或者你想改變他的界面顏色可以隨意調整自己喜歡的顏色,或者你想要什麼樣主題的鍵盤你也可以在搜狗的主題庫搜索,比如說你玩英雄聯盟可以下載英雄聯盟的皮膚鍵盤,或者小清新,非主流亦或是大自然什麼的主題都ok,主要是讓你感受到很自由很隨意的feel,當然這是我兩年前用的搜狗體驗感覺,後來換蘋果了就用蘋果自帶的輸入法,不知道蘋果的商店有沒有搜狗,這個我還真沒有去看過,等我回答完就去看看有就下載一個還不錯的。其他的輸入法我也有用,就不一一介紹了,有意向的可以下載搜狗嘗試一下,不好再換其他的,當然我指的是手機端不是pc端,這是我用我以前手機截的圖
我們似乎每天都在與手機簡訊打交道,但在手機上寫中文簡訊不像在電腦上輸入漢字那樣容易。如果有幾種輸入法擺在你面前,你是不是很想知道選什麼輸入法寫簡訊最快捷?下面博士就來和大家一起探討一下究竟誰是現在最高效快捷的手機輸入法。
目前在手機輸入領域有三種最主流的手機輸入法:
一、T9智能輸入法
T9輸入法解決了小型掌上設備的文字輸入問題,已經成為全球手機文字輸入的標准之一。目前諾基亞、西門子、松下、飛利浦等公司均支持此種輸入法。 T9在輸入漢語拼音時,每個字母所在的按鍵只需按一次,T9內部程序就會按演算法自動組成合法的拼音。此外輸入一個字後,屏幕上會出現一些常見的與該字能組成片語的字,用戶直接選擇即可,無需再輸入拼音。
T9的中文輸入方式包括筆畫、拼音以及注音。使用頻率最高的除了拼音,就是筆畫輸入。用戶只需按照平時手寫漢字那樣,按順序輸入筆畫,T9會從內置的語言資料庫中選出相匹配的漢字。
二、字能輸入法
使用過早期愛立信手機的用戶十分熟悉這種輸入法,目前該輸入法主要被愛立信的早期機型、阿爾卡特以及一些國產手機所採用。在拼音的輸入方面,字能跟T9的方法幾乎一樣;而在筆畫的輸入上,字能則技高一籌。對於不大熟悉筆畫的用戶,字能輸入法可以使用筆畫詢問鍵來進行模糊輸入。看來在人性化方面,字能的表現要比T9輸入法更加出色。
三、iTAP輸入法
這款輸入法是摩托羅拉的獨家絕活。iTAP是在T9的基礎上發展起來的,在輸入的演算法方面也跟T9基本相似,不過在筆畫輸入上iTAP也有自己的特色--支持倒筆,當用戶在輸入過程中出現倒劃筆的現象,iTAP仍然能從字型檔中搜索到用戶所需要的漢字。
下面進入今天的正題,輸入法的易用程度取決於幾個條件:
1,筆畫的合理性;
2,重碼的多少;
3,聯想功能的強弱;
4,選字是否容易;
5,標點輸入是否便捷(標點是輸入法的一部分,也可以顯示出手機軟鍵的人性化程度)。
而評價一種輸入法,應該從該種輸入法能夠達到的最高水平來判斷,否則由於同一輸入法在不同手機平台上的差異(如T9),會使各種輸入法之間沒有可比性。
(一)筆畫分析
T9的筆畫輸入是5筆,所有的折都歸在同一個按鍵上,使用者可以無需考慮折的分類,學習速度較快。從按鍵速度來看T9無疑是速度最快的,而且由於它的按鍵可以集中在鍵盤上部,所以使用者可以更好地把持手機。
在字能輸入法中,折被分成4種筆畫:末筆是橫折(鉤)的,末筆是豎彎(鉤)的,末筆是折彎(鉤)的,還有「犭」的起筆(彎勾)。字能認為,所有沒有大的彎折的筆畫都可以歸為一類;如豎提歸為豎,點和捺歸為一類等等,這和T9是一致的。從中可以看出字能的思路是筆畫走向一致的分在同一類筆畫中。
而在iTap中,有9種筆畫:橫、豎、撇、捺、點、豎折、橫折、橫折折鉤、豎彎勾。其中捺從點中被分離出來,豎勾從豎中分離出來歸在橫折折鉤中;豎折和豎勾分離開來。可見iTAP的思路是末筆帶鉤的應和末筆是一直下去的分開。
以上是筆畫分離的特性,但我們不是專家,從筆畫上很難判斷那種輸入法更加合理,所以下面從另外幾個方面來綜合討論一下:
(二)輸入方式
在這里,字能憑借偏旁的輸入,使輸入漢字的步驟減少,並使重碼減少。譬如雨字頭,T9輸入是一丶?丨丶丶丶丶,共8筆。iTAP與T9相同,8筆。而字能只需輸入一丶就會出現雨字頭的偏旁,接下來只需選擇偏旁即可;算上按方向鍵和確定鍵的次數,也只需四筆。類似的--「隹」這類 緣氖淙耄 伎梢雜蒙儆赥9或iTAP的按鍵次數輸入進去,並且減少了重碼。
(三)詞句聯想
輸入法的聯想就不說了,似乎近來某些機型可以使常用字優先。iTAP這方面的情況不太清楚,但是有人反映說一些常用的片語沒有......這方面無法做出詳細的評估。但是字能的聯想功能相當強大,極端一點的例子是「遠水救不了近火」,輸入到「水」,後面一直按確定就行了。再如一些常用片語,比如「今天早晨(中午、晚上)」「今天有空」「吃完飯」,以及常用的地名(甚至有「海淀區、朝陽區、南京路」「南京大學」等等),都內置了片語。如果用其它輸入法無疑會麻煩一些。
(四)選字
各個廠商的手機都差不多,愛立信把游標默認的位置放在候選行的中間,似乎能夠減少移動游標的次數(不過有時候方向錯了想回來反而麻煩);西門子的做法是長按候選字所在的數字鍵(另一種方式是先按左軟鍵顯示游標,再移動游標選字,再按左軟鍵確定),但這樣可能相對會慢一些。飛利浦則是按0鍵( )移動提示行然後按1( )選字,如果過頭了不能回來,有時搞的人很惱火。
iTAP的做法和諾基亞類似,都是按方向鍵移動游標,然後按確定選字。摩托羅拉因為設計原因似乎顯得較慢,但是如果能夠使反應時間和諾基亞相同的話,速度也是相當快的。
(五)標點
最快的應該是諾基亞和愛立信(索愛),直接按*就可以顯示出標點。其次是西門子,短按*(或者是#,忘了)會出標點提示行,然後連續按那個鍵選擇標點。再次是摩托羅拉,需要取消提示行再按相應的鍵出標點(筆畫按0,拼音按1);但是可惡的是最常用的逗號和句號不在最前面。最慢的應該是三星和飛利浦,都需要切換到標點那項才能輸入。
從以上的分析,可以看出摩托羅拉的輸入並不方便,由於iTAP是摩托羅拉一家獨有,所以也可以說iTAP的易用程度不如T9和字能。而T9和字能在拼音輸入上幾乎一模一樣,但字能則在筆畫輸入上技高一籌,所以比賽結果也就出來了--字能智能輸入法用戶公認最高效快捷的主流手機輸入法。
手機輸入法我只用訊飛筆劃輸入
訊飛黨路過,已經被訊飛綁架了,如果給我一台新手機,發現不是訊飛輸入法,我就會特難受,因為會覺得那個輸入法特難用。
綁架主要有兩點,一是訊飛在任意中英文界面下支持手寫,連寫。不用切換輸入界面。
還有一個就是平常遇到陌生的字不會讀,反正我不會去網路查一下,而是通過在手機訊飛上手寫,然後你會看到字體顯示出的拼音。特別是這個功能,簡直就是一部字典。
我一直都在用訊飛輸入法。挺好用的,很方便,功能又多。
⑵ 微軟拼音輸入法的編碼規則
微軟拼音輸入法是中國第三代漢字編碼輸入法.中文的輸入法是從1974年8月開始基礎工作,這個工程項目又叫「748工程」,其主要成果之一是《漢字頻度表》,首先為漢字信息處理提供了重要的基礎數據。經過對《漢字頻度表》和其它字表的統計分析,國家標准總局頒布了漢字信息處理領域的第一個國家標准《信息交換用漢字編碼字元集·基本集》(GB2312-80)。這是一個在中國的漢字信息處理歷史上劃時代的、具有深遠影響的標准。
1981年,武漢大學等公布了在《新華字典》字集范圍內的字根頻度統計結果。1984年,國家文字改革委員會與武漢大學公布了《辭海》字集范圍內漢字筆畫、部件、結構的動態統計分析結果。
1985年,國家文字改革委員會與山西大學公布了人命姓氏用字的抽樣統計分析結果。
1986年,北京航空學院、新華社利用計算機技術分別公布了基於大型語料庫的新的漢字使用頻度統計和流通頻度統計1985年後,北京師范大學、上海交通大學、北京語言學院等分別使用各具特色的自動分詞技術公布了基於大型語料庫的現代漢語詞語使用頻度統計北京大學計算機語言研究所還建立了以漢語語法為中心的「現代漢語語法信息詞典」 內容全面、翔實、使用方便的漢語語料庫、字詞屬性庫對推動漢字編碼鍵盤輸入技術的發展起到了重大作用。
九十年代後公布的與漢字鍵盤輸入系統有關的國家標准有GB13000.1《信息技術多八位編碼字元(UCS)》、GB18030 《信息技術 信息交換用漢字編碼字元集基本集的擴充》、GB18031 《信息技術 數字鍵盤漢字輸入通用要求》、GB15834 《標點符號用法》和即將公布的有GB/T18220-2000《信息技術 通用鍵盤漢字輸入通用要求》。語委頒布的規范有GF3001 《信息處理 GB13000.1字元漢字部件規范》、GF3002 《GB13000.1字元集漢字筆順規范》、GF3003 《信息處理用漢語拼音方案表示規范通用鍵盤》。
下面是從第一代輸入法到微軟輸入法的一些介紹:
第一代漢字編碼輸入法
電子工業部第六所於1983年正式公布了我國第一個中文磁碟操作系統CC-DOS,這在我國中文信息處理歷史上具有劃時代的意義。CC-DOS是在PC-DOS的基礎上擴充、修改而成。在廣泛使用的CC-DOS 2.1版中,有簡拼、首尾碼、快速碼和區位碼輸入法,已經涵蓋了包括音碼、形碼、音形碼和數字碼這些主要類型的輸入法,對我國計算機應用的普及起到了開路先鋒的作用。
當時使用得最廣泛的輸入法是簡拼和首尾碼。簡拼是純音碼,使用的是介於全拼和雙拼之間的一種拼音方法,對三個及三個字母以上的韻母進行了壓縮。首尾碼是一種純形碼,包含97個部件,分為52類;部件到鍵盤字母的映射沒有太多的規律可循,記憶量很大;編碼時只取字首和字尾各一個部件,對於未列出的變形部件需要輸入者自己去猜測其應歸屬的鍵位。這兩種方法都不支持聯想,也不支持片語,都有很多重碼。因此,在輸入時選擇、翻頁操作很頻繁,眼睛需要不斷地掃描提示行以便在眾多的重碼中找尋所需的字,輸得又累又慢,更不可能實現盲打。
快速碼是通過壓縮拼音加碼方法實現的,可以在一定的程度上離散重碼。由於快速碼的加碼方法沒有規律可循,因此沒有得到真正的應用。區位碼需要完全要靠死記6763個漢字和符號的數字編碼來輸入,因此除了用於輸入當時還沒有其它辦法輸入的標點符號外,基本上沒有人實際使用。
另一個早期的漢字編碼輸入法是電報碼。電報碼為4位等長碼方案,使用的碼字從0000到9999,可以代表一萬個字元(包括漢字、字母、符號)。電報碼沒有重碼,但編碼的規律性不強,十分難記。因此,它完全是為了郵電部門那些已經熟悉電報碼的人的需要而移植進計算機的,對一般的漢字輸入者沒有什麼意義。
1986年,聯想集團在推出聯想漢卡的同時推出了聯想式漢字環境,首先使用了聯想方法來加快漢字的輸入。那時還沒有片語輸入方法,聯想技術讓人耳目一新。漢字輸入過程由原來的編碼->翻頁->選擇->編碼...變成了編碼->選擇->選擇...,因此稍後的很多輸入法都採用了這種技術。不過,按照現代漢字編碼輸入技術的標准來看,聯想技術仍然存在兩個致命的弱點。一個弱點是,如果後續要輸入的字與前面已輸入的字不能構成片語的話,則聯想就會失敗。另一個弱點是,聯想選擇時人機交互過於頻繁,雖然平均碼長縮短了,但是實際的輸入速度反而會下降。
總之,第一代漢字編碼輸入法的特點是:在DOS環境下,以單字為單位進行輸入,在屏幕底部提供專門的提示行顯示數量眾多的重碼字,翻頁、選擇操作頻繁;用數字鍵選擇重碼字,用ALT+數字鍵可重復選擇出現在提示行中的重碼字;連極為常用的標點符號的輸入都需要使用區位碼,很不方便;聯想技術的採用使輸入效率有所改善,但其作用是相當有限的;各種輸入法間的切換(包括切換到英文)都是通過復合功能鍵ALT+Fn(F1-F12)來進行的;支持全形和半形方式,但不支持中文標點方式;不支持片語輸入,更不支持自定義片語。
第二代漢字編碼輸入法
1986年,四通公司與日本三井物業合作,推出了四通MS-2400中文電子打字機,宣告了中國專業電子打字時代的到來。隨著四通打字機的廣泛使用,首先捆綁在四通打字機上的五筆字型輸入法流傳開來,後來捆綁到四通打字機上的由劉衛民發明的雙音輸入法也在當時得到比較廣泛的使用。
五筆字型是最典型的純形碼部件類方案。在五筆字型中,一般將部件稱為字根。五筆字型採用了130個基本字根。基本字根按起筆分為五類,對應通用鍵盤上的五個區。每類又細分為五組,每組對應一個鍵盤字母。在一個漢字中,字根間的關系被歸納為「單、散、連、交」四種。在漢字拆分時,遵循「取大優先,兼顧直觀,能連不交,能散不連」的原則。五筆字型將漢字被分為鍵名漢字、成字字根漢字和鍵外漢字三種,分別服從不同的編碼規則。另外,字的編碼還有一、二、三級簡碼,其形成方法是取相應全碼的前一、二、三個字母。五筆字型將片語也分為二字詞、三字詞和多字詞三種。二字詞按順序取各字的前兩個字根來編碼。三字詞按順序取頭兩個字的第一個字根和末字的前二個字根來編碼。多字詞按順序取第一、二、三、末字的第一個字根來編碼。
五筆字型以非常復雜的編碼規則換來了在GB2312-80字元集內較低的重碼率。當採用強制簡碼時,還可進一步將低重碼率。片語編碼被放進全碼字的剩餘編碼空間中,實現了字詞混合編碼。只要收錄的片語量不大,發生重碼的可能性是比較小的。一般的五筆字型不具備自造詞的功能。五筆字型擁有的這些特點,正好適應了職業打字的需要,成為它在職業打字時代非常流行的重要原因之一。
雖然五筆字型在市場上取得了巨大的成功,但它存在的問題也是不容忽視的。首先,五筆字型是非常難學的,而且容易遺忘。它除了有非常復雜的編碼規則而外,還有很多例外需要記憶。五筆字型打字員在打字時對一些常見字出現「卡殼」的現象是很普遍的事情。這時就需要臨時換用拼音輸入法。其次,五筆字型的擴展性差。當字元集從GB2312-80到GBK和GB18030過渡時,當片語量增大時,五筆字型在碼長為4的碼位上會出現大量的重碼,使其喪失重碼率低的優勢。五筆字型採用的是4碼無重碼自動上屏的策略,4碼重碼增多就迫使打字員的視線更多地離開稿件來觀察提示行以確認自己的輸入,從而降低錄入速度。最後,五筆字型最致命的弱點是規范性差。張孝存等就此提出了言辭激烈的批評:「五筆字型違反語言文字規范。它對漢字的拆分具有相當大的隨意性,對國民基礎文化素質具有不可忽視的負面影響。它對規范的漢字教育的沖擊同其應用范圍的擴大成正比[20]。」
雙音輸入法是一種比較巧妙的純音碼 [23][25]。雙音輸入法最大的特點就是「以詞定字、反向聯想」,以緩解純音碼方式下單字重碼過多的問題。因為二字詞的數量很多,所以一般情況下總可以找到某個二字詞,它的第一個字就是你想要輸入的字。如果該二字詞處於提示行的第一候選位置,則可以省略選擇鍵;否則需要用數字鍵進行選擇。如果整個二字詞都是你需要的,你可以加一個空格鍵輸入第二個字。也就是說,如果採用雙拼的話,利用「以詞定字」技術可以使得常用字輸入時的平均擊鍵數為2.5,而且基本上避免了傳統拼音+聯想方式下過多地掃視提示行和翻頁、選擇的毛病。在雙音輸入法中,對於三字詞和四字詞,取各字的聲母作為編碼來輸入,必要時加空格結束。對於不認識的字,可以打入「\\」調用「手寫模擬」。雖然可以自定義片語,但它不支持在線造詞。造詞時需要用外部文本編輯器按照它定義的格式輸入編碼和對應的片語。
雙音輸入法是拼音漢字輸入歷史上的一大進步,在當時受到了許多非職業打字員的歡迎。但是,它也存在一些比較嚴重的不足,以至於現在幾乎沒有人再使用它了。首先,雖然在輸入效率上它較傳統的拼音有很大的提升,但是它與後來的語句級拼音輸入法如智能ABC相比,還有相當的差距。另外,「以詞定字」時很多字可以採用多個詞來確定,而有的字難以找到詞來確定,用戶常常感到不知所措。雖然雙音輸入法中提供了很多其它的方法來解決單字的錄入問題。例如,鄧、郭、姚等姓氏用字的輸入就有6條輔助規則。要記住這些方法並判斷何時採用何種方法可不是一件容易的事情。由於只能離線造詞,所以片語的自定義也很不方便。
第三代漢字編碼輸入法
到了九十年代末,隨著微機價格的進一步降低、存儲處理能力的進一步增強、Windows圖形操作系統的流行和國際互聯網的興起,用戶界面變得非常友好,微機大面積地進入中國的普通百姓家庭,進入了中小學教育中,真正實現了微機在中國的大普及。
微機的大普及使得打字成為每個人的基本技能,就像會寫漢字一樣;需要別人打字就像需要別人代筆一樣,實際上是文盲的標志。這樣便造就了一個龐大的非職業打字員用戶群體。打字員作為一個職業正在快速消失。一般用戶在打字時的操作方式是「想打」,與職業打字員的「盲打」方式完全不同。「盲打」要求操作者盡量少看屏幕,輸入法提供的反饋信息只有在操作員不能「盲打」時才偶爾派上用場;而「想打」時操作者始終是看著屏幕的,輸入法所提供反饋的方式和反饋信息量的大小都會對操作者的輸入活動產生巨大影響。Windows圖形操作系統為人機界面的豐富化提供了前提條件,可以滿足反饋信息多樣化的需求。
現代微機強大的存儲處理能力為新型的存儲密集型和處理密集型輸入法的誕生提供了物質基礎。輸入法程序不再局限於DOS時代64KB的駐留內存中。千兆級的運算速度使得復雜的智能演算法得以投入運行。硬碟容量不僅從兆級擴大到千兆級,訪問硬碟的速度也比DOS時代大大提高。將巨型的詞庫存儲在硬碟上並進行快速搜索已不成問題。
計算機教育日益廣泛地在中小學開展後,學生們從小就開始學習打字了。漢字編碼與語言文字教育的關系問題被尖銳地提了出來。起碼的要求是,漢字編碼不能與語言文字知識相沖突。理想的情況是,把漢字編碼輸入與語言文字知識的學習結合起來,起到相互促進的作用。
在上述背景下,第三代漢字編碼輸入法應運而生,其指導思想是:規范、易學、易用並且盡量保持輸入速度。這一時期,智能化拼音輸入法的研究高潮迭起,也出現了以筆畫或筆對為輸入單位的純形碼,還出現了以聲母和筆畫(或筆對)為基礎的音形碼[29]-[48]。
(1) 智能化拼音輸入法
智能化拼音輸入法按其實現原理可以分為四種:基於理解的、基於語用統計的、基於模板匹配的和基於上下文關聯的。
智能ABC是目前Windows操作系統上使用得最為廣泛的准語句級拼音輸入法,因為它是以片語和短語為單位而不是以全句為單位進行轉換的。智能ABC最大的特色是能夠非常方便地自定義片語和調整重碼字詞的順序。用戶只需按自己的想法進行輸入,輸入時可以不進行手工分詞,系統會從前到後逐個進行自動分詞。在沒有片語時,系統自動按單字方式顯示重碼字供用戶選擇;一旦用戶選定並組成新詞後,系統就可以記住它。在系統分詞不正確或系統提供的詞不是用戶需要的詞時,用戶也可以加以修改,系統也能記住用戶所作的修改。通過較長時間的使用後,如果用戶沒有發生變化,系統逐步適應該用戶的使用習慣,使用戶的輸入過程變得自如起來。
智能ABC也有很多值得改進的地方。首先,在輸入時可以隨意使用全拼、簡拼、混拼,輸入者可以在任何時候進行音字轉換,過多的方式讓用戶不知哪種是最好的。看似非常靈活,但卻實際上是把優化輸入的任務交給了用戶。但大多數用戶不是這方面的專家,不可能很好地完成這項任務,從而導致用戶走很多彎路或形成不好的、低效的輸入習慣。其次,音字轉換的准確率不高,句內修改很頻繁,導致輸入速度不理想,即使使用雙拼也沒有自然碼的效率高。
微軟拼音是真正意義上的語句級音字轉換智能輸入法,是微軟自然語言處理技術多年科研成果的結晶。微軟拼音採用拼音作為漢字的錄入方式,用戶不需要經過專門的學習和培訓,就可以方便使用並熟練掌握這種漢字輸入技術。微軟拼音採用基於語句的整句轉換方式,用戶連續輸入整句話的拼音,不必人工分詞、挑選候選詞語,這樣既保證了用戶的思維流暢,又大大提高了輸入的效率。微軟拼音提供的人機界面非常具有特色。組字窗口可以嵌入正在輸入的文本的插入游標處,減少用戶在輸入時視線的移動頻率,使得輸入法的易用性得到了很大提高。逐鍵變換並提示轉換結果,使得用戶不必自己做何時進行轉換的決策。用戶可以輸入的編碼長度沒有限制,當超過系統的長度上限或遇到句號時系統會自動進行轉換,以便用戶能繼續不間斷地輸入。由於考慮的上下文較廣,微軟拼音能夠達到很高的轉換准確率。微軟拼音在默認情況下拒絕用戶輸入簡拼和混拼,可以引導用戶養成良好的輸入習慣。
微軟拼音也存在一些問題。首先,在編碼輸入出錯或轉換不正確時進行句內編輯的操作很繁瑣和低效。其次,逐鍵變換時往往會把已經轉換正確的內容又修改錯了,用戶不得不隨時監視輸入內容的正確性,當已轉換的內容較多時是非常勞心的。另外,微軟拼音沒有提供方法加速單字的錄入,也沒提供方法來輸入不認識的字,是不完備的輸入法。
基於筆畫(或筆對)和/或聲母的輸入法
採用筆畫、聲母這兩個最簡單的漢字特徵信息來進行編碼,可以極大地提高輸入法的易學性[12]。但是,漢字的筆畫一般歸為五種。筆畫種類太少,勢必增加編碼的長度,從而影響輸入速度。於是,如何縮短碼長、提高錄入效率成了這類輸入法成功與否的關鍵問題。
福建雙筆碼軟體開發有限公司研製的雙筆碼是一種基於筆畫的純形碼。為了克服筆畫種類過少的問題,雙筆碼引入了一種新的筆畫類型「叉」,從而將筆畫種類擴大為六種,取碼時按順序每取兩筆構成一個筆對,共可形成36種不同的筆對,並在鍵盤上相應的鍵位區內選擇鍵位輸入。另外,雙筆碼還規定病字旁、「口」、提手旁和「日」應作為一個整體取碼。根據漢字不同構造的組合形狀,雙筆碼把漢字劃為三類基本字型即左右型、上下型和綜合型。不論哪種類型的漢字,均按四碼進行編碼。雙筆碼片語的輸入方法為:二字詞輸入每個字的頭兩碼;三字詞輸入前兩個字的頭一碼和末字打頭兩碼,四字及四字以上詞輸入一、二、三、末字的頭一碼。
雙筆碼的優點是:與傳統的部件類輸入法相比,記憶量減少了許多;採用筆對和36鍵編碼後平均碼長也相當短;如果不按筆對而按單筆畫輸入,就可以非常容易地向數字鍵盤移植雙筆碼。但是雙筆碼的缺點也非常明顯:作為基於筆畫的輸入法,它的取碼和編碼規則復雜,例外也不少,學習難度仍然很大;採用了上排數字鍵進行編碼,擊打不方便,且與常用數字的輸入相沖突,影響了實際輸入速度。
陳勁松先生發明的二筆輸入法是目前使用得比較廣泛的輸入法之一。它是一種基於聲母和筆畫的輸入法,也可以單純基於筆畫進行輸入。二筆輸入法的30個編碼字元在通用鍵盤上分布於六個區,即五個雙筆畫區和一個單筆畫區。區內再根據雙筆畫的第二筆或根據單筆畫,按橫、豎、撇、點、折的順序定位。但10個設定偏旁部首的鍵位需要記憶。二筆輸入法將漢字按字形結構分為獨體字和合體字。輸入漢字時,第一碼取漢字拼音首字母,從第二碼起取筆畫,最多取四碼,不足四碼應全取,不能取雙筆畫時就取單筆畫。獨體字不必拆分;第一碼取拼音首字母,第二碼起按筆順取筆畫的代碼,最多取四碼。合體字拆分成兩半,按漢字筆順規則,先寫的部分定為前半,後寫部分為後半;第一碼取取拼音首字母,第二碼取前半的第一、二筆,第三碼取後半的第一、二筆,第四碼取後半的第三、四筆。二筆輸入法片語的編碼規則為:二字詞取每個字的前二碼,三字詞取第一字的前二碼和最後兩個字的第一碼,四字及四字以上詞取前三字和最後一字的第一碼。
二筆輸入法的優點是:編碼規則比雙筆碼更加簡單,使用的編碼字元也僅有30個;通過使用聲母和筆畫兩種漢字特徵信息編碼,區分同碼字詞的能力得到了增強,取得了較高的輸入效率;對於不認識的字還可以按全形方式輸入;如果不按筆對而按單筆畫輸入,也可以非常容易地向數字鍵盤移植。但是二筆輸入法也還存在問題:由於使用了筆對和設定部首,並需區分獨體字和合體字進行不同的編碼,因而學習難度和使用難度仍然較大。
數字鍵盤編碼輸入法
迄今為止,全國手機擁有量已超過3億,手機簡訊息的產值超過50億人民幣。手機擁有量已經超過PC機用戶,用手機輸入漢字的人群遠遠超過用通用大鍵盤輸入漢字的人群。
目前,美國特捷公司的T9拼音和T9筆畫輸入法、加拿大字源公司的字能筆畫輸入法和Motorola公司的iTap輸入法壟斷了中國大陸和港台的手機輸入法市場。但是,國外的手機數字鍵盤輸入法很不盡人意。以筆畫輸入為例,iTap用9個筆畫,字能用8個筆畫,T9用5個筆畫。相同的一個筆畫,不同的手機可以放在不同的位置上,輸入速度也不理想。
為了打破外國手機輸入法壟斷中國手機市場和手機輸入法不規范的尷尬局面。由中國中文信息學會等主辦,由黃金碼出版社(香港)有限公司等單位承辦,於2004年11月21日,在人民大會堂舉行了為期三天的中國首屆手機中文輸入大賽暨漢字數字碼輸入技術應用高峰論壇。在32支參賽隊伍中,有23支參加模擬手機漢字數字碼輸入比賽,9支參加手機中文輸入比賽。除了已參賽的數字編碼方案外,比較引人注意的還有王永民先生的五筆數碼[49]、鄭岩松先生的左右數碼[50]等。以下僅對當前使用得最為廣泛的T9拼音、T9筆畫和首屆手機中文輸入大賽中獲得冠軍的黃金碼、大眾數字碼進行介紹。
T9拼音本質上採用的是一種全拼單字加聯想的早期通用鍵盤輸入技術。其最重要的創新是可以根據手機鍵盤上按鍵的組合情況判斷是否能組合成合法的普通話音節,從而避免了傳統上通過多次按鍵來輸入一個拼音字母的弊端。但是,當按鍵組合適合多個合法的普通話音節,而且默認選擇的普通話音節又不是用戶所需要的時,用戶還是得進行手動選擇。另外,全拼的拼式過長、需要按1鍵進入選擇狀態和聯想造成的過度人機交互都使得T9拼音的輸入效率很低,而且全拼對普通話不好的人難度很大。
T9筆畫採用目前多數輸入法對筆畫的歸類方法將漢字筆畫歸為橫、豎、撇、點、折五類,分別用1、2、3、4、5表示。錄漢字時,按筆順進行輸入,逐鍵提示,每屏數個,高頻優先,最長可輸入12個筆畫,並支持聯想。由於分別使用五個鍵表示五種筆畫,因此不需要像T9拼音一樣對組合情況進行智能判斷,內部處理邏輯很簡單。T9筆畫充分利用了豐富的筆畫信息和不等長碼的短碼位,並可以直接鍵選重碼字,所以它的實際輸入效率比T9拼音還高。
大眾數字碼[51]用10個數字對字詞進行編碼。除了用1、2、3、4、5分別表示橫、豎、撇、點、折五種筆畫外,還用6、7、8、9、0分別表示交、插、八、小、口五類部件。單字按筆順取第一、二、三、四、末五個代碼、不足時按實際碼長,片語的碼長為6位。大眾數字碼使用了相當多的筆畫組合作為部件,但由於歸類清晰,記憶起來比很多同類的輸入法要容易些,加上精心的編碼規則降低了重碼率,使得它在比賽中脫穎而出。不過,應當看到它使用的部件相當多,編碼規則也並不簡單,學習難度還是相當大的。
黃金碼用9個數字對字詞進行編碼。除了用1、2、3、4、5分別表示橫、豎、撇、點、折五種筆畫外,還用6、7、8、9分別表示「口」、「十」、「八」、「亠」四類部件。編碼時分字首和字尾,也區分獨體字與合體字的不同。在提示行不為空時,0、*和#用做選擇鍵。黃金碼最大的特色是,在輸入時若用於編碼的數字與已輸入的編碼一起不能構成另外的字詞編碼時,該數字鍵就可以用於選擇同碼字詞,這樣就大大地增加了輸入法的鍵選能力,縮短了動態平均碼長;結合高頻先見的不等長碼的使用,在輸入時基本上不用翻頁,進一步提高了輸入效率。不過,字首與字尾的區分沒有標准可循,常常因人而異;動態地使用剩餘編碼鍵選擇重碼字詞也造成選擇鍵位置變化太大,加重了人機交互的負擔。
以上是我從事電腦工作以來接觸的幾種我熟悉的輸入法,不知道對你能否有所幫助.
⑶ 如何用C語言解決一筆畫問題,急
題目很簡單,從演算法上說,你只要判斷每個點與其它的點連接的邊數為偶數就可以了,如果滿足這個條件,從任意點出發都可以,如果不滿足,則不存在一筆畫迴路
演算法如此,代碼自己寫了
相關數學理論,請google 七橋問題