笔画输入算法
⑴ 手机上哪一种输入法最好用
这次就以个人名义来谈谈最好的输入法吧。我接触的第一个输入法是谷歌拼音输入法,那时的谷歌拼音输入法还很简陋,我是指皮肤不支持自定义,默认皮肤还很丑、词库近乎全无、字母略粗,简直难以忍受。
于是换了搜狗输入法、网络输入法、手心、触宝等等,弹窗、配色不搭、功能冗杂、布局不合理等各种原因(搜狗输入法是集大成者)让我怀着绝望的情绪换回了谷歌拼音输入法。
这样的经历在我用智能手机输入法的头四年里反复出现了大概二三十次,终于去年,我恍然大悟,放下正在学习的五笔输入法回归谷歌拼音输入法,我将这个过程称为返朴归真。
其实我只是想要一款简洁的输入法,虽然智能手机代替我们做了许多事,但是写字这件事我还是要一点点自己来。慢慢打字可以让我思考我在说什么做什么,以及使输入法更了解我的使用习惯。无数次试验后,谷歌输入法的简陋竟然是最合适的,就因为它简陋,除了打字什么都不会。
这么说似乎不是为谷歌拼音输入法宣传,倒像是贬低它不是十项全能,落后于主流输入法。
在认真审视谷歌拼音输入法后,我发现了一些惊喜,这些惊喜隐藏的太深了,一旦挖出来就会产生爱不释手之感。基本的导入词典,自定义词典,emoji丰富,符号齐全,可换皮肤就不提了。
第一项依然是“划行输入”,划行输入几乎每家输入法都有,但是我敢说谷歌拼音输入法是做的最好的一个,以至于我一字(母)一键用了这么多年谷歌拼音输入法,谷歌拼音输入法学习了我的使用习惯这么多年,随便划两下的准确率依然秒杀之,不但秒杀我,还秒杀一众跟随者,操作方法就是随便划,整个过程的精确度简直堪比读心术,有一种泼墨挥毫的快感。
按键就像瑞士军刀一样全能是另一个惊喜。是的,不必切换键盘,可以打出有音调的拼音,数字、符号等等,所谓混输就是这样。在使用其他输入法时按键功能就比较单一,在不同键盘间来回切换需要的学习成本不低。
第三个惊喜是单手模式,可以左右切换,大屏爱好者福音。笔者手指不算长,一直以来是谷歌拼音输入法给了我使用6英寸屏幕的勇气。调用单手模式也很简单,点击左上角箭头即可,但我希望谷歌可以为单手模式配一个快捷键,比如长按空格键。
谷歌拼音输入法某一次更新中,贸然删掉了五笔和手写两个输入版块,粉丝们顿时原地爆炸,此事发生一段时间后谷歌拼音输入法更新频繁,渐渐变成现在简单优雅、秀外慧中的样子,不过有一点,它还是很沉默很聪明。
最好的输入法不就是既聪明又安静吗?当然颜值高就再好不过了。
为谷歌拼音输入法正名:现在的谷歌拼音输入法词库很强大,日常使用不会影响输入速度,联想能力也不错,自己导入词库更好,为了简单优雅锻炼动手能力是值得的。
其实对于我们这么多手机用户来说,使用自己最适用的输入法就是最好的输入法,在这里我发现了三个不同的输入方式,一、拼音输入;二、语音输入;三、那就是使用率最少的五笔了。其中对于拼音输入法就我曾经使用过的输入法当中手机上的我觉得谷歌的输入法还不错,主要是拼音纠错的效率比较高;还有一个就是搜狗输入法,搜狗使用的人群还是比较多的,自然而然,搜狗的词库这些非常方便,长期使用搜狗的还是可以坚持使用,毕竟还是它更懂你;而相对于语音输入我还是推荐讯飞,我现在手机里面有两种输入法,都拥有语音输入包括曾经使用过的搜狗都拥有语音的输入,而语音识别率最高的就是讯飞,平时在走路的过程中不习惯发语音的,推荐讯飞输入法,毕竟是专做语音输入的;三、对于习惯于五笔或希望尝试学习五笔输入的朋友,在下就只有推荐一种了,那就是网络输入法,毕竟我在手机五笔输入法里面就只找到了它。其实每个人都有自己喜欢的输入法,它和你的生活习惯息息相关,主要是适合自己的就是最好的。
输入法是智能手机上最为常用的工具,输入法的好坏决定着你打字的速度和聊天的速度。可以说好的高效的输入法是手机使用效率的一大重要因素。我就来聊聊自己用的输入法。
由于我用的手机是360手机,手机上自带的输入法是手心输入法。刚开始用的还不是太喜欢,因为一直用搜狗输入法,打字速度还可以,皮肤也比较丰富,打字的习惯一时间难以适应,设置也比较方便。所以用了一段时间的搜狗输入法。可是突然我用了手心输入法,感觉也还可以,还是有许多特点和优势的。
首先,输入法自带表情。手心输入法里的表情跟qq里的表情一样,萌得可爱,表达感情无压力。
其次,语音输入辨识度较高。输入法自带语音输入,而且只要你的普通话不是太离谱,它识别的还是可以的。这对你这文件,或者是回答问题很有用处,起码节省时间咯。
再次,还有密文传送。这个可能比较新颖,由于360是安全公司,做安全这方面的事还是挺靠谱的,如果你有东西不想被人看到,用密文传送可以保护隐私哦。
最后,输入法自带计算机。有个题不会,算不准,直接用输入法里的计算机就能计算,还不用再开计算机的软件,省时省力,你值得拥有。
总之,手心输入法还是不错的,可能因为360手机的原因,起码用起来占内存小,各种操作极为方便,你值得试试。。
补充:
评论里说讯飞的,确定没有被老罗洗脑吗。
我承认讯飞语音输入法很牛逼,但是综合来看,他的传统输入法的交互真心一般,用起来非常不顺手,我确实用过一阵才这么说的,没办法习惯他们的逻辑,设置也不是很贴心。
不过我手机里确实装了讯飞,也只会在不想打字记便签的时候换成讯飞用一会,不会一直用。
所以我确实想说,不要盲目崇拜,一些产品好是好,但是一定要适合自己,如果你不会拼音,只会说话,那讯飞绝对是首选,但是如果你追求高效的打字速度,我认为无论搜狗还是网络,都可以在这方面秒杀。
最后,无论什么输入法,都有语音输入的功能,准确性不比讯飞差。还是那句话,理性选择适合自己的产品,不要盲目相信,盲目崇拜。
——————————————————————————————
以下为原答案:
我知道有很多人吐槽小米手机自带的输入法,可是我确实没有觉得难用,反而这个系统自带的输入法很让我喜欢。
被吐槽之后,小米立刻又和搜狗合作有了搜狗小米版输入法,其实就是搜狗输入法,但是和MIUI系统结合的更好了。
不过我还是喜欢网络给小米专门做的输入法。(当然我已经说了小米自带的都是很好用的,我只是更喜欢网络做的
喜欢网络小米输入法的一大原因是可以用emoji表情。表情包简直是人类沟通的又一大桥梁,可以说如果没有表情的支撑,我和别人聊天,可能不到三句话就会彻底垮掉了。文字聊天的两大弊端就是不能听到对方的语气,不能感受到对方在说话时的表情,没有这两个信息,很容易会错他人的意图,而有了表情包,特别是丰富的表情包,它能帮你节省很多交流的 情感 ,一个表情就能说通。
这也是我真正喜欢网络小米输入法的一个原因。
你会说,其他的输入法一样能用emoji表情。
不,其他的输入法能用是能用,但是emoji表情成百上千,非IOS系统的用户能用的很少,而网络小米输入法是目前我发现emoji表情在安卓手机上使用最全最新的。
展示一下:
很少一部分,还有一些动物食物的,我就不放了。
emoji表情经常更新,网络基本都会实时跟进,可以说这是热爱表情的安卓用户的首选输入法了。
我用的最久的就是搜狗输入法了。
先说说搜狗输入法的优势吧。我认为搜狗输入法的键盘布局很符合我的使用习惯,各种功能键以及拼音键布局合理,除了前些日子有个反人类的语音键但是后来又修正了,没有任何其他毛病。然后最开始还认为搜狗输入法的皮肤很多,什么类型的都有,很容易轻松下载到,虽然现在已经用最基本款了,但不得不承认开始也被这个因素吸引了。第三一点就是词库很完整,智能联想以及云功能都非常好用。
不足的地方也是比较明显的,搜狗输入法似乎一直跟其他app兼容性不是很好,不知道是不是我的个例,有时候在qq或者微信输入的时候,输入法总是崩溃要重新切换。还有一点就是现在搜狗输入法的功能确实是越来越多了,但实际上能用得上的很少,功能一多占用的运行内存也多了,估计这也是爱崩溃的原因之一吧,要是能有个简化版的就好了。
搜狗吧,因为个人手机不一样自带的输入法我就不说了、第三方软件输入法大大小小好几十种但大都被几个输入法垄断了市场比如搜狗网络讯飞等等,之前一直用的是搜狗个人感觉搜狗还不错,就自定义的角度来说它的皮肤主题有好多种比如说你想让键盘透明或者你想改变他的界面颜色可以随意调整自己喜欢的颜色,或者你想要什么样主题的键盘你也可以在搜狗的主题库搜索,比如说你玩英雄联盟可以下载英雄联盟的皮肤键盘,或者小清新,非主流亦或是大自然什么的主题都ok,主要是让你感受到很自由很随意的feel,当然这是我两年前用的搜狗体验感觉,后来换苹果了就用苹果自带的输入法,不知道苹果的商店有没有搜狗,这个我还真没有去看过,等我回答完就去看看有就下载一个还不错的。其他的输入法我也有用,就不一一介绍了,有意向的可以下载搜狗尝试一下,不好再换其他的,当然我指的是手机端不是pc端,这是我用我以前手机截的图
我们似乎每天都在与手机短信打交道,但在手机上写中文短信不像在电脑上输入汉字那样容易。如果有几种输入法摆在你面前,你是不是很想知道选什么输入法写短信最快捷?下面博士就来和大家一起探讨一下究竟谁是现在最高效快捷的手机输入法。
目前在手机输入领域有三种最主流的手机输入法:
一、T9智能输入法
T9输入法解决了小型掌上设备的文字输入问题,已经成为全球手机文字输入的标准之一。目前诺基亚、西门子、松下、飞利浦等公司均支持此种输入法。 T9在输入汉语拼音时,每个字母所在的按键只需按一次,T9内部程序就会按算法自动组成合法的拼音。此外输入一个字后,屏幕上会出现一些常见的与该字能组成词组的字,用户直接选择即可,无需再输入拼音。
T9的中文输入方式包括笔画、拼音以及注音。使用频率最高的除了拼音,就是笔画输入。用户只需按照平时手写汉字那样,按顺序输入笔画,T9会从内置的语言数据库中选出相匹配的汉字。
二、字能输入法
使用过早期爱立信手机的用户十分熟悉这种输入法,目前该输入法主要被爱立信的早期机型、阿尔卡特以及一些国产手机所采用。在拼音的输入方面,字能跟T9的方法几乎一样;而在笔画的输入上,字能则技高一筹。对于不大熟悉笔画的用户,字能输入法可以使用笔画询问键来进行模糊输入。看来在人性化方面,字能的表现要比T9输入法更加出色。
三、iTAP输入法
这款输入法是摩托罗拉的独家绝活。iTAP是在T9的基础上发展起来的,在输入的算法方面也跟T9基本相似,不过在笔画输入上iTAP也有自己的特色--支持倒笔,当用户在输入过程中出现倒划笔的现象,iTAP仍然能从字库中搜索到用户所需要的汉字。
下面进入今天的正题,输入法的易用程度取决于几个条件:
1,笔画的合理性;
2,重码的多少;
3,联想功能的强弱;
4,选字是否容易;
5,标点输入是否便捷(标点是输入法的一部分,也可以显示出手机软键的人性化程度)。
而评价一种输入法,应该从该种输入法能够达到的最高水平来判断,否则由于同一输入法在不同手机平台上的差异(如T9),会使各种输入法之间没有可比性。
(一)笔画分析
T9的笔画输入是5笔,所有的折都归在同一个按键上,使用者可以无需考虑折的分类,学习速度较快。从按键速度来看T9无疑是速度最快的,而且由于它的按键可以集中在键盘上部,所以使用者可以更好地把持手机。
在字能输入法中,折被分成4种笔画:末笔是横折(钩)的,末笔是竖弯(钩)的,末笔是折弯(钩)的,还有“犭”的起笔(弯勾)。字能认为,所有没有大的弯折的笔画都可以归为一类;如竖提归为竖,点和捺归为一类等等,这和T9是一致的。从中可以看出字能的思路是笔画走向一致的分在同一类笔画中。
而在iTap中,有9种笔画:横、竖、撇、捺、点、竖折、横折、横折折钩、竖弯勾。其中捺从点中被分离出来,竖勾从竖中分离出来归在横折折钩中;竖折和竖勾分离开来。可见iTAP的思路是末笔带钩的应和末笔是一直下去的分开。
以上是笔画分离的特性,但我们不是专家,从笔画上很难判断那种输入法更加合理,所以下面从另外几个方面来综合讨论一下:
(二)输入方式
在这里,字能凭借偏旁的输入,使输入汉字的步骤减少,并使重码减少。譬如雨字头,T9输入是一丶?丨丶丶丶丶,共8笔。iTAP与T9相同,8笔。而字能只需输入一丶就会出现雨字头的偏旁,接下来只需选择偏旁即可;算上按方向键和确定键的次数,也只需四笔。类似的--“隹”这类 缘氖淙耄 伎梢杂蒙儆赥9或iTAP的按键次数输入进去,并且减少了重码。
(三)词句联想
输入法的联想就不说了,似乎近来某些机型可以使常用字优先。iTAP这方面的情况不太清楚,但是有人反映说一些常用的词组没有......这方面无法做出详细的评估。但是字能的联想功能相当强大,极端一点的例子是“远水救不了近火”,输入到“水”,后面一直按确定就行了。再如一些常用词组,比如“今天早晨(中午、晚上)”“今天有空”“吃完饭”,以及常用的地名(甚至有“海淀区、朝阳区、南京路”“南京大学”等等),都内置了词组。如果用其它输入法无疑会麻烦一些。
(四)选字
各个厂商的手机都差不多,爱立信把光标默认的位置放在候选行的中间,似乎能够减少移动光标的次数(不过有时候方向错了想回来反而麻烦);西门子的做法是长按候选字所在的数字键(另一种方式是先按左软键显示光标,再移动光标选字,再按左软键确定),但这样可能相对会慢一些。飞利浦则是按0键( )移动提示行然后按1( )选字,如果过头了不能回来,有时搞的人很恼火。
iTAP的做法和诺基亚类似,都是按方向键移动光标,然后按确定选字。摩托罗拉因为设计原因似乎显得较慢,但是如果能够使反应时间和诺基亚相同的话,速度也是相当快的。
(五)标点
最快的应该是诺基亚和爱立信(索爱),直接按*就可以显示出标点。其次是西门子,短按*(或者是#,忘了)会出标点提示行,然后连续按那个键选择标点。再次是摩托罗拉,需要取消提示行再按相应的键出标点(笔画按0,拼音按1);但是可恶的是最常用的逗号和句号不在最前面。最慢的应该是三星和飞利浦,都需要切换到标点那项才能输入。
从以上的分析,可以看出摩托罗拉的输入并不方便,由于iTAP是摩托罗拉一家独有,所以也可以说iTAP的易用程度不如T9和字能。而T9和字能在拼音输入上几乎一模一样,但字能则在笔画输入上技高一筹,所以比赛结果也就出来了--字能智能输入法用户公认最高效快捷的主流手机输入法。
手机输入法我只用讯飞笔划输入
讯飞党路过,已经被讯飞绑架了,如果给我一台新手机,发现不是讯飞输入法,我就会特难受,因为会觉得那个输入法特难用。
绑架主要有两点,一是讯飞在任意中英文界面下支持手写,连写。不用切换输入界面。
还有一个就是平常遇到陌生的字不会读,反正我不会去网络查一下,而是通过在手机讯飞上手写,然后你会看到字体显示出的拼音。特别是这个功能,简直就是一部字典。
我一直都在用讯飞输入法。挺好用的,很方便,功能又多。
⑵ 微软拼音输入法的编码规则
微软拼音输入法是中国第三代汉字编码输入法.中文的输入法是从1974年8月开始基础工作,这个工程项目又叫“748工程”,其主要成果之一是《汉字频度表》,首先为汉字信息处理提供了重要的基础数据。经过对《汉字频度表》和其它字表的统计分析,国家标准总局颁布了汉字信息处理领域的第一个国家标准《信息交换用汉字编码字符集·基本集》(GB2312-80)。这是一个在中国的汉字信息处理历史上划时代的、具有深远影响的标准。
1981年,武汉大学等公布了在《新华字典》字集范围内的字根频度统计结果。1984年,国家文字改革委员会与武汉大学公布了《辞海》字集范围内汉字笔画、部件、结构的动态统计分析结果。
1985年,国家文字改革委员会与山西大学公布了人命姓氏用字的抽样统计分析结果。
1986年,北京航空学院、新华社利用计算机技术分别公布了基于大型语料库的新的汉字使用频度统计和流通频度统计1985年后,北京师范大学、上海交通大学、北京语言学院等分别使用各具特色的自动分词技术公布了基于大型语料库的现代汉语词语使用频度统计北京大学计算机语言研究所还建立了以汉语语法为中心的“现代汉语语法信息词典” 内容全面、翔实、使用方便的汉语语料库、字词属性库对推动汉字编码键盘输入技术的发展起到了重大作用。
九十年代后公布的与汉字键盘输入系统有关的国家标准有GB13000.1《信息技术多八位编码字符(UCS)》、GB18030 《信息技术 信息交换用汉字编码字符集基本集的扩充》、GB18031 《信息技术 数字键盘汉字输入通用要求》、GB15834 《标点符号用法》和即将公布的有GB/T18220-2000《信息技术 通用键盘汉字输入通用要求》。语委颁布的规范有GF3001 《信息处理 GB13000.1字符汉字部件规范》、GF3002 《GB13000.1字符集汉字笔顺规范》、GF3003 《信息处理用汉语拼音方案表示规范通用键盘》。
下面是从第一代输入法到微软输入法的一些介绍:
第一代汉字编码输入法
电子工业部第六所于1983年正式公布了我国第一个中文磁盘操作系统CC-DOS,这在我国中文信息处理历史上具有划时代的意义。CC-DOS是在PC-DOS的基础上扩充、修改而成。在广泛使用的CC-DOS 2.1版中,有简拼、首尾码、快速码和区位码输入法,已经涵盖了包括音码、形码、音形码和数字码这些主要类型的输入法,对我国计算机应用的普及起到了开路先锋的作用。
当时使用得最广泛的输入法是简拼和首尾码。简拼是纯音码,使用的是介于全拼和双拼之间的一种拼音方法,对三个及三个字母以上的韵母进行了压缩。首尾码是一种纯形码,包含97个部件,分为52类;部件到键盘字母的映射没有太多的规律可循,记忆量很大;编码时只取字首和字尾各一个部件,对于未列出的变形部件需要输入者自己去猜测其应归属的键位。这两种方法都不支持联想,也不支持词组,都有很多重码。因此,在输入时选择、翻页操作很频繁,眼睛需要不断地扫描提示行以便在众多的重码中找寻所需的字,输得又累又慢,更不可能实现盲打。
快速码是通过压缩拼音加码方法实现的,可以在一定的程度上离散重码。由于快速码的加码方法没有规律可循,因此没有得到真正的应用。区位码需要完全要靠死记6763个汉字和符号的数字编码来输入,因此除了用于输入当时还没有其它办法输入的标点符号外,基本上没有人实际使用。
另一个早期的汉字编码输入法是电报码。电报码为4位等长码方案,使用的码字从0000到9999,可以代表一万个字符(包括汉字、字母、符号)。电报码没有重码,但编码的规律性不强,十分难记。因此,它完全是为了邮电部门那些已经熟悉电报码的人的需要而移植进计算机的,对一般的汉字输入者没有什么意义。
1986年,联想集团在推出联想汉卡的同时推出了联想式汉字环境,首先使用了联想方法来加快汉字的输入。那时还没有词组输入方法,联想技术让人耳目一新。汉字输入过程由原来的编码->翻页->选择->编码...变成了编码->选择->选择...,因此稍后的很多输入法都采用了这种技术。不过,按照现代汉字编码输入技术的标准来看,联想技术仍然存在两个致命的弱点。一个弱点是,如果后续要输入的字与前面已输入的字不能构成词组的话,则联想就会失败。另一个弱点是,联想选择时人机交互过于频繁,虽然平均码长缩短了,但是实际的输入速度反而会下降。
总之,第一代汉字编码输入法的特点是:在DOS环境下,以单字为单位进行输入,在屏幕底部提供专门的提示行显示数量众多的重码字,翻页、选择操作频繁;用数字键选择重码字,用ALT+数字键可重复选择出现在提示行中的重码字;连极为常用的标点符号的输入都需要使用区位码,很不方便;联想技术的采用使输入效率有所改善,但其作用是相当有限的;各种输入法间的切换(包括切换到英文)都是通过复合功能键ALT+Fn(F1-F12)来进行的;支持全角和半角方式,但不支持中文标点方式;不支持词组输入,更不支持自定义词组。
第二代汉字编码输入法
1986年,四通公司与日本三井物业合作,推出了四通MS-2400中文电子打字机,宣告了中国专业电子打字时代的到来。随着四通打字机的广泛使用,首先捆绑在四通打字机上的五笔字型输入法流传开来,后来捆绑到四通打字机上的由刘卫民发明的双音输入法也在当时得到比较广泛的使用。
五笔字型是最典型的纯形码部件类方案。在五笔字型中,一般将部件称为字根。五笔字型采用了130个基本字根。基本字根按起笔分为五类,对应通用键盘上的五个区。每类又细分为五组,每组对应一个键盘字母。在一个汉字中,字根间的关系被归纳为“单、散、连、交”四种。在汉字拆分时,遵循“取大优先,兼顾直观,能连不交,能散不连”的原则。五笔字型将汉字被分为键名汉字、成字字根汉字和键外汉字三种,分别服从不同的编码规则。另外,字的编码还有一、二、三级简码,其形成方法是取相应全码的前一、二、三个字母。五笔字型将词组也分为二字词、三字词和多字词三种。二字词按顺序取各字的前两个字根来编码。三字词按顺序取头两个字的第一个字根和末字的前二个字根来编码。多字词按顺序取第一、二、三、末字的第一个字根来编码。
五笔字型以非常复杂的编码规则换来了在GB2312-80字符集内较低的重码率。当采用强制简码时,还可进一步将低重码率。词组编码被放进全码字的剩余编码空间中,实现了字词混合编码。只要收录的词组量不大,发生重码的可能性是比较小的。一般的五笔字型不具备自造词的功能。五笔字型拥有的这些特点,正好适应了职业打字的需要,成为它在职业打字时代非常流行的重要原因之一。
虽然五笔字型在市场上取得了巨大的成功,但它存在的问题也是不容忽视的。首先,五笔字型是非常难学的,而且容易遗忘。它除了有非常复杂的编码规则而外,还有很多例外需要记忆。五笔字型打字员在打字时对一些常见字出现“卡壳”的现象是很普遍的事情。这时就需要临时换用拼音输入法。其次,五笔字型的扩展性差。当字符集从GB2312-80到GBK和GB18030过渡时,当词组量增大时,五笔字型在码长为4的码位上会出现大量的重码,使其丧失重码率低的优势。五笔字型采用的是4码无重码自动上屏的策略,4码重码增多就迫使打字员的视线更多地离开稿件来观察提示行以确认自己的输入,从而降低录入速度。最后,五笔字型最致命的弱点是规范性差。张孝存等就此提出了言辞激烈的批评:“五笔字型违反语言文字规范。它对汉字的拆分具有相当大的随意性,对国民基础文化素质具有不可忽视的负面影响。它对规范的汉字教育的冲击同其应用范围的扩大成正比[20]。”
双音输入法是一种比较巧妙的纯音码 [23][25]。双音输入法最大的特点就是“以词定字、反向联想”,以缓解纯音码方式下单字重码过多的问题。因为二字词的数量很多,所以一般情况下总可以找到某个二字词,它的第一个字就是你想要输入的字。如果该二字词处于提示行的第一候选位置,则可以省略选择键;否则需要用数字键进行选择。如果整个二字词都是你需要的,你可以加一个空格键输入第二个字。也就是说,如果采用双拼的话,利用“以词定字”技术可以使得常用字输入时的平均击键数为2.5,而且基本上避免了传统拼音+联想方式下过多地扫视提示行和翻页、选择的毛病。在双音输入法中,对于三字词和四字词,取各字的声母作为编码来输入,必要时加空格结束。对于不认识的字,可以打入“\\”调用“手写模拟”。虽然可以自定义词组,但它不支持在线造词。造词时需要用外部文本编辑器按照它定义的格式输入编码和对应的词组。
双音输入法是拼音汉字输入历史上的一大进步,在当时受到了许多非职业打字员的欢迎。但是,它也存在一些比较严重的不足,以至于现在几乎没有人再使用它了。首先,虽然在输入效率上它较传统的拼音有很大的提升,但是它与后来的语句级拼音输入法如智能ABC相比,还有相当的差距。另外,“以词定字”时很多字可以采用多个词来确定,而有的字难以找到词来确定,用户常常感到不知所措。虽然双音输入法中提供了很多其它的方法来解决单字的录入问题。例如,邓、郭、姚等姓氏用字的输入就有6条辅助规则。要记住这些方法并判断何时采用何种方法可不是一件容易的事情。由于只能离线造词,所以词组的自定义也很不方便。
第三代汉字编码输入法
到了九十年代末,随着微机价格的进一步降低、存储处理能力的进一步增强、Windows图形操作系统的流行和国际互联网的兴起,用户界面变得非常友好,微机大面积地进入中国的普通百姓家庭,进入了中小学教育中,真正实现了微机在中国的大普及。
微机的大普及使得打字成为每个人的基本技能,就像会写汉字一样;需要别人打字就像需要别人代笔一样,实际上是文盲的标志。这样便造就了一个庞大的非职业打字员用户群体。打字员作为一个职业正在快速消失。一般用户在打字时的操作方式是“想打”,与职业打字员的“盲打”方式完全不同。“盲打”要求操作者尽量少看屏幕,输入法提供的反馈信息只有在操作员不能“盲打”时才偶尔派上用场;而“想打”时操作者始终是看着屏幕的,输入法所提供反馈的方式和反馈信息量的大小都会对操作者的输入活动产生巨大影响。Windows图形操作系统为人机界面的丰富化提供了前提条件,可以满足反馈信息多样化的需求。
现代微机强大的存储处理能力为新型的存储密集型和处理密集型输入法的诞生提供了物质基础。输入法程序不再局限于DOS时代64KB的驻留内存中。千兆级的运算速度使得复杂的智能算法得以投入运行。硬盘容量不仅从兆级扩大到千兆级,访问硬盘的速度也比DOS时代大大提高。将巨型的词库存储在硬盘上并进行快速搜索已不成问题。
计算机教育日益广泛地在中小学开展后,学生们从小就开始学习打字了。汉字编码与语言文字教育的关系问题被尖锐地提了出来。起码的要求是,汉字编码不能与语言文字知识相冲突。理想的情况是,把汉字编码输入与语言文字知识的学习结合起来,起到相互促进的作用。
在上述背景下,第三代汉字编码输入法应运而生,其指导思想是:规范、易学、易用并且尽量保持输入速度。这一时期,智能化拼音输入法的研究高潮迭起,也出现了以笔画或笔对为输入单位的纯形码,还出现了以声母和笔画(或笔对)为基础的音形码[29]-[48]。
(1) 智能化拼音输入法
智能化拼音输入法按其实现原理可以分为四种:基于理解的、基于语用统计的、基于模板匹配的和基于上下文关联的。
智能ABC是目前Windows操作系统上使用得最为广泛的准语句级拼音输入法,因为它是以词组和短语为单位而不是以全句为单位进行转换的。智能ABC最大的特色是能够非常方便地自定义词组和调整重码字词的顺序。用户只需按自己的想法进行输入,输入时可以不进行手工分词,系统会从前到后逐个进行自动分词。在没有词组时,系统自动按单字方式显示重码字供用户选择;一旦用户选定并组成新词后,系统就可以记住它。在系统分词不正确或系统提供的词不是用户需要的词时,用户也可以加以修改,系统也能记住用户所作的修改。通过较长时间的使用后,如果用户没有发生变化,系统逐步适应该用户的使用习惯,使用户的输入过程变得自如起来。
智能ABC也有很多值得改进的地方。首先,在输入时可以随意使用全拼、简拼、混拼,输入者可以在任何时候进行音字转换,过多的方式让用户不知哪种是最好的。看似非常灵活,但却实际上是把优化输入的任务交给了用户。但大多数用户不是这方面的专家,不可能很好地完成这项任务,从而导致用户走很多弯路或形成不好的、低效的输入习惯。其次,音字转换的准确率不高,句内修改很频繁,导致输入速度不理想,即使使用双拼也没有自然码的效率高。
微软拼音是真正意义上的语句级音字转换智能输入法,是微软自然语言处理技术多年科研成果的结晶。微软拼音采用拼音作为汉字的录入方式,用户不需要经过专门的学习和培训,就可以方便使用并熟练掌握这种汉字输入技术。微软拼音采用基于语句的整句转换方式,用户连续输入整句话的拼音,不必人工分词、挑选候选词语,这样既保证了用户的思维流畅,又大大提高了输入的效率。微软拼音提供的人机界面非常具有特色。组字窗口可以嵌入正在输入的文本的插入光标处,减少用户在输入时视线的移动频率,使得输入法的易用性得到了很大提高。逐键变换并提示转换结果,使得用户不必自己做何时进行转换的决策。用户可以输入的编码长度没有限制,当超过系统的长度上限或遇到句号时系统会自动进行转换,以便用户能继续不间断地输入。由于考虑的上下文较广,微软拼音能够达到很高的转换准确率。微软拼音在默认情况下拒绝用户输入简拼和混拼,可以引导用户养成良好的输入习惯。
微软拼音也存在一些问题。首先,在编码输入出错或转换不正确时进行句内编辑的操作很繁琐和低效。其次,逐键变换时往往会把已经转换正确的内容又修改错了,用户不得不随时监视输入内容的正确性,当已转换的内容较多时是非常劳心的。另外,微软拼音没有提供方法加速单字的录入,也没提供方法来输入不认识的字,是不完备的输入法。
基于笔画(或笔对)和/或声母的输入法
采用笔画、声母这两个最简单的汉字特征信息来进行编码,可以极大地提高输入法的易学性[12]。但是,汉字的笔画一般归为五种。笔画种类太少,势必增加编码的长度,从而影响输入速度。于是,如何缩短码长、提高录入效率成了这类输入法成功与否的关键问题。
福建双笔码软件开发有限公司研制的双笔码是一种基于笔画的纯形码。为了克服笔画种类过少的问题,双笔码引入了一种新的笔画类型“叉”,从而将笔画种类扩大为六种,取码时按顺序每取两笔构成一个笔对,共可形成36种不同的笔对,并在键盘上相应的键位区内选择键位输入。另外,双笔码还规定病字旁、“口”、提手旁和“日”应作为一个整体取码。根据汉字不同构造的组合形状,双笔码把汉字划为三类基本字型即左右型、上下型和综合型。不论哪种类型的汉字,均按四码进行编码。双笔码词组的输入方法为:二字词输入每个字的头两码;三字词输入前两个字的头一码和末字打头两码,四字及四字以上词输入一、二、三、末字的头一码。
双笔码的优点是:与传统的部件类输入法相比,记忆量减少了许多;采用笔对和36键编码后平均码长也相当短;如果不按笔对而按单笔画输入,就可以非常容易地向数字键盘移植双笔码。但是双笔码的缺点也非常明显:作为基于笔画的输入法,它的取码和编码规则复杂,例外也不少,学习难度仍然很大;采用了上排数字键进行编码,击打不方便,且与常用数字的输入相冲突,影响了实际输入速度。
陈劲松先生发明的二笔输入法是目前使用得比较广泛的输入法之一。它是一种基于声母和笔画的输入法,也可以单纯基于笔画进行输入。二笔输入法的30个编码字符在通用键盘上分布于六个区,即五个双笔画区和一个单笔画区。区内再根据双笔画的第二笔或根据单笔画,按横、竖、撇、点、折的顺序定位。但10个设定偏旁部首的键位需要记忆。二笔输入法将汉字按字形结构分为独体字和合体字。输入汉字时,第一码取汉字拼音首字母,从第二码起取笔画,最多取四码,不足四码应全取,不能取双笔画时就取单笔画。独体字不必拆分;第一码取拼音首字母,第二码起按笔顺取笔画的代码,最多取四码。合体字拆分成两半,按汉字笔顺规则,先写的部分定为前半,后写部分为后半;第一码取取拼音首字母,第二码取前半的第一、二笔,第三码取后半的第一、二笔,第四码取后半的第三、四笔。二笔输入法词组的编码规则为:二字词取每个字的前二码,三字词取第一字的前二码和最后两个字的第一码,四字及四字以上词取前三字和最后一字的第一码。
二笔输入法的优点是:编码规则比双笔码更加简单,使用的编码字符也仅有30个;通过使用声母和笔画两种汉字特征信息编码,区分同码字词的能力得到了增强,取得了较高的输入效率;对于不认识的字还可以按全角方式输入;如果不按笔对而按单笔画输入,也可以非常容易地向数字键盘移植。但是二笔输入法也还存在问题:由于使用了笔对和设定部首,并需区分独体字和合体字进行不同的编码,因而学习难度和使用难度仍然较大。
数字键盘编码输入法
迄今为止,全国手机拥有量已超过3亿,手机短信息的产值超过50亿人民币。手机拥有量已经超过PC机用户,用手机输入汉字的人群远远超过用通用大键盘输入汉字的人群。
目前,美国特捷公司的T9拼音和T9笔画输入法、加拿大字源公司的字能笔画输入法和Motorola公司的iTap输入法垄断了中国大陆和港台的手机输入法市场。但是,国外的手机数字键盘输入法很不尽人意。以笔画输入为例,iTap用9个笔画,字能用8个笔画,T9用5个笔画。相同的一个笔画,不同的手机可以放在不同的位置上,输入速度也不理想。
为了打破外国手机输入法垄断中国手机市场和手机输入法不规范的尴尬局面。由中国中文信息学会等主办,由黄金码出版社(香港)有限公司等单位承办,于2004年11月21日,在人民大会堂举行了为期三天的中国首届手机中文输入大赛暨汉字数字码输入技术应用高峰论坛。在32支参赛队伍中,有23支参加模拟手机汉字数字码输入比赛,9支参加手机中文输入比赛。除了已参赛的数字编码方案外,比较引人注意的还有王永民先生的五笔数码[49]、郑岩松先生的左右数码[50]等。以下仅对当前使用得最为广泛的T9拼音、T9笔画和首届手机中文输入大赛中获得冠军的黄金码、大众数字码进行介绍。
T9拼音本质上采用的是一种全拼单字加联想的早期通用键盘输入技术。其最重要的创新是可以根据手机键盘上按键的组合情况判断是否能组合成合法的普通话音节,从而避免了传统上通过多次按键来输入一个拼音字母的弊端。但是,当按键组合适合多个合法的普通话音节,而且默认选择的普通话音节又不是用户所需要的时,用户还是得进行手动选择。另外,全拼的拼式过长、需要按1键进入选择状态和联想造成的过度人机交互都使得T9拼音的输入效率很低,而且全拼对普通话不好的人难度很大。
T9笔画采用目前多数输入法对笔画的归类方法将汉字笔画归为横、竖、撇、点、折五类,分别用1、2、3、4、5表示。录汉字时,按笔顺进行输入,逐键提示,每屏数个,高频优先,最长可输入12个笔画,并支持联想。由于分别使用五个键表示五种笔画,因此不需要像T9拼音一样对组合情况进行智能判断,内部处理逻辑很简单。T9笔画充分利用了丰富的笔画信息和不等长码的短码位,并可以直接键选重码字,所以它的实际输入效率比T9拼音还高。
大众数字码[51]用10个数字对字词进行编码。除了用1、2、3、4、5分别表示横、竖、撇、点、折五种笔画外,还用6、7、8、9、0分别表示交、插、八、小、口五类部件。单字按笔顺取第一、二、三、四、末五个代码、不足时按实际码长,词组的码长为6位。大众数字码使用了相当多的笔画组合作为部件,但由于归类清晰,记忆起来比很多同类的输入法要容易些,加上精心的编码规则降低了重码率,使得它在比赛中脱颖而出。不过,应当看到它使用的部件相当多,编码规则也并不简单,学习难度还是相当大的。
黄金码用9个数字对字词进行编码。除了用1、2、3、4、5分别表示横、竖、撇、点、折五种笔画外,还用6、7、8、9分别表示“口”、“十”、“八”、“亠”四类部件。编码时分字首和字尾,也区分独体字与合体字的不同。在提示行不为空时,0、*和#用做选择键。黄金码最大的特色是,在输入时若用于编码的数字与已输入的编码一起不能构成另外的字词编码时,该数字键就可以用于选择同码字词,这样就大大地增加了输入法的键选能力,缩短了动态平均码长;结合高频先见的不等长码的使用,在输入时基本上不用翻页,进一步提高了输入效率。不过,字首与字尾的区分没有标准可循,常常因人而异;动态地使用剩余编码键选择重码字词也造成选择键位置变化太大,加重了人机交互的负担。
以上是我从事电脑工作以来接触的几种我熟悉的输入法,不知道对你能否有所帮助.
⑶ 如何用C语言解决一笔画问题,急
题目很简单,从算法上说,你只要判断每个点与其它的点连接的边数为偶数就可以了,如果满足这个条件,从任意点出发都可以,如果不满足,则不存在一笔画回路
算法如此,代码自己写了
相关数学理论,请google 七桥问题