php汉字匹配

发布时间: 2025-05-21 22:12:44

⑴ 如何解决php中文乱码问题

PHP中文乱码主要是编码不对，存在以下两种情况，你以此检查一下，改对编码就行了

1、 php文件本身的编码与网页的编码应匹配
a. 如果欲使用gb2312编码，那么php要输出头：header(“Content-Type: text/html; charset=gb2312")，静态页面添加<meta http-equiv="Content-Type" content="text/html; charset=gb2312">，所有文件的编码格式为ANSI，可用记事本打开，另存为选择编码为ANSI，覆盖源文件。

b. 如果欲使用utf-8编码，那么php要输出头：header(“Content-Type: text/html; charset=utf-8")，静态页面添加<meta http-equiv="Content-Type" content="text/html; charset=utf-8">，所有文件的编码格式为utf-8。保存为utf-8可能会有点麻烦，一般utf-8文件开头会有BOM，如果使用 session就会出问题，可用editplus来保存，在editplus中，工具->参数选择->文件->UTF-8签名，选择总是删除，再保存就可以去掉BOM信息了。

2. php本身不是Unicode的，所有substr之类的函数得改成mb_substr（需要装mbstring扩展）；或者用iconv转码。

⑵ 怎么用php正则获得a标签内的文字啊

php中正则匹配只要使用这两个函数：

preg_match_all

preg_match

这里使用preg_match_all，代码如下：

$subject='<ahref="xxx.php">abc测试</a>';//假设这是需要匹配的字符串

$pattern='/<ahref="[^"]*"[^>]*>(.*)</a>/';//这是匹配的正则表达式

preg_match_all($pattern,$subject,$matches);//开始匹配，该函数会把匹配结果放入$matches数组中


echo"<pre>";
print_r($matches);
/**
结果是：

Array
(
[0]=>Array
(
[0]=>abc测试
)

[1]=>Array
(
[0]=>abc测试
)

)

*/

⑶ 求PHP 的正则表达式大全

匹配中文字符的正则表达式： [\u4e00-\u9fa5] 评注：匹配中文还真是个头疼的事，有了这个表达式就好办了匹配双字节字符(包括汉字在内)：[^\x00-\xff] 评注：可以用来计算字符串的长度（一个双字节字符长度计2，ASCII字符计1）匹配空白行的正则表达式：\n\s*\r 评注：可以用来删除空白行匹配HTML标记的正则表达式：<(\S*?)[^>]*>.*?</\1>|<.*? /> 评注：网上流传的版本太糟糕，上面这个也仅仅能匹配部分，对于复杂的嵌套标记依旧无能为匹配首尾空白字符的正则表达式：^\s*|\s*$ 评注：可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等)，非常有用的表达式匹配Email地址的正则表达式：\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)* 评注：表单验证时很实用匹配网址URL的正则表达式：[a-zA-z]+://[^\s]* 评注：网上流传的版本功能很有限，上面这个基本可以满足需求匹配帐号是否合法(字母开头，允许5-16字节，允许字母数字下划线)：^[a-zA-Z][a-zA-Z0-9_]{4,15}$ 评注：表单验证时很实用匹配国内电话号码：\d{3}-\d{8}|\d{4}-\d{7} 评注：匹配形式如 0511-4405222 或 021-87888822 匹配腾讯QQ号：[1-9][0-9]{4,} 评注：腾讯QQ号从10000开始匹配中国邮政编码：[1-9]\d{5}(?!\d) 评注：中国邮政编码为6位数字匹配身份证：\d{15}|\d{18} 评注：中国的身份证为15位或18位匹配ip地址：\d+\.\d+\.\d+\.\d+ 评注：提取ip地址时有用匹配特定数字： ^[1-9]\d*$ //匹配正整数 ^-[1-9]\d*$ //匹配负整数 ^-?[1-9]\d*$ //匹配整数 ^[1-9]\d*|0$ //匹配非负整数（正整数 + 0） ^-[1-9]\d*|0$ //匹配非正整数（负整数 + 0） ^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$ //匹配正浮点数 ^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$ //匹配负浮点数 ^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$ //匹配浮点数 ^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$ //匹配非负浮点数（正浮点数 + 0） ^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$ //匹配非正浮点数（负浮点数 + 0）评注：处理大量数据时有用，具体应用时注意修正匹配特定字符串： ^[A-Za-z]+$ //匹配由26个英文字母组成的字符串 ^[A-Z]+$ //匹配由26个英文字母的大写组成的字符串 ^[a-z]+$ //匹配由26个英文字母的小写组成的字符串 ^[A-Za-z0-9]+$ //匹配由数字和26个英文字母组成的字符串 ^\w+$ //匹配由数字、26个英文字母或者下划线组成的字符串 /http:\/\/(.*)\//i //匹配外部链接地址

满意请采纳

⑷ 求一个PHP正则表达式匹配（字母、数字、汉字、下划线）

<?php


$pat='#^([a-zA-Z]+|[0-9]+|[x{4e00}-x{9fa5}]+)$#u';

$s="你好";

var_mp(preg_match($pat,$s));

⑸ PHP正则匹配汉字和半角逗号，开头和结尾禁止半角逗号、禁止连续两个半角逗号。自己没知道OK的，就不要答了

匹配汉字其实与编码有关系的，UTF8的正则与GBK的正则就会有差别。
我按你的要求改了一个在UTF-8编码下匹配的,但还没达到禁止连续两个半角逗号的要求。你可以先看看,看看有没有启发。
$str = "汉,中国,人,字";
if (preg_match("/^[^,][\x{4e00}-\x{9fa5},]+[^,]$/u",$str)) {
print("合法");
} else {
print("不合法");
}
============
如果未能解决两个半角逗号的问题，其他楼主也可以降低一下要求，分两次处理。第一次先替换掉双半解逗号为一个，再使用正则来匹配。
能解决问题是关键，方法可以再优化，对不？

⑹ php匹配中文文字，并给字符串的中文文字加粗

刚才参数写错了，现在应该可以了

<?php
$str = "中文123美丽abc开心。？我们";
$len=strlen($str);
for ($i=0;$i<$len;$i++)
{
if(ord(substr($str,$i, 1))>127)
{
$temp=substr($str, $i,2);
//输出粗体字，具体忘了，你可以查一下
echo "对";
$i++;
}
else
echo substr($str, $i,1);
}
?>

⑺ UTF-8正则表达式如何匹配汉字，utf-8正则表达式_PHP教程

判断输入内容是否含有违法字符，请看下面代码

$str = "编程";

if(!preg_match("/^[\x{4e00}-\x{9fa5}]+$/u",$str))

{

echo "您输入的[".$str."]含有违法字符";

}

else

{

echo "您输入的[".$str."]完全合法,通过!";

}

-----------------------

UTF-8匹配:在javascript中，要判断字符串是中文是很简单的。

比如：

代码如下:

var str = "php编程";

if (/^[\u4e00-\u9fa5]+$/.test(str))

{

alert("该字符串全部是中文");

}

else

{

alert("该字符串不全部是中文");

}

php中，是用\x表示十六进制数据的。

于是，变换成如下的代码：

代码如下:

$str = "php编程";

if (preg_match("/^[\x4e00-\x9fa5]+$/",$str))

{

print("该字符串全部是中文");

}

else

{

print("该字符串不全部是中文");

}

貌似不报错了，判断的结果也正确，不过把$str换成“编程”两字，结果却还是显示“该字符串不全部是中文”，看来这样的判断还是不够准确。

重要:

查阅了《精通正则表达式》发现,对于[\x4e00-\x9fa5]这块东西,自己做一个强化的解释php的正则中, [\x4e00-\x9fa5],其实就是字符和字符组的概念, \x{hex},表达一个16进制数, 需要注意的是hex 可以是1-2位的,也可以是4位的,但是如果是4位的必须加上大括号,同时,如果是大于x{FF}的hex,必须和u 修饰符连用,不然会非法出错

网上只能找到匹配全角字符的正则: ^[\x80-\xff]*^/ ,这里可以不加大括号 [\u4e00-\u9fa5]可以匹配中文,但是PHP又不支持不过，既然\x表示的十六进制数据，为什么和js里边提供的范围\x4e00-\x9fa5不一样呢？

于是我就换成了下边的代码,发现真的准确了：

代码如下:

$str = "php编程";

if (preg_match("/^[\x{4e00}-\x{9fa5}]+$/u",$str))

{

print("该字符串全部是中文");

}

else

{

print("该字符串不全部是中文");

}

知道了php中utf-8编码下用正则表达式匹配汉字的最终正确表达式——/^[\x{4e00}-\x{9fa5}]+$/u，参考以上文章写了如下一段测试代码(复制以下代码保存成.php文件)

<?php

$action = trim($_GET['action']);

if($action == "sub")

{

$str = $_POST['dir'];

if(!preg_match("/^[\x{4e00}-\x{9fa5}A-Za-z0-9_]+$/u",$str))

{

echo "您输入的[".$str."]含有违法字符";

}

else

{

echo "您输入的[".$str."]完全合法,通过!";

}

}

GBK:

代码如下:

preg_match("/^[".chr(0xa1)."-".chr(0xff)."A-Za-z0-9_]+$/",$str); //GB2312汉字字母数字下划线正则表达式

以上内容就是PHP中UTF-8正则表达式如何匹配汉字的全部内容，希望大家喜欢。

阅读全文

热点内容

java返回this 发布：2025-10-20 08:28:16 浏览：1160

制作脚本网站发布：2025-10-20 08:17:34 浏览：1430

python中的init方法发布：2025-10-20 08:17:33 浏览：1122

图案密码什么意思发布：2025-10-20 08:16:56 浏览：1302

怎么清理微信视频缓存发布：2025-10-20 08:12:37 浏览：1158

c语言编译器怎么看执行过程发布：2025-10-20 08:00:32 浏览：1514

邮箱如何填写发信服务器发布：2025-10-20 07:45:27 浏览：713

shell脚本入门案例发布：2025-10-20 07:44:45 浏览：625

怎么上传照片浏览上传发布：2025-10-20 07:44:03 浏览：1287

python股票数据获取发布：2025-10-20 07:39:44 浏览：1353

php汉字匹配

与php汉字匹配相关的资讯