转帖:Php比较字符串相似度函数的利用

admin 发表于 [PHP] 分类,标签: 编程技巧 PHP代码
0

做信息发布类网站的站长大多数要遇到很多用户发布一模一样的帖子,以增加自身信息的曝光率,而作为网站管理员来说,除了利用cookies、IP限制等技术外,我们还可以利用PHP自身带的similar_text函数来判断用户发帖内容的相似度。

similar_text() 函数计算两个字符串的匹配字符的数目,也可以计算两个字符串的相似度(以百分比计)。

啥话也不说了,看代码:

<?php
require('conn.php');
$sql="select title from content order by id desc limit 20"; //判断标题相似度
$result=mysql_query($sql,$conn);
$cf=0;
while($row=mysql_fetch_array($result)){
similar_text($row['title'], $title, $percent); //比较相似度 存放于$percent
if($percent>90){
$cf=1;
break;
} //注:相似度高于90% 则判断重复
}
if($cf==1){
echo "";
mysql_close();
exit();
}
?>

这段代码非常有用,其中title字段可以扩展成其他字段,如 content 字段,也一样的比较相似度。PHP的函数库太强大了。

发表我的评论