重庆分公司,新征程启航
为企业提供网站建设、域名注册、服务器等服务
下面的语句可以找出重复的编码:
在霍邱等地区,都构建了全面的区域性战略布局,加强发展的系统性、市场前瞻性、产品创新能力,以专注、极致的服务理念,为客户提供做网站、成都网站制作 网站设计制作定制网站,公司网站建设,企业网站建设,成都品牌网站建设,网络营销推广,外贸网站制作,霍邱网站建设费用合理。
SELECT `编码`,count(*) from `表名` group by `编码` having count(*)1
注意执行的时候把`编码`和`表名`改为具体的名称,如果不是中文字段名和表名,就可以无需反单引号,千万别打成单引号,否则会报告语法错误的。
1.首先,题主应该选一个相似度的计算维度,比如content字段,type字段等;
2.其次,题主考虑一下各个字段的权重,比如type字段必须相同,则让type字段使用typeWeight(例如赋值0.8)作为乘积的因子,而content字段本身是比较长的,所以需要计算出一个hash值,比如使用特定算法计算出一个hash值,然后把这个hash值按照16进制计算得到10进制数,再给一个权重contentWeight(例如0.2),另外再选取一个字段,比如description描述字段,再给一个权重descriptionWeight...
3.最后得到一个当前插入到表中的记录综合hash,typeWeight(contentHashcontentWeight+descriptionHash*descriptionWeight
+...),可能会涉及到大整数计算,不过PHP有BCMATH扩展可以使用,最终得到一个数值的综合hash值,保存到数据库的一个字段中,这个东西就可以理解为本条记录的特征值。
在 Thinkphp 中有一个 find() 函数,这个函数只返回一条数据。你可以试试, select() 是返回所有的(如果不 limit 的话)