mysql 相关搜索_MySQL单词搜索相关度排名

一个单词搜索的相关度排名,这个例子演示了一个单词搜索的相关度排名计算。

mysql> CREATE TABLE articles (

-> id INT UNSIGNED AUTO_INCREMENT NOT NULL PRIMARY KEY,

-> title VARCHAR(200),

-> body TEXT,

-> FULLTEXT (title,body)

-> ) ENGINE=InnoDB;

Query OK, 0 rows affected (0.56 sec)

mysql> INSERT INTO articles (title,body) VALUES

-> ('MySQL Tutorial','This database tutorial ...'),

-> ("How To Use MySQL",'After you went through a ...'),

-> ('Optimizing Your Database','In this database tutorial ...'),

-> ('MySQL vs. YourSQL','When comparing databases ...'),

-> ('MySQL Security','When configured properly, MySQL ...'),

-> ('Database, Database, Database','database database database'),

-> ('1001 MySQL Tricks','1. Never run mysqld as root. 2. ...'),

-> ('MySQL Full-Text Indexes', 'MySQL fulltext indexes use a ..');

Query OK, 8 rows affected (0.02 sec)

Records: 8  Duplicates: 0  Warnings: 0

mysql> SELECT id, title, body, MATCH (title,body) AGAINST ('database' IN BOOLEAN MODE) AS score FROM articles ORDER BY score DESC;

+----+------------------------------+-------------------------------------+---------------------+

| id | title                        | body                                | score               |

+----+------------------------------+-------------------------------------+---------------------+

|  6 | Database, Database, Database | database database database          |  1.0886961221694946 |

|  3 | Optimizing Your Database     | In this database tutorial ...       | 0.36289870738983154 |

|  1 | MySQL Tutorial               | This database tutorial ...          | 0.18144935369491577 |

|  2 | How To Use MySQL             | After you went through a ...        |                   0 |

|  4 | MySQL vs. YourSQL            | When comparing databases ...        |                   0 |

|  5 | MySQL Security               | When configured properly, MySQL ... |                   0 |

|  7 | 1001 MySQL Tricks            | 1. Never run mysqld as root. 2. ... |                   0 |

|  8 | MySQL Full-Text Indexes      | MySQL fulltext indexes use a ..     |                   0 |

+----+------------------------------+-------------------------------------+---------------------+

8 rows in set (0.00 sec)

总共有8条记录,其中3条与数据库搜索词匹配。第一条记录(id 6)包含搜索词6次,相关度排名为1.0886961221694946。这个排名值计算使用TF的价值6(数据库搜索词出现6次记录id 6)和IDF值为0.42596873216370745,计算如下(8是记录的总数和3是包含搜索词的记录数量)

${IDF} = log10( 8 / 3 ) = 0.42596873216370745

mysql> select log10( 8 / 3 ) ;

+---------------------+

| log10( 8 / 3 )      |

+---------------------+

| 0.42596873216370745 |

+---------------------+

1 row in set (0.00 sec)

然后将TF和IDF值输入到排名公式中

${rank} = ${TF} * ${IDF} * ${IDF}

在MySQL命令行客户端执行计算将返回一个排名值1.088696164686938。

mysql> SELECT 6*log10(8/3)*log10(8/3);

+-------------------------+

| 6*log10(8/3)*log10(8/3) |

+-------------------------+

|       1.088696164686938 |

+-------------------------+

1 row in set (0.00 sec)

您可能会注意到SELECT ... MATCH ... AGAINST语句和MySQL命令行客户端所计算的排名值有差别(1.0886961221694946对1.088696164686938)。区别在于InnoDB内部是如何执行整数和浮点数/双精度类型转换的(以及相关的精度和四舍五的决定),以及它们在其他地方是如何执行的,比如在MySQL命令行客户端或其他类型的计算器中。

多词搜索的相关度排名

这个示例演示了基于前面示例中使用的articles表和数据计算多单词全文搜索的相关度排名。

如果你搜索的是一个以上的单词,那么相关度排名值就是每个单词相关度排名值的总和,如下公式所示:

${rank} = ${TF} * ${IDF} * ${IDF} + ${TF} * ${IDF} * ${IDF}

执行两个搜索词('mysql tutorial')搜索将返回以下结果:

mysql> SELECT id, title, body, MATCH (title,body) AGAINST ('mysql tutorial' IN BOOLEAN MODE) AS score FROM articles ORDER BY score DESC;

+----+------------------------------+-------------------------------------+----------------------+

| id | title                        | body                                | score                |

+----+------------------------------+-------------------------------------+----------------------+

|  1 | MySQL Tutorial               | This database tutorial ...          |   0.7405621409416199 |

|  3 | Optimizing Your Database     | In this database tutorial ...       |   0.3624762296676636 |

|  5 | MySQL Security               | When configured properly, MySQL ... | 0.031219376251101494 |

|  8 | MySQL Full-Text Indexes      | MySQL fulltext indexes use a ..     | 0.031219376251101494 |

|  2 | How To Use MySQL             | After you went through a ...        | 0.015609688125550747 |

|  4 | MySQL vs. YourSQL            | When comparing databases ...        | 0.015609688125550747 |

|  7 | 1001 MySQL Tricks            | 1. Never run mysqld as root. 2. ... | 0.015609688125550747 |

|  6 | Database, Database, Database | database database database          |                    0 |

+----+------------------------------+-------------------------------------+----------------------+

8 rows in set (0.00 sec)

在第一条记录(id 1)中,“mysql”出现一次,“tutorial”出现两次。“mysql”有六条匹配记录,“tutorial”有两条匹配记录。当将这些值插入到用于多个单词搜索的排名公式中时,MySQL命令行客户端返回预期的排名值

mysql> SELECT (1*log10(8/6)*log10(8/6)) + (2*log10(8/2)*log10(8/2));

+-------------------------------------------------------+

| (1*log10(8/6)*log10(8/6)) + (2*log10(8/2)*log10(8/2)) |

+-------------------------------------------------------+

|                                    0.7405621541938003 |

+-------------------------------------------------------+

1 row in set (0.00 sec)

与单个单词搜索一样,使用select ... match ... against语句和MySQL命令行工具执行的结果有差

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/530328.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

IDEA使用总结

idea中使用tomcat IntelliJ IDEA配置Tomcat(完整版图文教程)_猿Bug的博客-CSDN博客_intellij tomcat配置 用上面的方式发现缺少文件,在edit configuration页面选择before lanuch前选择Run maven goal package

mysql一直copying to tmp table_mysql提示Copying to tmp table on disk

网站运行的慢了,查找原因是Copying to tmp table on disk那怎么解决这个问题呢解决一例最近常常碰到网站慢的情况,登陆到后台,查询一下 /opt/mysql/bin/mysqladmin processlist;发现一个查询状态为: Copying to tmp table 而且此查…

idea cloud bootstrap是啥_application.yml与bootstrap.yml的区别

Spring Boot 默认支持 properties(.properties) 和 YAML(.yml .yaml ) 两种格式的配置文件,yml 和 properties 文件都属于配置文件,功能一样。Spring Cloud 构建于 Spring Boot 之上,在 Spring Boot 中有两种上下文,一种是 bootst…

python读取日期_从文件中读取日期和数据(Python)

我想从文件中读取时间字符串和数据,但是当我使用loadtxt时,我不能同时读取字符串和数字,因为字符串不是浮点型的。所以我尝试使用genfromtxt并使用delimiter[][][]作为我所拥有的列,但是字符串的读起来像nan。我希望像时间数组(da…

一个小白如何创建MYSQL数据表_MySQL小白扫盲(二)--建表、添加、查询

1.SELECT子句字句名称          使用目的select           确定结果集中应该包含哪些列from           指明所要提取数据的表,以及这些表示如何连接的where           过滤掉不需要的数据group by         用于…

元数据解决分表不可 mysql_MySQL InnoDB技术内幕:内存管理、事务和锁

前面有多篇文章介绍过MySQL InnoDB的相关知识,今天我们要更深入一些,看看它们的内部原理和机制是如何实现的。一、内存管理我们知道,MySQl是一个存储系统,数据最后都写在磁盘上。我们以前也提到过,磁盘的速度特别是大容…

navicat for mysql 13_Navicat for MySQL下载

Navicat for MySQL 是一套管理和开发 MySQL 或 MariaDB 的理想解决方案。它使你以单一程序同时连接到 MySQL 和 MariaDB。这个功能齐备的前端软件为数据库管理、开发和维护提供了直观而强大的图形界面。它提供了一组全面的工具给 MySQL 或MariaDB 新手,同时给专业人…

mysql 日期型中文报错_mysql日期类型默认值'0000-00-00' 报错,是什么问题?

如题,本来是 从另一个数据库中导出的sql文件,在我电脑上导入报这个错误,不知道是不是mysql 版本问题。多方搜索无果,所以上来求助。DROP TABLE IF EXISTS workreport_member;CREATE TABLE workreport_member (uid int(10) unsigne…

python在线作业_南开大学20春学期《Python编程基础》在线作业参考答案

南开大学20春学期(1709、1803、1809、1903、1909、2003)《Python编程基础》在线作业试卷总分:100 得分:98一、单选题(共20 道试题,共40 分)1.已知“stra\rb\r\nc\n”,则“str.splitlines()”的返回结果是( )。A.[a,b,c]B.[a\r,b\r\n,c\n]C.[a\r,b\r,c]D.[a\r,b,c]答案:A2.已知“…

spring兼容mysql_springboot 最新版本支持 mysql6.0.6吗

缥缈止盈1.首先在pom文件中加入下列依赖,一个使用jpa所需依赖,一个连接MySQL使用的依赖:mysqlmysql-connector-javaorg.springframework.bootspring-boot-starter-data-jpa 123456789102.在配置文件中添加datasource配置和jpa配置,在mysql中已经提前创建了一个名为db_test的数据…

java集合map_JAVA中的集合类Map、Set、List

*精炼的总结:Collection 是对象集合, Collection 有两个子接口 List 和 SetList 可以通过下标 (1,2..) 来取得值,值可以重复而 Set 只能通过游标来取值,并且值是不能重复的ArrayList , Vector , LinkedList…

java虚拟机内存监控_java虚拟机内存监控工具jps,jinfo,Jstack,jstat,jmap,jhat使用...

将会打印出很多jvm运行时参数信息,由于比较长这里不再打印出来,可以自己试试,内容一目了然Jstack(Stack Trace for Java):JVM堆栈跟踪工具jstack用于打印出给定的java进程ID或core file或远程调试服务的Java堆栈信息,如…

idea 调试java技巧_IDEA 调试Java代码的两个技巧

本文介绍两个使用IDEA 调试Java代码的两个技巧:修改变量值使用RuntimeException终止代码执行修改变量值在Java代码调试过程中,我们可以修改变量值,使其达到走指定分支的目的,或者使其满足某个条件。我们以给变量beanName赋值为例&…

java 10进制转 000x_java 如何把 00 转换成 0x00 或者 10 转换成 0x10

public static void main(String[] args) {String s "00000018A0010098C68E00989A690000000000BC614E000055AA55AA";System.out.println(s);byte[] b HexString2Bytes(s);System.out.println(Bytes2HexString(b));}/*** 将指定byte数组以16进制的形式打印到控制台*…

java免检异常_java-异常

java提供了异常处理机制:程序运行受阻时候的处理方式。1、异常分类Error:系统错误,由java虚拟机抛出,很少发生;免检异常RuntimeException:程序设计错误,通常由java虚拟机抛出;免检异…

java编程需要数学知识吗_初学Java编程,需要英语和数学基础吗?

原标题:初学Java编程,需要英语和数学基础吗?“学习Java编程英语和数学是必备条件吗?”很多Java零基础学习或者转型IT行业的都会有这样的疑问,其实刚开始学习Java编程是不需要太高深的数学和英语基础的。刚开始学习Java…

java map put报错_java 集合(Map)

-------------------|Map 储存的数据都是以键值对的形式,键不可重复,值可重复。----------------------------| HashMap----------------------------| TreeMap----------------------------| HashTableMap接口的方法:添加:put(K…

java简单数据结构_图解Java常用数据结构

最近在整理数据结构方面的知识, 系统化看了下 Java 中常用数据结构, 突发奇想用动画来绘制数据流转过程.主要基于 jdk8, 可能会有些特性与 jdk7 之前不相同, 例如 LinkedList LinkedHashMap 中的双向列表不再是回环的.HashMap 中的单链表是尾插, 而不是头插入等等, 后文不再赘叙…

jest java_✅使用jest进行测试驱动开发

前言本文将使用jest进行测试驱动开发的示例,源码在github。重点说明在开发中引入单元测试后开发过程,以及测试先行的开发思路。本文的重点是过程以及思维方法,框架以及用法不是重点。本文使用的编程语言是javascript,思路对其他语…

mysql sqlstate 08001_关于Toad连接DB2的sqlstate=08001错误

新装的centos6.3db29.7,数据库导入完了的之后用Toad连接访问之的时候出错了。DB2 Database Error: ERROR [08001] [IBM] SQL30081N A communication error has been detected. Communication protocol being used: "TCP/IP". Communication API being use…