重庆分公司,新征程启航
为企业提供网站建设、域名注册、服务器等服务
这期内容当中小编将会给大家带来有关Postgresql 查询中的特异功能是什么,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。
创新互联公司基于成都重庆香港及美国等地区分布式IDC机房数据中心构建的电信大带宽,联通大带宽,移动大带宽,多线BGP大带宽租用,是为众多客户提供专业成都联通服务器托管报价,主机托管价格性价比高,为金融证券行业服务器托管,ai人工智能服务器托管提供bgp线路100M独享,G口带宽及机柜租用的专业成都idc公司。
本来上次是写过这个PostgreSQL 的功能的,但上次在一个论坛里面发现其实大家对这个功能认识上是有误区的,所示这次是的详细的一次文字。
功能很简单的就是模糊查询,类似 select * from table where column1 like ‘%PG牛逼%’;然后走一个靠谱的索引的查询,ORACLE 打死他都不行,当然可以走全文索引,那MySQL, SQL SERVER 人家也不干,人家也有这功能。
pg_trgm本身是不包含在PostgreSQL 的源码安装中的,当然是插件的方式安装,安装上是很简单的,具体请百度(弄湿了我可不管)
进入到你的数据库,create extension pg_trgm;就OK 了
我在论坛中发现的第一个问题,是说建立这样的模糊查询,仅仅建立btree 索引就可以了,但pg_trgm 只支持两种索引Gist and Gin, 这两种索引。(这可不是我说的,官方的白纸黑字)
所以说正确的针对一个列的索引,是要建立两个索引的,一个是BTREE 索引,一个是 GIN 或 Gist 索引,两种索引面对的“客户”是不同的。
那我们来看看到底他是怎么工作的
首先我们先生成一个表用来测试
创建一个存储过程用来插入测试数据
create or replace function data_produce(int) returns text as $$
declare
res text;
begin
if $1 >=1 then
select string_agg(chr(19968+(random()*20901)::int), '') into res from generate_series(1,$1);
return res;
end if;
return null;
end;
$$ language plpgsql strict;
insert into test_pg_trgm (search) select data_produce(20) from generate_series(1,1110000);
执行后生成我们本次要测试的数据10万条
下面我们创建索引了,创建GIN 索引
创建索引中系统报错,这是由于还没有创建相关的扩展
添加了这些扩展后我们就可以建立相关的索引
我们可以看到查询已经走了索引,并且查询时间1ms
那如果我们没有这个索引会怎么样,这条语句慢了 48倍并且只能和ORACLE SQL SERVER , MYSQL一样走了全表扫描。
OK 如果已经体会到了PG 在模糊查询中的厉害之处,群里有人问的第二个问题是 GIN VS GIST 那种索引更好
这也是一个热门的问题?
下面也做一个测试,(但不证明GIN 比 GIST 性能强),我们建立一个gist的索引,也提通过查询来进行模糊方式的查询
图中的时间 12ms ,比全表扫描快了4倍,比GIN 慢了12倍
当然这里并不是说 GIST 不如GIN ,具体的索引有不同的使用场景。(做人办事都的客观)
最后,我们来证明一下,普通的运算方式对于GIST GIN 索引是无效的,所以我们对某个字段必须建立两个索引 BTREE AND GIST OR GIN。
下图整体的证明了上面的立论。这里就不解释了
上述就是小编为大家分享的Postgresql 查询中的特异功能是什么了,如果刚好有类似的疑惑,不妨参照上述分析进行理解。如果想知道更多相关知识,欢迎关注创新互联行业资讯频道。