.netcore的Lucene.Net基础应用

news/2025/9/20 16:09:07/文章来源:https://www.cnblogs.com/alexliuzw/p/19102500

最近研究了一下使用.netcore的Lucene.Net应用,整理一下研究内容。

一、研究原因

1、系统环境:多终端、多服务、达梦数据库8、.netcore7.0、多机负载。

2、业务数量:单表1000万条数据,有7张的业务表或功能表有千万数据。

3、问题描述:业务表的字段较多,后台管理系统上,对数据查询的准确度与速度有要求,查询的组合字段较多,数据表上创建的索引无法完全覆盖所有的组合情况。


 

二、预期目标

1、有效提高查询速度。

2、持久化数据库与索引库保持一致。

3、减少对当前系统结构的影响,尽量降低改造的工作量。

4、可以进行索引库的数据量、待入索引库的数据、索引库查询速度等监控。


 

三、应用结构

1、因索引库只能单线程写入,可以多线程查询,所以在系统外新增索引写入服务,使多业务并发的状态形成单线程处理,根据业务表的类型,可以创建多个线程存入不同的索引库,同一索引库只有一个服务写入。

2、数据库增加触发器,当业务表增、删、改的时候,自动将业务表ID的操作存入队列表,使用触发器的方式避免多终端多服务的数据处置,保证业务表和索引库的数据一致。


 

四、实验结果

1、使用存储不分词索引导入1000万数据索引,检测多组合查询速度为1秒内。

2、业务表数据和索引库的数据可以保持一致。


 

五、代码样例

1、添加NuGet

1、达梦数据库 FreeSql.Provider.Dameng 3.5.213
2、索引 Lucene.Net 3.0.3
3、配置 System.Configuration.ConfigurationManager 9.0.9

2、写入索引库

using Lucene.Net.Analysis;
using Lucene.Net.Analysis.Standard;
using Lucene.Net.Documents;
using Lucene.Net.Index;
using Lucene.Net.Store;
using Lucene.Net.Util;
using System;
using System.Collections.Generic;
using System.Data;
using System.Data.Common;
using System.IO;
using System.Reflection.Metadata;
using System.Data;
using Dm;
using static FreeSql.Internal.GlobalFilter;
using Lucene.Net.Search;
using Lucene.Net.QueryParsers;
using System.Runtime.ConstrainedExecution;
using System.Reflection.PortableExecutable;class Program
{static void Main(string[] args){Analyzer analyzer = null;IndexWriter writer = null;Lucene.Net.Store.Directory indexDirectory = null;try{indexDirectory = FSDirectory.Open(new System.IO.DirectoryInfo("D:\\LuceneIndex"));analyzer = new StandardAnalyzer(Lucene.Net.Util.Version.LUCENE_30);bool iscreate = !Lucene.Net.Index.IndexReader.IndexExists(indexDirectory);writer = new IndexWriter(indexDirectory, analyzer, iscreate, IndexWriter.MaxFieldLength.UNLIMITED);string connectionString = "Server=LOCALHOST;Database=SYSDBA;User Id=SYSDBA;Password=123456;";using (DmConnection connection = new DmConnection(connectionString)){connection.Open();using (DmCommand command = new DmCommand("SELECT reg_id,reg_name,reg_sex,reg_datetime,reg_status FROM reg_infor", connection)){using (DmDataAdapter adapter = new DmDataAdapter(command)){DataTable table = new DataTable();adapter.Fill(table);int i = 0;foreach (DataRow row in table.Rows){i++;Lucene.Net.Documents.Document doc = new Lucene.Net.Documents.Document();doc.Add(new Field("reg_id", row["reg_id"].ToString(), Field.Store.YES, Field.Index.NOT_ANALYZED));//存储,不分词索引doc.Add(new Field("reg_name", row["reg_name"].ToString(), Field.Store.YES, Field.Index.NOT_ANALYZED));//存储,不分词索引doc.Add(new Field("reg_sex", row["reg_sex"].ToString(), Field.Store.YES, Field.Index.NOT_ANALYZED));//存储,分词索引doc.Add(new Field("reg_datetime", row["reg_datetime"].ToString(), Field.Store.YES, Field.Index.NOT_ANALYZED));//存储,分词索引doc.Add(new Field("reg_status", row["reg_status"].ToString(), Field.Store.YES, Field.Index.NOT_ANALYZED));writer.AddDocument(doc);writer.Commit();//.Optimize();
                        }}}connection.Close();}}catch (Exception ex){throw;}finally{if (analyzer != null)analyzer.Close();if (writer != null)writer.Dispose();//之前为:writer.Close();if (indexDirectory != null)indexDirectory.Dispose();//之前使用Close();
        }Console.WriteLine("索引创建成功!");Console.ReadLine();}
}

3、数据查询

using Lucene.Net.Analysis;
using Lucene.Net.Analysis.Standard;
using Lucene.Net.Documents;
using Lucene.Net.Index;
using Lucene.Net.Store;
using Lucene.Net.Util;
using System;
using System.Collections.Generic;
using System.Data;
using System.Data.Common;
using System.IO;
using System.Reflection.Metadata;
using System.Data;
using Dm;
using static FreeSql.Internal.GlobalFilter;
using Lucene.Net.Search;
using Lucene.Net.QueryParsers;
using System.Runtime.ConstrainedExecution;
using System.Reflection.PortableExecutable;class Program
{static void Main(string[] args){Analyzer analyzer = null;IndexWriter writer = null;Lucene.Net.Store.Directory indexDirectory = null;try{indexDirectory = FSDirectory.Open(new System.IO.DirectoryInfo("D:\\LuceneIndex"));analyzer = new StandardAnalyzer(Lucene.Net.Util.Version.LUCENE_30);var directory = FSDirectory.Open("D:\\LuceneIndex");var reader = DirectoryReader.Open(directory, true);var searcher = new IndexSearcher(reader);int numDocs = reader.NumDocs();
var booleanQuery = new BooleanQuery();booleanQuery.Add(new TermQuery(new Term("reg_status", "1")), Occur.MUST);booleanQuery.Add(new TermQuery(new Term("reg_sex", "1")), Occur.MUST);var hits = searcher.Search(booleanQuery, 10);foreach (var hit in hits.ScoreDocs){var doc = searcher.Doc(hit.Doc);Console.WriteLine($"ID: {doc.Get("reg_id")}, Name: {doc.Get("reg_name")}");}}catch (Exception ex){throw;}finally{if (analyzer != null)analyzer.Close();if (writer != null)writer.Dispose();//之前为:writer.Close();if (indexDirectory != null)indexDirectory.Dispose();//之前使用Close();
        }Console.WriteLine("索引查询成功!");Console.ReadLine();}
}

4、触发器

---新增数据触发器---
CREATE TRIGGER trg_after_insert_reginfor AFTER INSERT ON reg_infor FOR EACH ROW BEGINinsert into SYSDBA.ACTION_LOG(
"LOG_ID", "BIN_ID", "ACTION_TYPE", "ACTION_STATUS", "CREATE_TIME", "ACTION_TIME") VALUES (REPLACE(SYS_GUID(), '-', ''),NEW."reg_id", 1, 0,TO_CHAR(SYSDATE, 'YYYY-MM-DD HH24:MI:SS'),''); END;
---修改数据触发器---
CREATE TRIGGER trg_after_update_reginfor AFTER UPDATE ON reg_infor FOR EACH ROW BEGINinsert into SYSDBA.ACTION_LOG(
"LOG_ID", "BIN_ID", "ACTION_TYPE", "ACTION_STATUS", "CREATE_TIME", "ACTION_TIME") VALUES (REPLACE(SYS_GUID(), '-', ''),NEW."reg_id", 2, 0,TO_CHAR(SYSDATE, 'YYYY-MM-DD HH24:MI:SS'),''); END;

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/908429.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

rook-ceph CRD资源配置时效困难

rook-ceph CRD资源配置时效困难2025-09-20 16:05 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !importa…

实用指南:conda常见问题

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

关于1200模拟量输入滤波的问题

参考:为什么使用S7-1200模拟量输入模块时接收到变动很大的不稳定的值?unstable 参考:关于模拟量输入滤波的问题-SIMATIC S7-1500系列-找答案-西门子中国滤波周期设置和模拟量输入反馈速率有关!!! 调整为无时,可…

在Ubuntu 16.04上安装openjdk-6/7/8-jdk的步骤

由于Ubuntu 16.04的标准库可能不包含更早版本的OpenJDK,你可能需要添加额外的存储库或者下载特定的安装包。对于OpenJDK的这些旧版本,你可以使用Third-party PPA(个人软件包归档),或者从OpenJDK档案站点下载相应的…

物流行业信息咨询智能问答系统

物流行业信息咨询智能问答系统2025-09-20 15:58 dribs 阅读(0) 评论(0) 收藏 举报背景 练手rag项目 LLM都是基于过去的经验数据进行训练完成;无法处理获取实时的信息,需结合RAG实现;处理私域的数据 流程原理项目…

插座(SOCKET)

程序用来“上网说话”的工具。1:什么是套接字? 应用程序与网络协议栈之间进行数据收发的编程接口(API) 2.如何理解? 应用程序需要套接字才能接入网络,与其他计算机上的程序进行通信(插座---->电器需要插入插…

线性代数 行列式 | 子式 / 主子式 / 顺序主子式 / 余子式 / 代数余子式 - 教程

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

Red Hat 8.5.0-18 部署ceph文件系统 - 实践

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

kettle从入门到精通 第108课 ETL之kettle 国产麒麟系统安装kettle教程

场景:最近vip群小伙伴在国产麒麟系统安装kettle时遇到无法正常启动的问题,今天周末远程连麦小伙伴一起解决此问题,梳理成章,方便后续小伙伴。 1、报错信息 国产麒麟系统安装kettle时遇到无法正常启动,提示错误信息…

部署 Squid 代理服务

安装 Squid: sudo apt install squid编辑配置文件: sudoedit /etc/squid/squid.confhttp_port 3128启动 Squid 服务 sudo systemctl start squid sudo systemctl enable squid

k8s--etcd - 详解

k8s--etcd - 详解pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Cou…

HBase 的自带命令行工具 hbase shell 的基本使用

1. 进入 HBase Shell 首先,通过以下命令连接到您的 HBase 集群命令行界面: hbase shell 连接成功后,提示符会变为 hbase(main):001:0>,表示您已经可以在里面执行 HBase 专属命令了。 2. 查看集群状态和表列表(…

市场交易反心理特征之一:太过完美而不敢买入

市场交易的最大特点就是“反心理”性。经常盘后看起来非常简单的事情,在盘前、盘中都会变得莫名复杂。明明盘前根据自己的交易策略可以轻松选出的牛股,开盘后没买,买了另一个,结果牛股涨停,买的票要么下跌,要么不…

3peak DCDC转换芯片选型列表

Part Number Subcategory VIN (V) Output (V) Max Output Current (A) PackageTPE15017 以太网供电 24~57 / / QFN3X4-19TPM1525 功率级DrMOS 7~140 / 1 SOP8TPM6501 隔离电源 2.5~25 / 1 SOT23-5TPM6501Q 隔离电源 2.…

重塑公司绩效管理的 6 种方法

有远见的公司开始了解绩效管理的真正潜力。通过将传统绩效管理转变为持续绩效管理——建立在定期签到、持续反馈和认可时刻的基础上——公司可以通过让员工发挥最大潜力来优化绩效。 1、通过真实和积极的文化建立信任基…

详细介绍:从“下山”到AI引擎:全面理解梯度下降(上)

详细介绍:从“下山”到AI引擎:全面理解梯度下降(上)pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas&…

flask下的MySQL增删改查

flask下的MySQL增删配置 添加数据 @app.route(/add) def add_data():u = UserInfo()new_user1 = UserInfo(nickname=flask_test1, mobile=13888888888, signature=理想, create_time=datetime.now(), role_id=1)new_us…

tips图解数组名与指针的关系

在图解前需要先了解一下数组退化为指针的相关内容,下面先陈述数组退化为指针的概念、本质、以及什么情况下数组会退化为指针,什么情况下不会 概念定义 "数组名退化为指针"是C/C++语言中的一个重要特性,指…

Confluent-Kafka-go 发布超过 1M 消息失败困难克服

Confluent-Kafka-go 发布超过 1M 消息失败困难克服2025-09-20 15:34 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; displ…

mysql查看数据库大小,可以通过查询系统表来实现

要查看 MySQL 数据库的大小,可以通过查询系统表 information_schema.tables 来实现,以下是具体方法:查看所有数据库的大小 sql SELECT table_schema AS 数据库名, ROUND(SUM(data_length + index_length) / 1024 / …