Python 连接clickhouse常用的三种方式

1. 概述

ClickHouse是一个开源的分布式列式数据库管理系统,它被设计用于存储和分析大规模数据。Python是一种流行的编程语言,凭借其简洁的语法和丰富的生态系统,成为了数据处理和分析的首选语言之一。在Python中,我们可以使用多种方式与ClickHouse进行连接并操作数据。

本文将详细介绍Python连接ClickHouse的三种常用方式,分别是使用clickhouse-driver、clickhouse-sqlalchemy和pyclickhouse库。每种方式都有其特点和适用场景,可以根据具体需求选择合适的方法。

2. 使用clickhouse-driver

clickhouse-driver是一个Python用于连接ClickHouse的官方驱动程序。它提供了高效的连接池和数据序列化等功能,并且支持大多数ClickHouse的特性和API。

2.1 安装clickhouse-driver

要使用clickhouse-driver,首先需要安装它。可以使用pip命令进行安装:

pip install clickhouse-driver

2.2 创建连接

在使用clickhouse-driver连接ClickHouse之前,首先需要创建一个连接对象。可以使用clickhouse_driver包中的connect函数来创建连接。以下是一个示例:

import clickhouse_driverconn = clickhouse_driver.connect(host='localhost',port=9000,user='default',password='',database='default'
)

Python

Copy

上述代码中,我们使用connect函数创建了一个名为conn的连接对象。其中,host参数指定ClickHouse的主机名,port参数指定端口号,user和password参数指定连接的用户名和密码,database参数指定使用的数据库名。

2.3 执行查询

一旦建立连接,就可以使用连接对象执行查询语句了。clickhouse-driver提供了execute函数来执行查询,并返回查询结果。以下是一个示例:

result = conn.execute('SELECT * FROM my_table')

Python

Copy

上述代码中,我们执行了一个简单的SELECT查询,查询了名为my_table的表中的所有数据。查询结果将保存在result对象中。

2.4 插入数据

除了查询,我们还可以使用clickhouse-driver插入数据到ClickHouse中。clickhouse-driver提供了execute函数来执行插入操作。以下是一个示例:

conn.execute('INSERT INTO my_table (col1, col2) VALUES (1, 2)')

Python

Copy

上述代码中,我们在名为my_table的表中插入了一行数据,其中col1和col2是表中的两个列名。

2.5 关闭连接

在完成操作后,我们应该关闭连接以释放资源。可以使用连接对象的close方法来关闭连接。

conn.close()

Python

Copy

3. 使用clickhouse-sqlalchemy

clickhouse-sqlalchemy是一个基于SQLAlchemy的ClickHouse数据库连接库。SQLAlchemy是一个Python SQL工具和对象关系映射(ORM)库,用于简化数据库操作。

3.1 安装clickhouse-sqlalchemy

要使用clickhouse-sqlalchemy,首先需要安装它。可以使用pip命令进行安装:

pip install clickhouse-sqlalchemy

3.2 创建连接

在使用clickhouse-sqlalchemy连接ClickHouse之前,首先需要创建一个连接对象。以下是一个示例:

from clickhouse_sqlalchemy import make_session, get_declarative_basesession = make_session('clickhouse://default:@localhost:9000')
Base = get_declarative_base(bind=session)

Python

Copy

上述代码中,我们使用make_session函数创建了一个名为session的连接对象,使用get_declarative_base函数创建了一个名为Base的基类。其中,clickhouse://default:@localhost:9000是连接字符串,指定ClickHouse的主机名、端口号、用户名和密码。

3.3 执行查询

一旦建立连接,就可以使用连接对象执行查询语句了。clickhouse-sqlalchemy提供了session对象的query方法来执行查询,并返回查询结果。以下是一个示例:

result = session.query(MyTable).all()

Python

上述代码中,我们执行了一个简单的SELECT查询,查询了名为MyTable的表中的所有数据。查询结果将保存在result对象中。

3.4 插入数据

除了查询,我们还可以使用clickhouse-sqlalchemy插入数据到ClickHouse中。clickhouse-sqlalchemy提供了session对象的add方法来执行插入操作。以下是一个示例:

new_record = MyTable(col1=1, col2=2)
session.add(new_record)
session.commit()

Python

上述代码中,我们创建了一个名为new_record的对象,并使用session对象的add方法将其添加到会话中,然后使用commit方法提交更改。

3.5 关闭连接

在完成操作后,我们应该关闭连接。可以使用连接对象的close方法来关闭连接。

session.close()

Python

Copy

4. 使用pyclickhouse

pyclickhouse是一个纯Python编写的ClickHouse客户端库,它提供了简单的API和高度可定制的功能。

4.1 安装pyclickhouse

要使用pyclickhouse,首先需要安装它。可以使用pip命令进行安装:

pip install pyclickhouse

4.2 创建连接

在使用pyclickhouse连接ClickHouse之前,首先需要创建一个连接对象。以下是一个示例:

from pyclickhouse import Clientclient = Client(host='localhost',port=9000,user='default',password='',database='default'
)

Python

Copy

上述代码中,我们使用Client类创建了一个名为client的连接对象。其中,host参数指定ClickHouse的主机名,port参数指定端口号,user和password参数指定连接的用户名和密码,database参数指定使用的数据库名。

4.3 执行查询

一旦建立连接,就可以使用连接对象执行查询语句了。pyclickhouse提供了execute方法来执行查询,并返回查询结果。以下是一个示例:

result = client.execute('SELECT * FROM my_table')

Python

Copy

上述代码中,我们执行了一个简单的SELECT查询,查询了名为my_table的表中的所有数据。查询结果将保存在result对象中。

4.4 插入数据

除了查询,我们还可以使用pyclickhouse插入数据到ClickHouse中。pyclickhouse提供了insert方法来执行插入操作。以下是一个示例:

client.insert('my_table',[{'col1': 1, 'col2': 2}, {'col1': 3, 'col2': 4}],structure=['col1', 'col2'])

Python

Copy

上述代码中,我们在名为my_table的表中插入了两行数据,数据以字典的形式表示。

4.5 关闭连接

在完成操作后,我们应该关闭连接。可以使用连接对象的disconnect方法来关闭连接。

client.disconnect()

Python

Copy

5. 总结

以上是Python连接ClickHouse常用的三种方式,分别是使用clickhouse-driver、clickhouse-sqlalchemy和pyclickhouse。

6、python pandas.DataFrame 直接写入Clickhouse

 由于dataframe读取和存储数据的效率很高。使用客户端方式批量入库。

client.execute("insert into table values", df.values.tolist()
)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/857460.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Ubuntu24使用kubeadm部署高可用K8S集群

Ubuntu24使用kubeadm部署高可用K8S集群 使用kubeadm部署一个k8s集群,3个master1个worker节点。 1. 环境信息 操作系统:ubuntu24.04内存: 2GBCPU: 2网络: 能够互访,能够访问互联网 hostnameip备注k8s-master1192.168.0.51master1k8s-maste…

20.Cargo和Crates.io

标题 一、采用发布配置自定义构建1.1 默认配置1.2 修改配置项 二、将crate发布到Crates.io2.1 编写文档注释2.2 常用(文档注释)部分2.3 文档注释作用测试2.4 为包含注释的项添加文档注释2.5 使用pub use导出公有API2.6 创建Crates.io账号2.7 发布2.8 版本…

【Flutter】基础教程:从安装到发布

Flutter 是一种流行的开源移动应用开发框架,由 Google 开发,可用于构建高性能、跨平台的移动应用。本教程将带领你从安装 Flutter 开发环境开始,一步步完成第一个程序,并介绍如何将应用发布到各个平台上。 跨端原理的关键点包括&a…

基于STM32的智能停车场管理系统

目录 引言环境准备智能停车场管理系统基础代码实现:实现智能停车场管理系统 4.1 车位检测模块4.2 数据处理与分析4.3 控制系统实现4.4 用户界面与数据可视化应用场景:智能停车场管理与优化问题解决方案与优化收尾与总结 1. 引言 智能停车场管理系统通…

Linux常用命令(17)—pastesortcomm命令(有相关截图)

写在前面: 最近在学习Linux命令,记录一下学习Linux常用命令的过程,方便以后复习。仅供参考,若有不当的地方,恳请指正。如果对你有帮助,欢迎点赞,关注,收藏,评论&#xf…

kotlin空类型安全 !! ?. ?:

1、定义可空类型 fun main(){// 定义可空类型var x:String? "hello"x null } 2、!! 强转类型 定义可空类型之后,如果使用其内置方法,编译不会通过,因为值有可能为null,可以使用 !! 把类型强转为不可空&#xff1a…

仿中波本振电路的LC振荡器电路实验

手里正好有一套中波收音机套件的中周。用它来测试一下LC振荡器,电路如下: 用的是两只中频放大的中周,初步测试是用的中周自带的瓷管电容,他们应该都是谐振在465k附近。后续测试再更换电容测试。 静态电流,0.5到1mA。下…

malloc和new的本质区别

目录 一、结论 二、示例 1.实现类T 2.用malloc分配类T的内存空间 3.用new分配类T的内存空间 一、结论 malloc 和 new 都是用于在运行时动态分配内存的机制。但它们之间存在一些本质的区别,主要是在使用方面,现在我们直接说结论,然后在通过…

第5天:函数

学习目标 理解函数的基本概念和作用掌握函数的定义和调用学习参数传递和返回值了解作用域的概念 学习内容 1. 函数的基本概念 函数是组织代码的基本方式,它将一组逻辑相关的操作封装在一起,通过函数名调用函数,可以使代码更简洁、更易读和…

ArcGIS与Excel分区汇总统计三调各地类面积!数据透视表与汇总统计!

​ 点击下方全系列课程学习 点击学习—>ArcGIS全系列实战视频教程——9个单一课程组合系列直播回放 点击学习——>遥感影像综合处理4大遥感软件ArcGISENVIErdaseCognition 01 需求说明 介绍一下ArcGIS与Excel统计分区各地类的三调地类面积。 ArcGIS统计分析不会&#x…

Unity客户端的Http通讯实战

背景知识 在Unity游戏开发中,一个常见场景是,后端扔过来一个Swagger后端接口网页,需要你使用对应的接口对应的接口发送和接收数据,如图所示为发起Get请求: 我们可以通过点击Try it out按钮直接在网页上测试收发数据&a…

spring整合openAI大模型之Spring AI

文章目录 一、SpringAI简介1.什么是SpringAI2.SpringAI支持的大模型类型(1)聊天模型(2)文本到图像模型(3)转录(音频到文本)模型(4)嵌入模型(5&…

Guava-EventBus 源码解析

EventBus 采用发布订阅者模式的实现方式,它实现了泛化的注册方法以及泛化的方法调用,另外还考虑到了多线程的问题,对多线程使用时做了一些优化,观察者模式都比较熟悉,这里会简单介绍一下,重点介绍的是如何泛化的进行方法的注册以及…

建筑工程八大员标准员题库附答案

一、单选题(在每小题列出的四个选项中,只有一个最符合题目要求的选项) 1、【单选题】( )适用于处理较厚软土和冲填土地基,多用于处理机场跑道、水工结构、道路、路堤、码头、岸坡等工程地基,对于泥炭等有机质沉积地基则不适用。(B) A、换土垫层法 B、预压法 C、灰…

dial tcp 10.96.0.1:443: connect: no route to host

1、创建Pod一直不成功,执行kubectl describe pod runtime-java-c8b465b98-47m82 查看报错 Warning FailedCreatePodSandBox 2m17s kubelet Failed to create pod sandbox: rpc error: code Unknown desc failed to setup network for…

数据挖掘与分析——数据预处理

数据探索 波士顿房价数据集:卡内基梅隆大学收集,StatLib库,1978年,涵盖了麻省波士顿的506个不同郊区的房屋数据。 一共含有506条数据。每条数据14个字段,包含13个属性,和一个房价的平均值。 数据读取方法…

使用STL容器还是Qt容器?

在C编程中,选择合适的容器库对于编写高效、可维护的代码至关重要。两大主流选择是STL容器(如std::map,std::vector等)和Qt容器(如QMap,QVector等)。本文将探讨两者的优缺点,以帮助开…

IMU预积分学习记录

参考资料: https://gutsgwh1997.github.io/2020/05/01/IMU%E9%A2%84%E7%A7%AF%E5%88%86-%E4%B8%80/ https://www.cnblogs.com/weihao-ysgs/p/IMU-Pre-Integration.html https://blog.csdn.net/weixin_51547017/article/details/122136427

昨天gitee网站访问不了,开始以为电脑哪里有问题了

昨天gitee网站下午访问不了,开始以为是什么毛病。 结果同样的网络,手机是可以访问的。 当然就ping www.gitee.com 结果也下面那样是正常的 以为是好的,但就是访问www.gitee.com也是不行,后来用阿里云的服务器curl访问是下面情况&…

推荐3个高级设计师都在用的小众网站,效果贼拉炫酷

今天给大家推荐三个可以提升设计质感的网站,效果贼拉炫酷。 第一个:Gradientor 这是一个在线生成渐变图片的网站,只需在上面上传SVG格式的图片,画布就能根据图片内容自动生成渐变效果,也可以在画布里用鼠标直接绘制&…