当前位置：网站首页 > 技术文章 > 正文

教你使用Python玩转MySQL数据库，大数据导入不再是难题!

ccwgpt 2024-11-26 01:04 52 浏览 0 评论

数据分析离不开数据库，如何使用python连接MySQL数据库，并进行增删改查操作呢？

我们还会遇到需要将大批量数据导入数据库的情况，又该如何使用Python进行大数据的高效导入呢？

本文会一一讲解，并配合代码和实例。

一、背景

我是在Anaconda notebook中进行连接实验的，环境Python3.6，当然也可以在Python Shell里面进行操作。

最常用也最稳定的用于连接MySQL数据库的python库是PyMySQL。

所以本文讨论的是利用PyMySQL连接MySQL数据库，进行增删改查操作，以及存储大批量数据。

方法参考PyMySQL官方文档和《python数据采集》关于数据存储的部分。

欢迎大家去阅读原文档，相信会理解的更加透彻。

二、基本操作

1、安装PyMySQL库

最简单的方式：在命令行输入 pip install pymysql

或者：下载whl文件[1]进行安装，安装过程自行百度。

2、安装MySQL数据库

类MySQL数据库有两种：MySQL和MariaDB，我用的是后者MariaDB。

两者在绝大部分性能上是兼容的，使用起来感觉不到啥区别。

给出下载地址：MySQL[2]，MariaDB[3]，安装过程很简单，一路Next Step，不过要记好密码。

有个小插曲，MySQL和MariaDB相当于姐姐妹妹的关系，两者由同一个人（Widenius）创建的。MySQL被Oracle收购后，Widenius先生觉得不爽，于是搞了个MariaDB，可以完全替代MySQL。大牛就是任性。

3、SQL基本语法

下面要用SQL的表创建、查询、数据插入等功能，这里简要介绍一下SQL语言的基本语句。

查看数据库：SHOW DATABASES；
创建数据库：CREATE DATEBASE 数据库名称；
使用数据库：USE 数据库名称；
查看数据表：SHOW TABLES；
创建数据表：CREATE TABLE 表名称（列名1 （数据类型1），列名2 （数据类型2））；
插入数据：INSERT INTO 表名称（列名1，列名2） VALUES（数据1，数据2）；
查看数据：SELECT * FROM 表名称；
更新数据：UPDATE 表名称 SET 列名1=新数据1，列名2=新数据2 WHERE 某列=某数据；

4、连接数据库

安装好必要得文件和库后，接下来正式开始连接数据库吧，虽然神秘却不难哦！

#首先导入PyMySQL库
import pymysql
#连接数据库，创建连接对象connection
#连接对象作用是：连接数据库、发送数据库信息、处理回滚操作（查询中断时，数据库回到最初状态）、创建新的光标对象
connection = pymysql.connect(host = 'localhost' #host属性
                             user = 'root' #用户名 
                             password = '******'  #此处填登录数据库的密码
                             db = 'mysql' #数据库名
                             )

执行这段代码就连接好了！

5、增删改查操作

首先来查看一下有哪些数据库：

#创建光标对象，一个连接可以有很多光标，一个光标跟踪一种数据状态。
#光标对象作用是：、创建、删除、写入、查询等等
cur = connection.cursor()
#查看有哪些数据库，通过cur.fetchall()获取查询所有结果
print(cur.fetchall())

打印出所有数据库：

(('information_schema',),
('law',),
('mysql',),
('performance_schema',),
('test',))

在test数据库里创建表:

#使用数据库test
cur.execute('USE test')
#在test数据库里创建表student，有name列和age列
cur.execute('CREATE TABLE student(name VARCHAR(20),age TINYINT(3))')

向数据表student中插入一条数据：

sql = 'INSERT INTO student (name,age) VALUES (%s,%s)'
cur.execute(sql,('XiaoMing',23))

查看数据表student内容：

cur.execute('SELECT * FROM student')
print(cur.fetchone())

打印输出为：('XiaoMing', 23)

Bingo！是我们刚刚插入的一条数据

最后，要记得关闭光标和连接：

#关闭连接对象，否则会导致连接泄漏，消耗数据库资源
connection.close()
#关闭光标
cur.close()

OK了，整个流程大致如此。

当然这里都是很基础的操作，更多的使用方法需要在PyMySQL官方文档[4]里去寻找。

三、导入大数据文件

以csv文件为例，csv文件导入数据库一般有两种方法：

1、通过SQL的insert方法一条一条导入，适合数据量小的CSV文件，这里不做赘述。

２、通过load data方法导入，速度快，适合大数据文件，也是本文的重点。

样本CSV文件如下：

总体工作分为3步：

1、用python连接mysql数据库；

2、基于CSV文件表格字段创建表；

3、使用load data方法导入CSV文件内容。

sql的load data语法简介：

LOAD DATA LOCAL INFILE 'csv_file_path' INTO TABLE table_name FIELDS TERMINATED BY ',' LINES TERMINATED BY '\\r\\n' IGNORE 1 LINES

csv_file_path 指文件绝对路径 table_name指表名称 FIELDS TERMINATED BY ','指以逗号分隔 LINES TERMINATED BY '\\r\\n'指换行 IGNORE 1 LINES指跳过第一行，因为第一行是表的字段名

下面给出全部代码：

#导入pymysql方法
import pymysql


#连接数据库
config = {'host':'',
          'port':3306,
          'user':'username',
          'passwd':'password',
          'charset':'utf8mb4',
          'local_infile':1
          }
conn = pymysql.connect(**config)
cur = conn.cursor()


#load_csv函数，参数分别为csv文件路径，表名称，数据库名称
def load_csv(csv_file_path,table_name,database='evdata'):
    #打开csv文件
    file = open(csv_file_path, 'r',encoding='utf-8')
    #读取csv文件第一行字段名，创建表
    reader = file.readline()
    b = reader.split(',')
    colum = ''
    for a in b:
        colum = colum + a + ' varchar(255),'
    colum = colum[:-1]
    #编写sql，create_sql负责创建表，data_sql负责导入数据
    create_sql = 'create table if not exists ' + table_name + ' ' + '(' + colum + ')' + ' DEFAULT CHARSET=utf8'
    data_sql = "LOAD DATA LOCAL INFILE '%s' INTO TABLE %s FIELDS TERMINATED BY ',' LINES TERMINATED BY '\\r\\n' IGNORE 1 LINES" % (csv_filename,table_name)
 
    #使用数据库
    cur.execute('use %s' % database)
    #设置编码格式
    cur.execute('SET NAMES utf8;')
    cur.execute('SET character_set_connection=utf8;')
    #执行create_sql，创建表
    cur.execute(create_sql)
    #执行data_sql，导入数据
    cur.execute(data_sql)
    conn.commit()
    #关闭连接
    conn.close()
    cur.close()

csv导入oracle

上一篇：Oracle和MySQL的数据导入，差别为什么这么大
下一篇：标签制作软件如何连接Excel表批量打印固定资产标签

教你使用Python玩转MySQL数据库，大数据导入不再是难题!

一、背景

二、基本操作

1、安装PyMySQL库

2、安装MySQL数据库

3、SQL基本语法

4、连接数据库

5、增删改查操作

三、导入大数据文件

相关推荐

取消回复欢迎你发表评论:

使用cheat engine修改unity游戏（cheat engine教程）

1分钟了解Tableau

钉钉打卡虚拟定位赶快点赞收藏吧!

超级硬核的钉钉模拟wifi，定位，远程打卡教程

足不出户便能环游世界!手机发微信朋友圈如何定位到国外?

6米跨度柱子一般多大?框架结构的柱子应该设置多大?

项目使用 Jfrog Artifactory 制品库

.NET 多版本 WinForm 开源控件库 SunnyUI 技术解析与示例代码

美国陆军游骑兵和长程侦察巡逻部队军服图册

SpringBoot的starter到底是什么?

教你使用Python玩转MySQL数据库，大数据导入不再是难题!

一、背景

二、基本操作

1、安装PyMySQL库

2、安装MySQL数据库

3、SQL基本语法

4、连接数据库

5、增删改查操作

三、导入大数据文件

相关推荐

取消回复欢迎 你 发表评论:

使用cheat engine修改unity游戏（cheat engine教程）

1分钟了解Tableau

钉钉打卡虚拟定位赶快点赞收藏吧!

超级硬核的钉钉模拟wifi，定位，远程打卡教程

足不出户便能环游世界!手机发微信朋友圈如何定位到国外?

6米跨度柱子一般多大?框架结构的柱子应该设置多大?

项目使用 Jfrog Artifactory 制品库

.NET 多版本 WinForm 开源控件库 SunnyUI 技术解析与示例代码

美国陆军游骑兵和长程侦察巡逻部队军服图册

SpringBoot的starter到底是什么?

取消回复欢迎你发表评论: