Python数据分析之读取Excel数据并导入数据库
创始人
2025-05-30 12:41:43
0

曾某年某一天某地
时间如静止的空气
你的不羁
给我惊喜
——《谁愿放手》陈慧琳

文章目录

  • 前言
  • 一、Python读取Excel数据
  • 二、Python连接mysql数据库
  • 三、将Excel数据导入数据库表
  • 总结


前言

入职新公司两个多月,发现这边的数据基础很差,没有维度建模的数仓,很多数据甚至没有系统承载,大量的Excel表,大量的人工处理工作,现阶段被迫“面向Excel”编程。本文主要介绍使用Python读取Excel数据并导入数据库的方法,供各位小伙伴参考。


一、Python读取Excel数据

Python读取Esxcel数据主要是使用pandas包
(一)Excel表数据如下
在这里插入图片描述
(二)读取Excel相关代码如下,其中sheet_name可以省略,sheet_name="具体sheet页面"则只读该sheet页,sheet_name=0则读取第一个sheet页。

import pandas as pddf = pd.read_excel("test_20230312.xlsx", sheet_name="Sheet1")
print(df)

(三)结果展示
在这里插入图片描述

二、Python连接mysql数据库

Python连接mysql数据库主要是使用pymysql包
(一)创建数据库连接,读表测试。

import pymysqlconn = pymysql.connect(host='localhost',port=3306,user='xxx',password='xxxxxx',database='test',charset='utf8')df = pd.read_sql('select * from test.dim_category', con=conn)
print(df)

(二)结果展示
在这里插入图片描述

三、将Excel数据导入数据库表

(一)具体代码

import pandas as pd
import pymysqlconn = pymysql.connect(host='localhost',port=3306,user='xxx',password='xxxxxx',database='test',charset='utf8')df = pd.read_excel("test_20230312.xlsx", sheet_name="Sheet1")
infodata = pd.DataFrame(df).values
cur = conn.cursor()length = len(infodata)
for i in range(0, length):data_each = []data_each = infodata[i]print(data_each)sql = "insert into test_python_insert values{}".format(tuple(data_each))try:cur.execute(sql)conn.commit()print(i)except:conn.rollback()cur.close()
conn.close()

(一)结果展示
在这里插入图片描述


总结

Python可以通过一些非常实用的包,如pandas,numpy等,对数据进行清洗,整理分析,合理利用Python可以提高我们处理分析数据的效率。

相关内容

热门资讯

并发基础之Callable与F... 目录前言浅析Callale接口Callale源码分析Callale简单演示浅析Future接口Fut...
DevOps是什么?DevOp... 目录专栏导读一、DevOps是什么?二、为什么会出现DevOps?1、容...
9、Cascaded Diff... 简介 主页:https://cascaded-diffusion.github.io/...
记首次小程序遇到坑及解决 前言 由于工作需要,首次进行微信小程序开发,从基础环境搭建到小程序发布&...
虚拟机使用AlmaLinux搭... 使用Parallels Desktop虚拟机运行 环境:AlmaLinux9.1 &#...
GMP理解 目录goroutine动态栈goroutine调度GOMAXPROCS为什么不直接将本地队列放在 M...
重磅解读:组建国家数据局,数据... “国务院关于提请审议国务院机构改革方案的议案,组建国家数据局,数据要素正...
ElasticSearch -... 文章目录1. 数据构造2. ElasticSearch 查询集群中所有索引中的所有文档3. Elas...
VSCode配置之OnnxRu... 背景 最近在尝试将Pytorch模型部署为Cmodel并讨论推理框架的速度优势,作为V...
金三银四互联网大厂最全1000... Java 面试 大家都知道,现在的 Java 面试是越来越难了!主要原因...
DW3000芯片SPI通信接口... SPI功能描述DW3000的主机接口是一个4线spi兼容的外围设备。SPI控制器(主机)断言SPIC...
儿童甲流高发,宝妈记住预防3部... 春天来了,儿童甲流的高发期也来了。根据国家流感监测中心的数据,流感病毒的...
基于Gin封装的Web框架如何... 在登陆系统中我们我们时常要去校验密码是否正确,而数据库中的密码是密文形式在Gin中我们...
PowerShell Inst... Python 前言 Python 是一种解释型、面向对象、动态数据类型的高级程序设计语言。Pytho...
突发!知名品牌所有门店关闭,年... 拖欠供应商货款、银行账户被冻结、通过贷款“续命”……曾经辉煌一时的“烘焙第一股”克莉丝汀࿰...
JAVASE/封装、继承、多态 博客制作不易,欢迎各位点赞👍+收藏⭐+关注前言在学习面...
Elasticsearch中索... 概要 由于历史原因,A产品数据入Es库中字段默认都是keyword并没有区分字段类型属...
4.网络层:数据平面 1.网络层概述网络中的每台主机和路由器之间都有一个网络层路由器具有截断的协议栈,没有网...
2023系统分析师-企业信息化... 一、信息化战略体系 1、信息资源规划ISP 信息资源规划是信息化建设的基础工程,是针对...
inverted_residu... 1. 线性BottleNect 线性瓶颈是在 MobileNetV2: Inverted Resid...