1.导入txt文件
本文所使用到的test.txt的内容如下:
使用read_table()方法导入txt文件
1 | python复制代码import pandas as pd |
result:
1 | 复制代码 我是李华。 今天本来留下班里十几个人做大扫除结果他们都跑了,只留下了我一个人干完了所有活。 回家的路上真不巧又下了雨, |
该方法是将利用分隔符分开的文件导入DataFrame的通用函数。不仅可以导入.txt文件,也可以导入.csv文件。
1 | python复制代码df = pd.read_table(r'C:\Users\admin\Desktop\中文\数据分析测试表.csv') |
result:
1 | 复制代码 区域,省份,城市 |
read_table()方法的其他参数用法和read_csv()方法基本一致,再此不再赘述。
2.导入sql文件
2.1 安装依赖库pymysql
python连接MySQL要用到pymysql,需要手动进行安装。
1 | ini复制代码import pandas as pd |
此时报错
修改charset=’utf8’后错误解决:
1 | ini复制代码con = pymysql.connect(host='127.0.0.1', # 数据库地址,本机为127.0.0.1或localhost |
result:
1 | yaml复制代码 eID NAME sex birth jobs firJob hiredate |
这里提供数据库查询结果作为比对:
注:python使用pymysql与MySQL交互时,编码方式只能写成utf8,不要习惯性地写成utf-8
3.小结
导入数据主要用到pandas里的read_x()方法,x表示待导入文件的格式
除了之前介绍的导入.xlsx文件的read_excel(),导入.csv文件的read_csv(),导入txt的read_table(),导入sql文件的read_sql()之外,还有一些其他方法在此列出。这些使用到的不多,在此不做深入说明,。后面如有使用到再进行更新。
1 | scss复制代码pd.read_xml() |
本文转载自: 掘金