import os
import pandas as pd
# 读取社区代码表
code = pd.read_excel("社区代码.xlsx", usecols=[0, 1])
code['区划代码'] = code['区划代码'].astype("str") # 强制转化类型
code.index = code['区划代码']
# 初始化合并后数据集
merge_data = pd.DataFrame()
# 通过编码获取社区名称
def get_community_name(community_code):
global code
print(community_code)
return code.loc[community_code, :]['社区']
def get_community_code(filename):
return filename[0:filename.find('_')]
def load_data(file_fullname, community_code, community_name):
global merge_data
df = pd.read_excel(file_fullname, skiprows=1)
df['code'] = community_code
df['name'] = community_name
merge_data = merge_data.append(df,ignore_index=True)
def run(data_dir='data'):
# 遍历当前目录子目录data下的所有xlsx文件
watch_dir = os.path.join(os.getcwd(), data_dir)
for file in os.listdir(watch_dir):
(filename, extension) = os.path.splitext(file)
if extension.lower() in ['.xlsx']:
file_fullname = os.path.join(watch_dir, file)
community_code = get_community_code(filename)
community_name = get_community_name(community_code)
print(community_name)
load_data(file_fullname, community_code, community_name)
run()
merge_data
330108003008
滨文社区
330108002010
月明社区
330108003018
山二社区
330108002020
山一社区
330108002004
长河社区
330108002014
塘子堰社区
330108003020
信诚社区
330108003004
杨家墩社区
330108001017
官河社区
330108003014
向南社区
330108001007
马湖社区
330108001003
庙后王社区
330108002008
长二社区
330108003010
六和社区
330108001013
协同社区
330108002018
钱潮社区
330108003017
浦联社区
330108001004
襄七房社区
330108003007
岩大房社区
330108001014
滨和社区
330108001010
金东方社区
330108003003
联庄社区
330108003013
西浦社区
330108002003
江二社区
330108001008
七甲闸社区
330108002013
汤家井社区
330108002017
白马湖社区
330108002007
长一社区
330108001006
温馨社区
330108003015
东信社区
330108003021
江南社区
330108001016
奥体社区
330108003005
冠二社区
330108003001
新浦社区
330108001012
共联社区
330108002019
冠山社区
330108003011
滨盛社区
330108001002
水电社区
330108002009
闻涛社区
330108002001
天官社区
330108003019
明德社区
330108002011
晶都社区
330108003009
彩虹社区
330108002015
汤家桥社区
330108002021
江汉社区
330108002005
江一社区
330108002012
张家村社区
330108002002
中兴社区
330108001009
新州社区
330108002006
江三社区
330108002022
观潮社区
330108002016
傅家峙社区
330108001015
丹枫社区
330108003006
东冠社区
330108001005
西兴社区
330108003016
冠一社区
330108003012
新生社区
330108001001
西陵社区
330108003002
之江社区
330108001011
星民社区
print("Waiting for saving data.")
merge_data.to_excel("社区合并数据.xlsx")
print("Saved!")
Waiting for saving data.
Saved!
merge_data['类型'].value_counts(sort=True)