====== Excel, CSV 파일 읽기 및 쓰기 ====== * description : Excel, CSV 파일 읽기 및 쓰기 * author : 도봉산핵주먹 * email : hylee@repia.com * lastupdate : 2020-06-26 ===== Excel, CSV 파일 읽기 및 쓰기 ===== ==== 준비사항 ==== > resourec 폴더에 첨부된 파일을 받아서 압축을 풀고 예제 코드를 실행하시면 됩니다. {{ :wiki:ai:python:xlsx_file.zip | .csv 파일}} ==== 예제 코드 ==== # Section11 # 파이썬 예외처리의 이해 # 파이썬 Excel, CSV 파일 읽기 및 쓰기 # CSV : MIME - text/csv import csv # 예제1 with open('./resource/sample1.csv', 'r') as f: reader = csv.reader(f) # next(reader) Header 스킵 (해당라인 스킵) # 확인 print(reader) print(type(reader)) print(dir(reader)) # __iter__ 확인 --> iter가 있으면 반복문 가능 print() for c in reader: print(c) print() # 예제2 with open('./resource/sample2.csv', 'r') as f: reader = csv.reader(f, delimiter='|') # delimiter(구분자 선택) --> | 를 스플릿 해서 리스트형태로 반환 # next(reader) Header 스킵 # 확인 print(reader) print(type(reader)) print(dir(reader)) # __iter__ 확인 print() for c in reader: print(c) print() # 예제3 (Dict 변환) with open('./resource/sample1.csv', 'r') as f: reader = csv.DictReader(f) # 확인 print(reader) print(type(reader)) print(dir(reader)) # __iter__ 확인 print() for c in reader: for k, v in c.items(): print(k, v) print('-----') print() # 예제4 w = [[1, 2, 3], [4, 5, 6], [7, 8, 9], [10, 11, 12], [13, 14, 15]] with open('./resource/sample3.csv', 'w') as f: # newline='' 테스트 wt = csv.writer(f) # dir 확인 print(dir(wt)) print(type(wt)) for v in w: wt.writerow(v) print() # 예제5 with open('./resource/sample3.csv', 'w', newline='') as f: # newline --> 새로운 라인 처리 wt = csv.writer(f) # dir 확인 print(dir(wt)) print(type(wt)) wt.writerows(w) print() # XSL, XLSX : MIME - applications/vnd.excel, application/vnd.openxmlformats-officedocument.spreadsheetml.sheet # pip install pandas 설치 필요 # pip install xlrd 설치 필요 # pip install openpyxl 설치 필요 # openpyxl, xlsxwriter, xlrd, xlwt, xlutils 등 있으나 pandas를 주로 사용(openpyxl, xlrd) 포함 import pandas as pd xlsx = pd.read_excel('./resource/sample.xlsx') # , sheetname='시트명' 또는 숫자, header=3, skiprow=1 실습 # 상위 데이터 확인 print(xlsx.head()) print() # 데이터 확인 print(xlsx.tail()) print() # 데이터 구조 print(xlsx.shape) # 행, 열 # 엑셀 or CSV 다시 쓰기 xlsx.to_excel('./resource/result.xlsx', index=False) xlsx.to_csv('./resource/result.csv', index=False) ==== 실행 콘솔 ==== <_csv.reader object at 0x000001787F76FA60> ['__class__', '__delattr__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__iter__', '__le__', '__lt__', '__ne__', '__new__', '__next__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', 'dialect', 'line_num'] ['번호', '이름', '가입일시', '나이'] ['1', '김정수', '2017-01-19 11:30:00', '25'] ['2', '박민구', '2017-02-07 10:22:00', '35'] ['3', '정순미', '2017-01-22 09:10:00', '33'] ['4', '김정현', '2017-02-22 14:09:00', '45'] ['5', '홍미진', '2017-04-01 18:00:00', '17'] ['6', '김순철', '2017-05-14 22:33:07', '22'] ['7', '이동철', '2017-03-01 23:44:45', '27'] ['8', '박지숙', '2017-01-11 06:04:18', '30'] ['9', '김은미', '2017-02-08 07:44:33', '51'] ['10', '장혁철', '2017-12-01 13:01:11', '16'] <_csv.reader object at 0x000001787F7967C0> ['__class__', '__delattr__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__iter__', '__le__', '__lt__', '__ne__', '__new__', '__next__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', 'dialect', 'line_num'] ['번호', '이름', '가입일시', '나이'] ['1', '김정수', '2017-01-19 11:30:00', '25'] ['2', '박민구', '2017-02-07 10:22:00', '35'] ['3', '정순미', '2017-01-22 09:10:00', '33'] ['4', '김정현', '2017-02-22 14:09:00', '45'] ['5', '홍미진', '2017-04-01 18:00:00', '17'] ['6', '김순철', '2017-05-14 22:33:07', '22'] ['7', '이동철', '2017-03-01 23:44:45', '27'] ['8', '박지숙', '2017-01-11 06:04:18', '30'] ['9', '김은미', '2017-02-08 07:44:33', '51'] ['10', '장혁철', '2017-12-01 13:01:11', '16'] ['__class__', '__delattr__', '__dict__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__iter__', '__le__', '__lt__', '__module__', '__ne__', '__new__', '__next__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', '__weakref__', '_fieldnames', 'dialect', 'fieldnames', 'line_num', 'reader', 'restkey', 'restval'] 번호 1 이름 김정수 가입일시 2017-01-19 11:30:00 나이 25 ----- 번호 2 이름 박민구 가입일시 2017-02-07 10:22:00 나이 35 ----- 번호 3 이름 정순미 가입일시 2017-01-22 09:10:00 나이 33 ----- 번호 4 이름 김정현 가입일시 2017-02-22 14:09:00 나이 45 ----- 번호 5 이름 홍미진 가입일시 2017-04-01 18:00:00 나이 17 ----- 번호 6 이름 김순철 가입일시 2017-05-14 22:33:07 나이 22 ----- 번호 7 이름 이동철 가입일시 2017-03-01 23:44:45 나이 27 ----- 번호 8 이름 박지숙 가입일시 2017-01-11 06:04:18 나이 30 ----- 번호 9 이름 김은미 가입일시 2017-02-08 07:44:33 나이 51 ----- 번호 10 이름 장혁철 가입일시 2017-12-01 13:01:11 나이 16 ----- ['__class__', '__delattr__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__le__', '__lt__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', 'dialect', 'writerow', 'writerows'] ['__class__', '__delattr__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__le__', '__lt__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', 'dialect', 'writerow', 'writerows'] Sap Co. 대리점 영업사원 전월 금월 TEAM 총 판매수량 0 KI1316 경기수원대리점 이기정 1720000 2952000 1 123 1 KI1451 충청홍성대리점 정미진 4080000 2706000 2 220 2 KI1534 경기화성대리점 경인선 600000 2214000 1 320 3 KI1636 강원속초대리점 이동권 3720000 2870000 3 110 4 KI1735 경기안양대리점 강준석 4800000 2296000 1 134 Sap Co. 대리점 영업사원 전월 금월 TEAM 총 판매수량 15 KI2870 경기구리시대리점 박진형 6000000 3400000 2 143 16 KI2910 강원춘천대리점 김은향 4800000 4896000 1 176 17 KI3030 강원영동대리점 전수창 4560000 3128000 2 98 18 KI3131 경기하남대리점 김민정 2750000 7268000 3 293 19 KI3252 강원포천대리점 서가은 2420000 4740000 4 240 (20, 7) ===== Tip ===== {{tag>도봉산핵주먹 python Excel CSV}}