티스토리 뷰

어쩌다 보니 공공데이터를 사용하게 될 일이 생겼다

평화롭게 공공데이터 페이지에서 엑셀 데이터를 다운로드하였는데 처참히 깨지는 것이 아닌가

 

M3 맥에서 arc browser를 쓰고있다

터미널에서 파일 타입을 확인해 보면 iso-8859-1이 나오긴 하는데 이것은 함정이다

csv는 특별한 인코딩 지시자가 없어서 컴퓨터가 헷갈리는 거라 한다

 

실시간 인코딩이 지원되는 파일 편집기에서 euc-kr로 변경해 보자

인텔리제이에서 우측 하단에 파일 인코딩을 나타내는 부분을 선택하고 More > EUC-KR

 

성공적으로 변환됐다, 용량이 충분히 적은 파일은 여기서 저장하고 넘어가도 되겠으나

나는 100MB가 넘는 파일 용량으로 인해 인코딩을 변경하고 직접 저장할 순 없었다

 

AI 대홍수 시대에 무서울게 뭐가 있을까

바로 grok에 질문하였고 맥에서 기본 제공되는 iconv를 이용하면 된다는 답변을 받았다

아래와 같은 형태로 사용한다 -f=from, -t=to, original.csv를 읽어 converted.csv로 새로 쓴다

# 1
iconv -f euc-kr -t utf-8 -c original.csv converted.csv

# 2
iconv -f euc-kr -t utf-8 -c original.csv > converted.csv

 

grok이 첫 번째 방식으로 알려줘서 바로 Cannot open `converted.csv'% 에러를 만났다

깊이 들어가려면 한도 끝도 없으니 간단하게만 알아보자, OS, verison.. 등의 컨텍스트를 더 주고 대화를 이어 나가봤다

첫 번째 방식은 데이터 변환 후 iconv가 직접 파일 I/O를 담당하는데 실패 가능성이 있다고 한다

두 번째 방식은 iconv는 변환만 하고 출력은 shell이 맡아서 처리해준다고 한다

BSD 기반 iconv는 맥 내장 기능이라 이것도 brew로 GNU 기반 libiconv를 설치하고 iconv 대체할 수 있으나

본연의 목적인 깨진 엑셀 복구만 하면 되므로 여기까지만 알아보았다

 

맥 윈도우 간 호환성에 주의하자

1. 공공데이터는 utf-8로 안 열리면 거의 euc-kr일거라 가정해야 한다

2. 파일 용량이 적지 않은 경우, 터미널에서 직접 변환해 주자

'잡다구리' 카테고리의 다른 글

인텔리제이 플러그인 추천  (0) 2022.03.07
20211203  (0) 2021.12.03
Safari JSON viewer / 사파리 JSON 뷰어  (0) 2021.08.15
20210807  (0) 2021.08.07
댓글
링크
글 보관함
«   2025/04   »
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30
Total
Today
Yesterday