티스토리 뷰
어쩌다 보니 공공데이터를 사용하게 될 일이 생겼다
평화롭게 공공데이터 페이지에서 엑셀 데이터를 다운로드하였는데 처참히 깨지는 것이 아닌가

M3 맥에서 arc browser를 쓰고있다
터미널에서 파일 타입을 확인해 보면 iso-8859-1이 나오긴 하는데 이것은 함정이다
csv는 특별한 인코딩 지시자가 없어서 컴퓨터가 헷갈리는 거라 한다

실시간 인코딩이 지원되는 파일 편집기에서 euc-kr로 변경해 보자
인텔리제이에서 우측 하단에 파일 인코딩을 나타내는 부분을 선택하고 More > EUC-KR


성공적으로 변환됐다, 용량이 충분히 적은 파일은 여기서 저장하고 넘어가도 되겠으나
나는 100MB가 넘는 파일 용량으로 인해 인코딩을 변경하고 직접 저장할 순 없었다

AI 대홍수 시대에 무서울게 뭐가 있을까
바로 grok에 질문하였고 맥에서 기본 제공되는 iconv를 이용하면 된다는 답변을 받았다
아래와 같은 형태로 사용한다 -f=from, -t=to, original.csv를 읽어 converted.csv로 새로 쓴다
# 1
iconv -f euc-kr -t utf-8 -c original.csv converted.csv
# 2
iconv -f euc-kr -t utf-8 -c original.csv > converted.csv
grok이 첫 번째 방식으로 알려줘서 바로 Cannot open `converted.csv'% 에러를 만났다
깊이 들어가려면 한도 끝도 없으니 간단하게만 알아보자, OS, verison.. 등의 컨텍스트를 더 주고 대화를 이어 나가봤다
첫 번째 방식은 데이터 변환 후 iconv가 직접 파일 I/O를 담당하는데 실패 가능성이 있다고 한다
두 번째 방식은 iconv는 변환만 하고 출력은 shell이 맡아서 처리해준다고 한다
BSD 기반 iconv는 맥 내장 기능이라 이것도 brew로 GNU 기반 libiconv를 설치하고 iconv 대체할 수 있으나
본연의 목적인 깨진 엑셀 복구만 하면 되므로 여기까지만 알아보았다
맥 윈도우 간 호환성에 주의하자
1. 공공데이터는 utf-8로 안 열리면 거의 euc-kr일거라 가정해야 한다
2. 파일 용량이 적지 않은 경우, 터미널에서 직접 변환해 주자
'잡다구리' 카테고리의 다른 글
인텔리제이 플러그인 추천 (0) | 2022.03.07 |
---|---|
20211203 (0) | 2021.12.03 |
Safari JSON viewer / 사파리 JSON 뷰어 (0) | 2021.08.15 |
20210807 (0) | 2021.08.07 |