윈도우를 사용 중에 메모장이나 워드를 비롯한 문자 편집 프로그램들은 많이 사용 하실 텐데요~

 

문서 작성 중에 특수 문자를 넣어야 하는 경우가 종종 있습니다.

 

메모장과 같은 에디터에서는 한글 자음을 타이핑 하고 한자 키를 누르면 아래 그림과 같이 특수 문자를 입력 할 수 있습니다.


 

그런데 이런 방식은 내가 찾는 문자를 찾으려면 하나 하나 찾아 봐야 해서 매우 귀찮고 힘들죠~

 

그래서 Microsoft Office 처럼 문자표는 없을까~ 해서 찾아보니 있더군요.

 

Win + R 을 눌러서 실행창을 연 다음에~ charmap 이라고 타이핑 하고 확인을 눌러 줍니다.


 

그럼 다음과 같은 문자표가 뜨게 됩니다.


 

원하는 문자를 선택 한 다음에~ 복사를 누르면 클립보드에 복사가 되고~


 

사용하는 에디터에 붙여 넣으면 끝!! 입니다.

 

위에서 얘기한 자음을 입력해서 하는 방법에 비해 훨씬 편하겠죠~



텍스트 파일을 사용하다 보면 encoding 이 문제가 되는 경우가 종종 있습니다.

 

이런 경우에는 encoding 을 변경하여 해결 하곤 하는데~

 

notepad++ 와 같은 에디터의 기능을 활용 하거나~ 아니면 iconv 와 같은 명령어를 사용하여 encoding 을 변경하곤 하는데요~

 

iconv 와 같은 명령어를 활용하더라도 현재 텍스트 파일의 encoding 방식을 확인 해야 합니다.

 

encoding을 확인 하기 위해 일일이 에디터에서 파일을 여는 것도 귀찮아서 찾아보니~

 

chardet 라는 python 모듈을 있더군요.

 

https://github.com/chardet/chardet

 

위 주소에서 확인 할 수 있는 바와 같이 아래 타입들을 detect 할 수 있다고 합니다.

 

ASCII, UTF-8, UTF-16 (2 variants), UTF-32 (4 variants), Big5, GB2312, EUC-TW, HZ-GB-2312, ISO-2022-CN (Traditional and Simplified Chinese), EUC-JP, SHIFT_JIS, CP932, ISO-2022-JP (Japanese), EUC-KR, ISO-2022-KR (Korean), KOI8-R, MacCyrillic, IBM855, IBM866, ISO-8859-5, windows-1251 (Cyrillic), ISO-8859-5, windows-1251 (Bulgarian), windows-1252 (English), ISO-8859-7, windows-1253 (Greek), ISO-8859-8, windows-1255 (Visual and Logical Hebrew), TIS-620 (Thai)

 

python 모듈이니만큼 설치도 굉장히 간단한데요~

 

다음과 같이 pip 로 설치 할 수 있습니다.

 

pip install chardet

 

설치는 하면 아래 그림과 같이 C:\Python27\Scripts\chardetect.EXE 에 chardetect 실행 파일이 설치가 됩니다.

 

그럼 다음과 같이 명령어를 이용하여 텍스트 파일의 encoding 을 확인 할 수 있습니다.

 

chardetect 파일명1 파일명2 파일명3 …

 


+ Recent posts