텍스트 파일에 특수문자 U+FEFF (Byte Order Mark, BOM)이 포함된 부분을 찾기 위해, grep을 시도했는데 일반적인 방법으로는 잘 매치되지 않는다.
$ cat input.txt | grep -P '\xef\xbb\xbf'
여기저기 찾아보면서 시도해봤는데 위와 같이 하니까 매치된다. vi 에서는 <feff> 이렇게 보이지만, 이 파일은 UTF-8 이라서 실제로는 \xef\xbb\xbf 이렇게 3바이트로 되어있다.
참고: [위키피디아 '바이트 순서 표식']
댓글 없음:
댓글 쓰기