it-swarm-korea.com

메모장에서 유니 코드 텍스트를 편집하려면 어떻게해야합니까?

때로는 유니 코드 문자가 포함 된 영어 텍스트를 편집합니다. 어떤 이유로 든 내 PC에서 Notepad ++는 유니 코드 문자 를 ???로 변환하여 텍스트를 손상시키고 모든 데이터를 잃습니다. 유니 코드 문자를 유지하면서 이러한 텍스트를 편집하는 방법을 찾고 있습니다. Consolas 를 내 글꼴로 사용하고 있습니다. 글꼴에 해당 문자가 모두없는 경우 Windows의 클립 보드를 통해 메모장 ++에서 텍스트를 복사 할 때 왜 데이터가 손실되어야합니까?

26
Robinicks

파일이 실제로 유니 코드로 인코딩 된 경우 Notepad ++는 파일을 자동으로 감지해야합니다. Consolas font 은 저에게 효과적입니다. 다음 두 가지 메뉴 옵션 중 하나를 시도 할 수 있습니다.

  • 인코딩 -> UTF-8로 인코딩
  • 인코딩 -> UTF-8 로 변환

나는 첫 번째 것이 당신이 원하는 것을 할 것이라고 확신합니다.

15
DisgruntledGoat

질문에 설명 된 문제는 empty/new 문서가 "ANSI"로 설정되고 nicode 문자가 붙여 넣어 질 때 발생합니다.

비어 있거나 새 문서와 함께 사용될 때 자동 감지 기능이 없습니다. 적어도 메모장 ++ 버전에서는 테스트하지 않았습니다 (v5.4.5). 메뉴에서 설정기본 설정 → 탭 새 문서/오픈 저장 디렉토리에 설정되어 있지 않은 경우 "ANSI"는 메모장 ++에서 새 문서의 기본값입니다.

솔루션

해결책은 붙여 넣기 전에 인코딩을 TF-8 , 메뉴 Format ​​→ TF-8로 인코딩으로 설정하는 것입니다.

Menu command "menu Format/Encode in UTF-8" about to be executed

Firefox에서 Wikipedia 페이지를 보여주는 Russian (русский язык, russkiy yazyk)라는 새 메모장 ++ 문서에 텍스트를 복사했습니다 러시아어.

인코딩이 not ​​"ANSI"에서 변경된 경우 결과는 다음과 같습니다.

Result of pasting the Unicode string "Russian (русский язык, russkiy yazyk" into a new Notepad++ document without changing the encoding from the default "ANSI".

인코딩 is가 변경된 경우 결과는 다음과 같습니다.

Result of pasting the Unicode string "Russian (русский язык, russkiy yazyk" into a new Notepad++ document after changing the encoding from the default "ANSI" to "UTF-8".

아래 그림에서 볼 수 있듯이 ( Cyrillic 부분이 강조 표시됨) Notepad ++는 실제로 유니 코드 문자를 ASCII 63 (16 진 3F), 물음표)로 변환합니다. 클립 보드를 통해 텍스트를 복사 할 때 유니 코드 문자가 손실되는 이유 ("ANSI" 모드) (not ​​글꼴 문제-정보가 손실 됨).

Screenshot of a hex view of said document

테스트 결과 : Notepad ++ v5.4.5 (UNICODE).

15
Peter Mortensen

좋은 소식과 나쁜 소식이 있습니다.

좋은 소식 : 메모장 ++는 유니 코드를 지원합니다 (적어도 내가 수집 할 수있는 것).

나쁜 소식 : 분명히 유니 코드 지원은 Windows XP에서만 가능합니다.

나는 실제로 내 앞에 Windows 컴퓨터가 없습니다. 내가 기억하는 것에서 어딘가에 서식 메뉴 아래에 인코딩 메뉴가 있습니다. 유니 코드 인코딩은 실제로 가장 일반적으로 UTF-8입니다.

메모장 ++에서 유니 코드 지원에 대한 '예쁜'사진입니다.

enter image description here

5
Josh Hunt

유니 코드는 Windows 7에서 완벽하게 작동합니다. 발생하는 유일한 문제는 변경된 문자를 다시 입력해야한다는 것입니다. 나 한테 일어난 일이야 나는 스칸디나비아 문자로 쓰고 있습니다-그래서-> E4, ö-> F6. 그것들을 모두 대체하는 것은 엉덩이의 고통이지만 그만한 가치가 있습니다.

ANSI-> UTF-8에서 페이지를 인코딩하면 일부 문자 문제가 발생합니다.

먼저 UTF-8로 새 페이지를 만든 다음 정보를 복사/붙여 넣기를 제안합니다. 그때 아무런 문제가 없을 것입니다.

3
Sloshed

이것은 나를 위해 일했습니다 :

PC의 스타일 구성 기에서 글꼴을 Courier New로 변경했습니다 (영어/미국 문자 세트가 있고 Windows가 아닌 유니 코드 세트의 경우 루마니아어). Courier New & Tahoma 글꼴 + UTF-8 인코딩으로 작동합니다.

1
rapy rapy

상단 메뉴에서 Encoding를 선택한 다음 Encode in UTF-8 또는 Encode in UTF-8 Without BOM 그러면 유니 코드 인코딩으로 텍스트를 편집 할 수 있습니다.

0
Siavash