Помощ при програмиране, отговори на въпроси / ° С / “???” символи при запазване на Unicode файлове в C # - c #, unicode

"???" символи при запаметяване на файлове с unicode в C # - c #, unicode

Имам някои проблеми, когато записвам конфигурация- Unicode текстът се запазва като "???". Но проблемът се появява само на Windows 2003 с .Net Framework v 2. Когато тествам кода на WinXP с .Net 4, той работи добре, въпреки че е насочен към .Net Framework v2 в настройките. Опитах се да правя различни реализации като

Encoding.ASCII.GetString(
Encoding.Convert(Encoding.ASCII,
Encoding.Unicode,
Encoding.Unicode.GetBytes(backupPathTextBox.Text)));

Но тя винаги се връща "???"или някои нечетими символи. Проучих този въпрос и установих, че всички C # низове, представени в кодова страница UTF16, но няма UTF16 декодер в C #. Може ли някой да ме води в правилната посока?

Отговори:

4 за отговор № 1

Encoding.ASCII.GetString(
Encoding.Convert(Encoding.ASCII,
Encoding.Unicode,
Encoding.Unicode.GetBytes(backupPathTextBox.Text)));

Encoding.Unicode всъщност е кодирането UTF-16LE, където всекикодовата единица се съхранява с два байта (и така ASCII символите завършват с нула байта между тях). Microsoft нарича това "Unicode", защото те са очаквали да бъдат използвани като най-разпространеното кодиране на Unicode още в ранните дни, но не се получи така и сега името е напълно подвеждащо.

Вашият код прави:

преобразува вашия текстов низ в UTF-16LE байта;
след това ги конвертира от ASCII байтове (които не са) в UTF-16LE байта, което означава, че допълнителен нулев байт се добавя между всеки байт;
след това превръща тези байтове обратно в низ катоте бяха ASCII, което означава, че ще получите по същество същия низ, с който трябваше да започнете, но с още три нула байта на един символ, а не-ASCII символите се превърнаха в две.

Какво точно се опитвахте да направите с това? Ако искате да поставите Unicode низ в ASCII-съвместим текстов файл, кодирането, което искате, е обикновено utf-8 и никога UTF-16. Конвертирането на низ в utf-8 байта е толкова просто, колкото:

new UTF8Encoding(false).GetBytes(backupPathTextBox.Text)

или просто използвайте utf-8 TextWriter да напишете низ директно.

Свързани въпроси

Получавам следната грешка - "колоната" А "не може да конвертира между типовете данни тип" unicode "и" unicode "- ssis, ssdt, ssis-2012, ssrs-2014

Unicode символи, които не се запазват с предния край на Access, свързани с sql таблицата - sql, ms-access, unicode, linked tables

Как да търсите уникодски знаци в записите на DB2? - търсене, unicode, db2

Азбука на арабски и японски текст, който е в Unicode? - рубин, сортиране, unicode

Как да вмъкнете специфични символи в qt приспособления - qt, unicode, кодиране на знаци, qt5

Как да стигнем до Unicode Code Point (като в базата данни) в Python 3 - python, unicode

докато четете json файла в Python някои допълнителни символи на Unicode се появяват в данните - python, json, unicode

Unicode Regex в Python 3 (от кода на Python 2) - python, regex, python-3.x, unicode, python-2.x

Python: Списък на разбирането С unicode validaton - python, списък-разбиране

Какво представлява "u" в резултатите (Python)? [дубликат] - python, nltk

Как да превърнете елементите в Unicode без да губите структурата на списъка -

Правилно боравене с избягващите символи от Unicode в php - php, unicode

Unicode :: GCString съобщение за грешка: "new: Unicode string трябва да бъде даден" - perl, unicode

Защо това не работи низ a = "u" + "30A0"; - java, string, unicode

замества емотикони символа unicode, използвайки regexp в javascript - javascript, regex, unicode, emoji

изпращане на unicode през TCP контакти, какво ще кажеш за endianness - c, sockets, unicode, tcp

Как да зададете maxlength за текстово поле в Unicode в asp.net? - c #, asp.net

Как правилно да се показват символите с Unicode в Linux чрез QT? - c ++, qt, unicode, qstring

Проверете дали символът Unicode се показва или тофу - c, winapi, unicode, font - linking

Разлика между UNICODE и _UNICODE [дубликат] - c, winapi, unicode