/ / Získajte unicode z bajtovej sekvencie pythonu str - python, ruby-on-rail, ruby, utf-8, kódovanie znakov

Získajte unicode z bajtovej sekvencie pythonu str - python, ruby-on-rail, ruby, utf-8, kódovanie znakov

Mám starú aplikáciu django, ktorá v databáze uložila reťazce utf-8 tak, aby niektoré vyzerali ako neplatné utf8, keď sa ich pokúšam vyzdvihnúť v Ruby.

Struny pred uložením boli typu str v pytóne, ale keď som ho vyniesol z databázy, django mi dalo správne unicode string. Keď načítať rovnaký záznam v koľajniciach, získam sekvenciu bajtov, ktorá je identická s pythonom str reťazec a rubín si sťažuje, že ide o neplatnú sekvenciu bajtov.

Príklad: testovaný reťazec bol jediný emoji: