Mám starú aplikáciu django, ktorá v databáze uložila reťazce utf-8 tak, aby niektoré vyzerali ako neplatné utf8, keď sa ich pokúšam vyzdvihnúť v Ruby.
Struny pred uložením boli typu str
v pytóne, ale keď som ho vyniesol z databázy, django mi dalo správne unicode
string. Keď načítať rovnaký záznam v koľajniciach, získam sekvenciu bajtov, ktorá je identická s pythonom str
reťazec a rubín si sťažuje, že ide o neplatnú sekvenciu bajtov.
Príklad: testovaný reťazec bol jediný emoji: