/ / Comment puis-je supprimer tous les caractères spéciaux du texte UTF8 en c #? - c #, regex, utf-8

Comment puis-je supprimer tous les caractères spéciaux du texte UTF8 dans c #? - c #, regex, utf-8

Je souhaite supprimer tous les caractères spéciaux de mon texte UTF8, mais je ne peux "trouver aucune expression régulière correspondante.

Mon texte ressemble à ceci:

ASDÉÁPŐÓÖŰ_->,.!"%=%!HMHF

Je voudrais supprimer uniquement ces caractères: _->,.!"%=%!

J'ai essayé cette regex:

result = Regex.Replace(text, @"([^a-zA-Z0-9_]|^s)", "");

Mais cela supprime aussi mes caractères uft8.

Je ne veux pas supprimer les caractères accentués, mais je veux supprimer tous les glyphes.

Réponses:

0 pour la réponse № 1
Regex.Replace(text, @"([^w]|_)", "")

0 pour la réponse № 2

vous voulez seulement des chiffres et des lettres?

alors voici votre solution:

result = Regex.Replace(text, "[^0-9a-zA-Z]+", "");

vous pouvez aussi essayer de spécifier une plage dans la table ASCII si vous voulez que les choses restent personnalisées dans votre chaîne:

result = Regex.Replace(text, "[^x00-x80]+", "");