Pomoc w programowaniu, odpowiedzi na pytania / Regex / Usuwanie znaków wypunktowania z pliku tekstowego za pomocą sed - regex, bash, sed

Usuwanie znaków punktowych z pliku tekstowego za pomocą sed - regex, bash, sed

Mam duży plik tekstowy, w którym niektóre linie zaczynają się od wypunktowania (•). Chciałbym je usunąć. Próbowałem

sed "s/u2022//g" filename.txt

ale to nie pasuje do pocisków. Próbowałem też wkleić pocisk do mojego polecenia sed, ale też bezskutecznie.

E: Dane wyjściowe

sed --version

jest

sed (GNU sed) 4.2.2

E2: Jeśli pomoże to dowiedzieć się, jak uchwycić znaki punktowane, zostały one pierwotnie dodane w programie Access.

E3: Jak sugerują komentarze,

echo -n "•" | hexdump -C

zwraca

00000000  95                                                |.|
00000001

Odpowiedzi:

2 dla odpowiedzi № 1

Sugeruję przy pomocy GNU sed:

sed "s/xe2x80xa2//g" file

Aktualizacja:

sed "s/x95//g" file

2 dla odpowiedzi nr 2

To jest dla mnie działające polecenie:

# Force paste the bullet into the command line
sed "s/^•//g" filename.txt

Jeśli to nie działa, spróbuj uciec echo:

sed "s/^""$(echo -ne "u2022")""//g" filename.txt

Tak jak Pesa Sugeruje, możesz także użyć printf za ucieczkę:

sed "s/^""$(printf "u2022")""//g" filename.txt

0 dla odpowiedzi № 3

To wygląda jak sed nie rozumie u sekwencje. Zgodnie z instrukcją obsługi powinien on być zgodny z POSIX.2 BRE, który moim zdaniem powinien działać, ale nie działa.

Możesz spróbować przechwycić sekwencję szesnastkową (której używałem hexdump -C).

sed  "s/^xe2x80xa2//g" filename.txt

Możesz też zmusić bash parsować to. Po prostu dodaj $ przed sznurkiem.

sed $"s/u2022//g" filename.txt

Powiązane pytania

alpha regex nie wybiera alfa-znaków w bash - regex, macos, unix

Dopasowywanie grup w bge regex [duplicate] - regex, bash

Regex sprawdza nazwę pliku - regex

Dopasowanie listy do Regex - regex

Dlaczego przy użyciu zastępowania ciągiem znaków wyrażenie regularne nie działa? - regex, bash, awk, substytucja

Konwertuj ogólne wyrażenie regularne na bge proof regex - regex, bash, unix

Ubuntu, Bash, awk, wyrażenia regularne -> znajdź wszystkie [liczby] w pliku tekstowym i wydrukuj je - regex, linux, awk

dopasuj wiodące kropki w bashu, jeśli używasz regex - regex, bash

Zastępując nie alfabetyczne znaki i liczby innymi znakami specjalnymi - regex, vb.net, zamień

Regex Plik CSV Windows - regex, csv, salesforce, newline

Użyj wyrażenia regularnego w stylu Pythona, aby dopasować ciąg (y) przedrostka tygla (lub dowolnego) basha. - python, regex, bash

regex - jak dopasować grupę unikalnych znaków o określonej długości - python, regex, capture group

Jak dodawać podziały wierszy do HTML za pomocą Javascript - javascript, html, formatowanie

Wyrażenie regularne w celu usunięcia punktorów z tekstu nie działa [duplicate] - javascript, regex

Wsparcie dla intelig postaci ID - eclipse, czcionki, github, intellij-idea

Zastępowanie określonych znaków za pomocą Regex .net - c #, .net, regex, replace

Usuwanie niechcianych znaków z nazw folderów [duplikuj] - c #

Jak podzielić ten ciąg i zidentyfikować pierwsze zdanie po ostatnim „*”? - Ciąg c

AWK: Drukuj tylko wiersze z symboli wieloznacznych - bash, awk

Jak powinienem dopasować parametr użytkownika do jednego z elementów tablicy bash - tablice, regex, bash