Допомога у програмуванні, відповіді на питання / Python / Неможливо вставити чистий текст Unicode назад у DataFrame в пандах - python, pandas, unicode, очищення даних

Неможливо вставити чистий текст Unicode назад у DataFrame у панди - python, pandas, unicode, clean-up

Я роблю 2 речі. 1) фільтрувати кадр даних у пандах 2) очистити текст Unicode у певному стовпчику відфільтрованого фрейму даних.

import pandas as pd
import probablepeople
from unidecode import unidecode
import re

#read data
df1 = pd.read_csv("H:\data.csv")
#filter
df1=df1[(df1.gender=="female")]
#reset index because otherwise indexes will be as per original dataframe
df1=df1.reset_index()

Тепер я намагаюся очистити текст Unicode в стовпці адреси

#clean unicode text
for i in range(10):
df1.loc[i][16] = re.sub(r"[^a-zA-Z.," ]",r" ",df1.address[i])

Однак я не в змозі зробити це, і нижче - помилка, яку я отримую.

c:python27libsite-packagesipykernel__main__.py:4: SettingWithCopyWarning:
A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy

Відповіді:

3 для відповіді № 1

Я думаю, що ви можете використовувати str.replace:

df1=df1[df1.gender=="female"]
#reset index with parameter drop if need new monotonic index (0,1,2,...)
df1=df1.reset_index(drop=True)

df1.address = df1.address.str.replace(r"[^a-zA-Z.," ]",r" ")

Схожі запитання

UnicodeEncodeError при використанні методу pandas to_sql на кадрі даних з іменами стовпців unicode - python, pandas, unicode

pandas - змінити df.index з float64 на unicode або string - python, pandas, indexing, dataframe, rows

Як перетворити SQL statement з певними полями і де clause до pandas dataframe [duplicate] - python, pandas, машинного навчання, аналіз даних, pandasql

concat DataFrame із серією в пандах - python, pandas

Як додати рядок як значення для нового стовпця для frameframe - python, pandas

Застосування назв стовпців до pandas DataFrame, імена більше не єдiокодi - python, python-2.7, pandas, unicode

Використання pandas.DataFrame.at () у циклі для циклу - python, list, pandas, for-loop, frame

Перетворення з Unicode в Python - python, unicode, pandas

непередбачені значення Unicode в кадрі даних? - пітони, панди

Як повторно впорядкувати дані в новому карті даних в пандах, який відображає зміни в даних таким чином? - python, pandas, dataframe

Керування кількома кадрами даних - python, python-3.x, pandas, frame

токенизация python UnicodeDecodeError - python, nlp

Як перетворити рядок з df.to_string () назад в DataFrame - python, string, python-3.x, pandas, frame

Малюючи взаємозв'язки між стовпчиками даних Pandas - python, pandas, dataframe

Як я можу використовувати рядок unicode як індекс для pd.DataFrame? - python, pandas, dataframe, unicode

Приєднання 2 dataframes на певній колонці з ідентифікаторами - Python, панд

панди лише заощаджує перші 100 записів списку при збереженні як csv з utf-8 кодуванням - python, csv, pandas, кодування, utf-8

проблеми, пов'язані з написанням pandas DataFrame у текстовий файл Unicode - python, unicode, pandas

З'єднання двох кадрів даних в пантах python - python, pandas, dataframe, merge

Неможливо імпортувати pandas Dataframe - python-3.x, pandas