pd.shape - количество строк и колонок
https://nuancesprog.ru/p/12819/ - нужное https://nuancesprog.ru/p/12898/ - добавление столбцов в dataFrame https://pythobyte.com/sorting-a-dataframe-649de5fa/ - - Сортировка фрейма данных с помощью функции sort_values() https://pythonist.ru/piramidalnaya-sortirovkaheapsort-na-python/
df.set_index('колонка', inplace-True) - установка индекса и проходом на будущее df.reset.index - сброс индекса при загрузке файла прописать после имени файла -
- Функция iloc
1.функция loc loc - это функция "Выбор по метке". Проще говоря, она предназначена для получения данных по метке. Что это за метка, это '2013-01-01' ~ '2013-01-06', 'A' ~ 'D'
2.Функция iloc - это выбор по позиции, то есть выбор данных по позиции, то есть данных n-й строки и n-го столбца, поэтому целочисленный параметр позиции передается.
df.set_option('display.max_columns', макс значение) - установка макс значения колонок при выводе df.set_option(' display.max_rows', макс значение) - макс - но строк
pd.at[индекс, колонка,если несколько колонок, то еще одни []] = 'название' - также как loc
https://datatofish.com/if-condition-in-pandas-dataframe/
.shape метод для получения количества строк DataFrame .len(DataFrame.index) быстрейший метод получения количества строк в Pandas dataframe.apply() для подсчета строк, удовлетворяющих условию в Pandas
df.rename(columns={'имя которое меняем':'новое имя'}, inplace=True)
df[''колонка'].map({"старое значение","новое значение"})
df.append(df2,ignore_index=True,sort=False)
d.sort_values(by='колонка') d.sort_values(by='колонка', ascending=Fale, inplace=True) - по убывающей d.sort_values(by=['колонка','еще колонка'], ascending=[False, True]) - можно устанавливать на каждую колонку порядок вернуть - df.sort_index()
df['columns'].value_counts() - подсчет всего по группам в колонке
группировка по колонке filt=df['columns'] == 'колонка' df.loc[filt] можно добавить еще df.loc[filt]['колонка по которой надо сделать подсчет].value_counts()
country_grp=df.groupby[''Country'] country_grp[''SOcial_media'].value_counts().loc[''если добавить то по стране'] - группировка и сортировка по странам и медиа
вещь - Значение,используемое для заполнения дыр (например,0),поочередно dict/Series/DataFrame значений с указанием,какое значение использовать для каждого индекса (для Series)или столбца (для DataFrame).Значения,не входящие в dict/Series/DataFrame,не будут заполнены.Это значение не может быть списком.
есть ли уникальные значения
df.loc[0-номер индекса, сама колонка '''] df.loc[0,'date].day_name() - возвращает день недели
orders = pd.read_csv('orders.csv', index_col='id')
df[df.Embarked.isna()] - поиск пустых значений df = df.fillna({'Embarked': 0}) - замена на 0 - к примеру sd['Age'].fillna(int(sd['Age'].mean()), inplace=True) - вещь