pandas basics1

¿ø¼Ò°ª ¼öÁ¤

import pandas as pd

data1 = [[10, 20, 30], [11, 21, 31], [12, 22, 32]]      
df = pd.DataFrame(data1, index=['Á¦·Î', 'Çϳª', 'µÑ'], columns=['a', 'b', 'c'])

df.iloc[1][1] = 77
df.loc['Çϳª']['c'] = 88
df.loc['µÑ', 'c'] = 89
print(df)

°á°ú)
          a   b   c
Á¦·Î  10  20  30
Çϳª  11  77  88
µÑ     12  22  89

Çà Ãß°¡

import pandas as pd

data1 = [[10, 20, 30], [11, 21, 31], [12, 22, 32]]      
df = pd.DataFrame(data1, index=['Á¦·Î', 'Çϳª', 'µÑ'], columns=['a', 'b', 'c'])

df.loc['³Ý'] = [110, 120, 130]
df.loc['´Ù¼¸'] = df.iloc[1]
df.loc[4] = 7

print(df)

°á°ú)
           a    b    c
Á¦·Î   10   20   30
Çϳª   11   21   31
µÑ      12   22   32
³Ý      110  120  130
´Ù¼¸   11   21   31
4         7    7    7

¿­ Ãß°¡

import pandas as pd

data1 = [[10, 20, 30], [11, 21, 31], [12, 22, 32]]       
df = pd.DataFrame(data1, index=['Á¦·Î', 'Çϳª', 'µÑ'], columns=['a', 'b', 'c'])

df['aplus'] = 77

print(df)

°á°ú)
         a   b   c       aplus
Á¦·Î  10  20  30     77
Çϳª  11  21  31     77
µÑ     12  22  32     77

Çà, ¿­ »èÁ¦

Çà »èÁ¦ DataFrame.drop(Çà À妽º ¶Ç´Â ¹è¿­, axis=0, inplace=True)
¿­ »èÁ¦ DataFrame.drop(Çà À妽º ¶Ç´Â ¹è¿­, axis=1, inplace=True)

axis ÀÔ·ÂÀÌ ¾øÀ¸¸é axis=0ÀÌ µðÆúÆ®ÀÌ´Ù.
¿øº» µ¥ÀÌÅ͸¦ º¯°æ ÇÏ·Á¸é inplace=True·Î ÇÑ´Ù.

import pandas as pd

data1 = [[10, 20, 30], [11, 21, 31], [12, 22, 32]]      
df = pd.DataFrame(data1, index=['Á¦·Î', 'Çϳª', 'µÑ'], columns=['a', 'b', 'c'])

df.drop("Çϳª", axis=0, inplace=True)

print(type(df))
print(df)

<class 'pandas.core.frame.DataFrame'>
         a   b   c
Á¦·Î  10  20  30
µÑ     12  22  32

import pandas as pd

data1 = [[10, 20, 30], [11, 21, 31], [12, 22, 32]]      
df = pd.DataFrame(data1, index=['Á¦·Î', 'Çϳª', 'µÑ'], columns=['a', 'b', 'c'])

df.drop("b", axis=1, inplace=True)

print(type(df))
print(df)

<class 'pandas.core.frame.DataFrame'>
        a   c
Á¦·Î  10  30
Çϳª  11  31
µÑ     12  32

df.drop("b", axis=1, inplace=True)¶óÀο¡¼­ inplace=True ´ë½Å µ¥ÀÌÅ͸¦ º¹»çÇÏ¸é °á°ú´Â °°´Ù.
df = df.drop("b", axis=1)

Çà, ¿­ ¹Ù²Ù±â

import pandas as pd

data1 = [[10, 20, 30], [11, 21, 31], [12, 22, 32]]      
df = pd.DataFrame(data1, index=['Á¦·Î', 'Çϳª', 'µÑ'], columns=['a', 'b', 'c'])
df = df.transpose()
print(df)

°á°ú)
   Á¦·Î  Çϳª   µÑ
a  10  11  12
b  20  21  22
c  30  31  32

ƯÁ¤ÇÑ ¿­À» Çà À妽º·Î ¼³Á¤

import pandas as pd

data = {'¼­¼ö': ['Çϳª', 'µÑ', '¼Â'],
        '0': [10, 20, 30],
        '1': [11, 21, 31],
        '2': [12, 22, 32]
        }
df = pd.DataFrame(data)
df = df.set_index(['¼­¼ö'])
print(df)

set_index ÀÌÀü
°á°ú)
   ¼­¼ö   0    1    2
0  Çϳª  10  11  12
1   µÑ    20  21  22
2   ¼Â    30  31  32

set_index ÀÌÈÄ: '¼­¼ö' ¿­À» À妽º·Î ¼³Á¤ ÇÑ´Ù.
°á°ú)
        0     1   2
¼­¼ö           
Çϳª  10  11  12
µÑ      20  21  22
¼Â      30  31  32

¸ÖƼ ¿­À» Çà À妽º·Î ¼³Á¤

import pandas as pd

data = {'¼­¼ö': ['Çϳª', 'µÑ', '¼Â'],
        '0': [10, 20, 30],
        '1': [11, 21, 31],
        '2': [12, 22, 32]
        }
df = pd.DataFrame(data)
df = df.set_index(['¼­¼ö', '1'])
print(df)

°á°ú)
              0   2
¼­¼ö 1        
Çϳª 11  10  12
µÑ    21  20  22
¼Â    31  30  32

Çà À妽º Àç¼³Á¤

import pandas as pd

data1 = [[10, 20, 30], [11, 21, 31], [12, 22, 32]]     
df = pd.DataFrame(data1, index=['Á¦·Î', 'Çϳª', 'µÑ'], columns=['a', 'b', 'c'])

index = ['Á¦·Î', 'Çϳª', 'µÑ', '¼Â']
df1 = df.reindex(index)
print(df1)

index = ['Á¦·Î', 'Çϳª', 'µÑ', '¼Â']
df2 = df.reindex(index, fill_value=0)

print(df2)

reindex ÇÔ¼öÀÇ fill_value·Î ÃʱâÈ­ ÇÑ´Ù.

°á°ú)
       a     b     c
Á¦·Î  10.0  20.0  30.0
Çϳª  11.0  21.0  31.0
µÑ   12.0  22.0  32.0
¼Â    NaN   NaN   NaN
     a   b   c
Á¦·Î  10  20  30
Çϳª  11  21  31
µÑ   12  22  32
¼Â    0   0   0

ÇàÀ妽º ¼ÒÆÃ

import pandas as pd

data1 = [[10, 20, 30], [11, 21, 31], [12, 22, 32]]     
df = pd.DataFrame(data1, index=['±â¾ï', '´ÏÀº', 'µð±Ú'], columns=['a', 'b', 'c'])

df = df.sort_index(ascending=False)
print(df)

sort_index ÇÔ¼ö·Î ÃʱâÈ­ ÇÑ´Ù. ascending µðÆúÆ®´Â True·Î ¿À¸§Â÷¼øÀÌ´Ù.
FalseÀÌ¸é ³»¸² Â÷¼øÀÌ´Ù.

°á°ú)
     a   b   c
µð±Ú  12  22  32
´ÏÀº  11  21  31
±â¾ï  10  20  30

ƯÁ¤ ¿­ÀÇ °ªÀ¸·Î ¼ÒÆÃ

import pandas as pd

data1 = [[10, 20, 30], [11, 21, 31], [12, 22, 32]]     
df = pd.DataFrame(data1, index=['±â¾ï', '´ÏÀº', 'µð±Ú'], columns=['a', 'b', 'c'])

df = df.sort_values(by='b', ascending=False)
print(df)

sort_values ÇÔ¼ö¸¦ »ç¿ëÇÑ´Ù.
'b' ¿­À» ³»¸²Â÷¼øÀ¸·Î Á¤·ÄÇÑ´Ù.

°á°ú)
     a   b   c
µð±Ú  12  22  32
´ÏÀº  11  21  31
±â¾ï  10  20  30