Nhảy tới nội dung

Vectorization

Sử dụng Vectorization

Giả sử như muốn tạo cột price= Item_Outlet_Sales * 5%

df['price'] = df['Item_Outlet_Sales'] * 0.05
df[['Item_Outlet_Sales', 'price']]
      Item_Outlet_Sales      price
0 3735.1380 186.75690
1 443.4228 22.17114
2 2097.2700 104.86350
3 732.3800 36.61900
4 994.7052 49.73526
... ... ...
8518 2778.3834 138.91917
8519 549.2850 27.46425
8520 1193.1136 59.65568
8521 1845.5976 92.27988
8522 765.6700 38.28350

Nối hai cột lại với nhau, Ví dụ

  • nối Item_typeItem_Fat_Content thành Item_Type_Fat_Content

  • nối Outlet_IdentifierOutlet_Establishment_Year thành Outlet_Identifier_Establishment_Year. Trong trường hợp hợp này Outlet_Establishment_Year thuộc dạng số nên để nối dạng text và số ta ép kiểu dạng số về text sử dụng astype()

df['Item_Type_Fat_Content'] = df['Item_Type'] + '_' + df['Item_Fat_Content']
df['Outlet_Identifier_Establishment_Year'] = df['Outlet_Identifier'] + '_' +df['Outlet_Establishment_Year'].astype('str')
df[['Item_Type_Fat_Content', 'Outlet_Identifier_Establishment_Year']]
              Item_Type_Fat_Content Outlet_Identifier_Establishment_Year
0 Dairy_Low Fat OUT049_1999
1 Soft Drinks_Regular OUT018_2009
2 Meat_Low Fat OUT049_1999
3 Fruits and Vegetables_Regular OUT010_1998
4 Household_Low Fat OUT013_1987
... ... ...
8518 Snack Foods_Low Fat OUT013_1987
8519 Baking Goods_Regular OUT045_2002
8520 Health and Hygiene_Low Fat OUT035_2004
8521 Snack Foods_Regular OUT018_2009
8522 Soft Drinks_Low Fat OUT046_1997