Vectorization
Sử dụng Vectorization
Giả sử như muốn tạo cột price
= Item_Outlet_Sales
* 5%
df['price'] = df['Item_Outlet_Sales'] * 0.05
df[['Item_Outlet_Sales', 'price']]
Item_Outlet_Sales price
0 3735.1380 186.75690
1 443.4228 22.17114
2 2097.2700 104.86350
3 732.3800 36.61900
4 994.7052 49.73526
... ... ...
8518 2778.3834 138.91917
8519 549.2850 27.46425
8520 1193.1136 59.65568
8521 1845.5976 92.27988
8522 765.6700 38.28350
Nối hai cột lại với nhau, Ví dụ
-
nối
Item_type
vàItem_Fat_Content
thànhItem_Type_Fat_Content
-
nối
Outlet_Identifier
vàOutlet_Establishment_Year
thànhOutlet_Identifier_Establishment_Year
. Trong trường hợp hợp nàyOutlet_Establishment_Year
thuộc dạng số nên để nối dạng text và số ta ép kiểu dạng số về text sử dụngastype()
df['Item_Type_Fat_Content'] = df['Item_Type'] + '_' + df['Item_Fat_Content']
df['Outlet_Identifier_Establishment_Year'] = df['Outlet_Identifier'] + '_' +df['Outlet_Establishment_Year'].astype('str')
df[['Item_Type_Fat_Content', 'Outlet_Identifier_Establishment_Year']]
Item_Type_Fat_Content Outlet_Identifier_Establishment_Year
0 Dairy_Low Fat OUT049_1999
1 Soft Drinks_Regular OUT018_2009
2 Meat_Low Fat OUT049_1999
3 Fruits and Vegetables_Regular OUT010_1998
4 Household_Low Fat OUT013_1987
... ... ...
8518 Snack Foods_Low Fat OUT013_1987
8519 Baking Goods_Regular OUT045_2002
8520 Health and Hygiene_Low Fat OUT035_2004
8521 Snack Foods_Regular OUT018_2009
8522 Soft Drinks_Low Fat OUT046_1997