Chương 1: Cấu trúc và kiểu dữ liệu
Mục tiêu của chương này nhằm giới thiệu về các cấu trúc cơ bản trong Pandas là Series
và DataFrame
.
Trong chương này, bạn sẽ học cách khởi tạo các cấu trúc này cũng như một số thao tác cơ bản trên Series
.
Bạn cũng sẽ được biết về một số kiểu dữ liệu thường gặp trong pandas và cách để giảm thiểu bộ nhớ sử dụng khi khởi tạo dữ liệu.
Series
Trong Pandas, Series
là mảng 1 chiều bao gồm một danh sách giá trị, và một mảng chứa index
của các giá trị. Trong dữ liệu dảng bảng, mỗi Series được xem như là một cột của bảng đó.
Cách đơn giản để tạo Series như sau
s = pd.Series(data, index=None, name=None)
Trong đó data
có thể có dạng:
-
dạng List của Python hoặc dạng
numpy.array
-
dictionary của Python
-
là một hằng số duy nhất
index
có thể truyền hoặc không, tùy vào dạng của data
mà index
sẽ được định nghĩa khác nhau.
name
là tên của Series
, giá trị này cũng không nhất thiết phải truyền vào.