Machine Learning: mì, súp và công thức nấu
  • Lời tựa
  • Machine Learning là gì?
  • Khái niệm cơ bản
  • Supervised Learning
    • Hai góc nhìn về Supervised Learning
    • Hàm mục tiêu (objective function)
    • Overfitting
    • Regularized Loss Minimization
    • Tinh chỉnh Hyperparameter
    • Thuật toán Supervised Learning
    • Hàm mất mát (loss function)
Powered by GitBook
On this page

Was this helpful?

Khái niệm cơ bản

Observation: kí hiệu là xxx, input trong các bài toán. Observation thường có dạng một vector x=(x1,x2,...,xn)x = (x_1, x_2, ..., x_n)x=(x1​,x2​,...,xn​), gọi là feature vector. Mỗi xix_ixi​ gọi là một feature. Ví dụ bạn muốn đoán xem hôm nay có mưa không dựa vào observation gồm các feature (nhiệt độ, độ ẩm, tốc độ gió).

Label: kí hiệu là yyy, output của bài toán. Mỗi observation sẽ có một label tương ứng. Ở ví dụ về mưa ở trên label chỉ là "mưa" hoặc "không mưa". Label có thể mang nhiều dạng nhưng đều có thể chuyển đổi thành một số thực hoặc một vector. Trong chương này chủ yếu làm việc với label là số thực.

Model: trong chương này các bạn hiểu là nó là một hàm số f(x)f(x)f(x), nhận vào một observation xxx và trả về một label y=f(x)y = f(x)y=f(x).

Parameter: mọi thứ của model được sử dụng để tính toán ra output. Ví dụ model là một hàm đa thức bậc hai: f(x)=ax12+bx2+cf(x) = ax_1^2 + bx_2 + cf(x)=ax12​+bx2​+c thì parameter của nó là bộ ba (a,b,c)(a, b, c)(a,b,c). Tuy nhiên, còn một loại parameter đặc biệt nữa gọi là hyperparameter. Hyperparameter là một khái niệm mang tính tương đối và quy ước, thường chỉ các parameter có tính chất hơi mặc định. Đối với hàm đa thức thì bậc của đa thức có thể được xem là một hyperparameter. Để ngắn gọn, người ta thường gom tất cả parameter của một model lại thành một vector, thường được kí hiệu là www. Trong f(x)f(x)f(x) vừa rồi thì w=(a,b,c)w = (a, b, c)w=(a,b,c). Kí hiệu fw(x)f_w(x)fw​(x) được dùng để chỉ một model đã được xác định tham số. Trong trường hợp cấu trúc model đã được xác định (ví dụ đã biết được nó là đa thức bậc 2), thì có thể dùng www để chỉ model thay cho fw(x)f_w(x)fw​(x) luôn.

PreviousMachine Learning là gì?NextSupervised Learning

Last updated 6 years ago

Was this helpful?