Sự quá khớp
Giao diện
Trong thống kê, sự quá khớp (tiếng Anh: overfitting) là kết quả của một phân tích mà tương ứng với việc đạt độ chính xác quá cao với một tập dữ liệu nào đó, vì vậy điều này có thể thất bại khi so khớp với các dữ liệu bổ sung hoặc dự đoán các quan sát đáng tin cậy trong tương lai.[1] Một mô hình quá khớp là một mô hình thống kê chứa nhiều tham số hơn có thể chứng minh bằng dữ liệu.[2] Bản chất của sự quá khớp là việc vô tình trích xuất những biến thể dư thừa (ví dụ như phân số phương sai chưa giải thích được) như khi các biến thể thể hiện cấu trúc mô hình cơ bản.[3]:45
Chú thích
[sửa | sửa mã nguồn]- ^ Definition of "overfitting Lưu trữ 2019-05-22 tại Wayback Machine" at Oxford Dictionaries: this definition is specifically for statistics.
- ^ Everitt B.S., Skrondal A. (2010), Cambridge Dictionary of Statistics, Cambridge University Press.
- ^ Burnham, K. P.; Anderson, D. R. (2002), Model Selection and Multimodel Inference (ấn bản thứ 2), Springer-Verlag. (This has over 44000 citations on Google Scholar.)
Tham khảo
[sửa | sửa mã nguồn]- Leinweber, D. J. (2007). “Stupid data miner tricks”. The Journal of Investing. 16: 15–22. doi:10.3905/joi.2007.681820.
- Tetko, I. V.; Livingstone, D. J.; Luik, A. I. (1995). “Neural network studies. 1. Comparison of Overfitting and Overtraining” (PDF). Journal of Chemical Information and Modeling. 35 (5): 826–833. doi:10.1021/ci00027a006.
- Tip 7: Minimize overfitting. Chicco, D. (tháng 12 năm 2017). “Ten quick tips for machine learning in computational biology”. BioData Mining. 10 (35): 1–17. doi:10.1186/s13040-017-0155-3. PMC 5721660. PMID 29234465.
Đọc thêm
[sửa | sửa mã nguồn]- Christian, Brian; Griffiths, Tom (tháng 4 năm 2017), “Chapter 7: Overfitting”, Algorithms To Live By: The computer science of human decisions, William Collins (imprint), tr. 149–168, ISBN 978-0-00-754799-9
Liên kết ngoài
[sửa | sửa mã nguồn]- Overfitting: when accuracy measure goes wrong Lưu trữ 2009-04-25 tại Wayback Machine (an introductory video tutorial)
- The Problem of Overfitting Data —Stony Brook University
- What is "overfitting," exactly? —Andrew Gelman blog
- CSE546: Linear Regression Bias / Variance Tradeoff —Đại học Washington