tailieunhanh - Sự hội tụ của hàm lồi mạnh và hàm trơn

Bài viết "Sự hội tụ của hàm lồi mạnh và hàm trơn" tìm hiểu các hàm trơn, hàm lồi, hàm lồi mạnh và các tính chất của chúng. Sau đó, chứng minh các bước lặp của thuật toán Gradient Descent là hội tụ sau một số vòng lặp . | TẠP CHÍ KHOA HỌC TÀI CHÍNH KẾ TOÁN SỰ HỘI TỤ CỦA HÀM LỒI MẠNH VÀ HÀM TRƠN CONVERGENCE FOR STRONGLY CONVEX AND SMOOTH FUNCTIONS Ngày nhận bài ThS. Nguyễn Tấn Bình Ngày nhận kết quả phản biện Trường Đại học Tài chính - Kế toán Ngày duyệt đăng TÓM TẮT Trong bài viết này chúng tôi tìm hiểu các hàm trơn hàm lồi hàm lồi mạnh và các tính chất của chúng. Sau đó chúng tôi chứng minh các bước lặp của thuật toán GD là hội tụ sau một số vòng lặp. Trong Định lý 1 chúng tôi chứng minh hội tụ tuyến tính phụ với giả thuyết f là hàm lồi. Trong Định lý 2 chúng tôi chứng minh sự hội tụ tuyến tính một dạng hội tụ nhanh hơn với giả thuyết mạnh rằng f là µ -lồi mạnh. Cuối cùng chúng tôi trình bày kết quả hội tụ của các hàm không lồi thỏa mãn điều kiện Polyak- Lojasiewicz trong Định lý 3. Từ khóa hàm lồi hàm lồi mạnh hàm trơn Polyak - Lojasiewicz Gradient Descent ABSTRACT In this article the author learns about smooth functions convex functions strongly convex functions and their properties. Then we prove that the iterations of the GD algorithm converge after a number of iterations. In Theorem 1 we prove sub-linear convergence in the case that f is a convex function. In Theorem 2 we prove linear convergence a faster form of convergence with the strong hypothesis that is strong µ -convex. Finally we also present the convergence results of non-convex functions satisfying the condition Polyak- Lojasiewicz in Theorem 3. Keywords convex function strong convex function smooth function Polyak- Lojasiewicz Gradient Descent 1. Đặt vấn đề Trong các bài toán machine learning hoặc các bài toán tối ưu nói chung chúng ta thường phải làm việc với những điểm cực trị thường là điểm cực tiểu của một hàm số. Hay trong chương trình phổ thông muốn tìm cực trị một hàm số y f x chúng ta sẽ giải phương trình y f x . Tuy nhiên phương trình trên không phải lúc nào cũng giải được có những trường hợp việc giải phương trình trên là bất khả thi. Nguyên nhân có thể đến từ sự .