Luân Dũng. 13/09/2022. TPO - Theo đoàn giám sát, tình hình khiếu nại, tố cáo, tranh chấp liên quan đến trái phiếu doanh nghiệp, kinh doanh bất động sản đối Quan ngại và chỉ trích Báo chí Đức bình luận, mối quan hệ giữa "đầu tàu châu Âu" với Trung Quốc hiện nay phức tạp hơn trước. Thông qua phát ngôn viên của Chính phủ Đức, bà Merkel đã chỉ trích hệ thống tín dụng xã hội của Trung Quốc sử dụng dữ liệu trực tuyến cá nhân để theo dõi người dân toàn diện. Đọc truyện tranh Kingdom - Vương Giả Thiên Hạ Chapter 521: Cuộc hành quân phức tạp Full Tiếng Việt bản đẹp chất lượng cao, cập nhật nhanh nhất và sớm nhất mỗi ngày tại Truyện Mới. Theo báo cáo của cơ quan công an, thời gian qua, tình hình tội phạm sử dụng công nghệ cao trên địa bàn TP Đà Nẵng đang có diễn biến phức tạp, có xu hướng gia tăng. Nổi lên là các phương thức, thủ đoạn lừa đảo, chiếm đoạt tài sản trên không gian mạng như: giả danh cán bộ công an, kiểm sát, tòa án, ngân Quản lý không gian kiến trúc cảnh quan (KGKTCQ) trong các khu nhà phức hợp của TP Đà Nẵng không còn là ý tưởng mới mà đó là một nhiệm vụ vừa cấp thiết vừa. Skip to content. Tạp chí Kiến trúc - Hội Kiến trúc sư Việt Nam - Tạp chí Kiến trúc - Hội Kiến trúc sư Việt Nam Vay Tiền Trả Góp Theo Tháng Chỉ Cần Cmnd. Bạn đang chọn từ điển Tiếng Việt, hãy nhập từ khóa để tra. Thông tin thuật ngữ phức tạp tiếng Tiếng Việt Có nghiên cứu sâu vào tiếng Việt mới thấy Tiếng Việt phản ánh rõ hơn hết linh hồn, tính cách của con người Việt Nam và những đặc trưng cơ bản của nền văn hóa Việt Nam. Nghệ thuật ngôn từ Việt Nam có tính biểu trưng cao. Ngôn từ Việt Nam rất giàu chất biểu cảm – sản phẩm tất yếu của một nền văn hóa trọng tình. Theo loại hình, tiếng Việt là một ngôn ngữ đơn tiết, song nó chứa một khối lượng lớn những từ song tiết, cho nên trong thực tế ngôn từ Việt thì cấu trúc song tiết lại là chủ đạo. Các thành ngữ, tục ngữ tiếng Việt đều có cấu trúc 2 vế đối ứng trèo cao/ngã đau; ăn vóc/ học hay; một quả dâu da/bằng ba chén thuốc; biết thì thưa thốt/ không biết thì dựa cột mà nghe…. Định nghĩa - Khái niệm phức tạp tiếng Tiếng Việt? Dưới đây sẽ giải thích ý nghĩa của từ phức tạp trong tiếng Việt của chúng ta mà có thể bạn chưa nắm được. Và giải thích cách dùng từ phức tạp trong Tiếng Việt. Sau khi đọc xong nội dung này chắc chắn bạn sẽ biết từ phức tạp nghĩa là gì. - tt H. tạp nhiều thứ khác nhau Không đơn giản; Rắc rối Đó là một công việc cực kì to lớn, phức tạp, khó khăn HCM; Đất nước trong một bối cảnh cực kì phức tạp TrBĐằng. Thuật ngữ liên quan tới phức tạp Tích Thiện Tiếng Việt là gì? đông Tiếng Việt là gì? Bản Rao Tiếng Việt là gì? âm hồn Tiếng Việt là gì? quái vật Tiếng Việt là gì? hằm hằm Tiếng Việt là gì? cà chua Tiếng Việt là gì? trăm năm Tiếng Việt là gì? bít tất Tiếng Việt là gì? A Di Đà Phật Tiếng Việt là gì? trỗi Tiếng Việt là gì? khổ sâm Tiếng Việt là gì? phụ giáo Tiếng Việt là gì? hà hiếp Tiếng Việt là gì? lính quýnh Tiếng Việt là gì? Tóm lại nội dung ý nghĩa của phức tạp trong Tiếng Việt phức tạp có nghĩa là - tt H. tạp nhiều thứ khác nhau Không đơn giản; Rắc rối Đó là một công việc cực kì to lớn, phức tạp, khó khăn HCM; Đất nước trong một bối cảnh cực kì phức tạp TrBĐằng. Đây là cách dùng phức tạp Tiếng Việt. Đây là một thuật ngữ Tiếng Việt chuyên ngành được cập nhập mới nhất năm 2023. Kết luận Hôm nay bạn đã học được thuật ngữ phức tạp là gì? với Từ Điển Số rồi phải không? Hãy truy cập để tra cứu thông tin các thuật ngữ chuyên ngành tiếng Anh, Trung, Nhật, Hàn...liên tục được cập nhập. Từ Điển Số là một website giải thích ý nghĩa từ điển chuyên ngành thường dùng cho các ngôn ngữ chính trên thế giới. Khoa học phức tạp liên quan tới việc nghiên cứu động lực học của “mạng lưới phức tạp những người đại diện thích nghi – complex networks of adaptive agents” Shaw, 1997, p. 235. Trong tổ chức xã hội, khoa học phức tạp liên quan tới rất nhiều bên liên quan khác nhau. Một hệ thống thích nghi phức tạp thúc đẩy một quan điểm khác đối với những thay đổi mang tính chất tổ chức bởi vì nó “… thay đổi sự chú ý của các nhà cố vấn khỏi những thay đổi đã được lên kế hoạch sang những quá trình lộn xộn của chính đổ chức, chỗ mà có thể gây ra những thay đổi bất chợt không thể dự đoán trước được” Shaw, 1997, 1. Sự phức tạp và hệ thống thích nghi với phức tạp Sự phức tạp bắt nguồn từ mối quan hệ, hành động và sự kết nối bên trong của các thành phần trong một hệ thống và giữa một hệ thống và môi trường của nó. Phức tạp có nghĩa là kết hợp các liên kết hoặc kết nối phức tạp của các thành phần trong hệ thống hoặc giữa hệ thống với môi trường. Rất nhiều hệ thống tự nhiên như não bộ, hệ miễn dịch, hệ sinh thái, xã hội và rất nhiều hệ thống nhân tạo như hệ thống máy tính, hệ thống trí tuệ nhân tạo, mạng thần kinh nhân tạo, các chương trình tiến hóa. Các hệ thống này có đặc điểm là các hành vi hết sức phức tạp, đây chính là kết quả của sự tương tác không gian phi tuyến tính giữa nhiều hệ thống thành viên khác nhau ở nhiều mức độ tổ chức khác nhau. Những hệ thống này được biết đến với tên gọi hệ thống thích nghi với phức tạp CAS. CAS là hệ thống động lực học có khả năng thích nghi và tham gia vào một môi trường đang thay đổi. Việc nhận ra không có sự tách biệt nào giữa một hệ thống và môi trường của nó vì hệ thống luôn thay đổi để thích nghi với môi trường là vô cùng quan trọng. Hơn nữa, một hệ thống luôn có mối liên hệ chặt chẽ với các hệ thống khác để tạo nên một hệ sinh thái. Sự phân quyền trong quản lý Không có một cơ chế quản lý tập trung nào điều hành hành vi, hoạt động của hệ thống. Mặc dù mối quan hệ bên trong giữa các thành phần trong hệ thống tạo nên sự liên kết thì cũng không thể giải thích hành vi tổng thể bằng cách tổng hợp tất cả các phần riêng lẻ. Sự kết nối Như phần trên đã đề cập, sự phức tạp bắt nguồn từ những mối quan hệ, hoạt động và sự kết nối nội bộ của các thành phần trong hệ thống và giữa hệ thống với môi trường xung quanh nó. Điều này có nghĩa là một quyết định hay hành động trong hệ thống sẽ ảnh hưởng tới các phần liên quan nhưng mức độ ảnh hưởng là không giống nhau. Sự đồng tiến hóa Với sự đồng tiến hóa, các thành phần trong một hệ thống có thể thay đổi dựa trên những tương tác với một phần khác và với môi trường của nó. Ngoài ra, đặc điểm hành vi cũng thay đổi theo thời gian. Kauffman 1993 mô tả sự đồng tiến hóa với định nghĩa “cảnh quan phù hợp” Fitness landscape của mình. Cảnh quan phù hợp đối với một hệ thống X bao gồm một chuỗi rất nhiều đỉnh núi và thung lũng. Đỉnh núi càng cao thì càng phù hợp với thứ mà nó đại diện. sự cải tiến của X có thể coi như mộ hành trình qua quang cảnh phù hợp với mục tiêu ở đỉnh núi cao nhất. Nếu X bị cản lại ở đỉnh đầu tiên thì chiến lược là tăng cường cải tiến, khi đó các hệ thống được kết nối với nhau sẽ đưa ra tín hiệu hồi đáp và quan cảnh sẽ thay đồi. Cảnh quan phù hợp của hệ thống Nguồn Kauffman 1993 Sự nhạy cảm với tính phụ thuộc đối với điều kiện ban đầu CAS nhạy cảm với sự phụ thuộc vào điều kiện ban đầu. Sự thay đổi trong đặc điểm của những yếu tố đầu vào hay các quy luật đều không có tương quan một cách tuyến tính với những kết quả nhận được ở đầu ra. Sự thay đổi nhỏ có thể có tác động lớn tới hành vi tổng thể và một tác động tiêu cực to lớn tới hệ thống có thể lại không gây nên ảnh hưởng gì. Từ những năm 60 của thế kỷ XX, nhà vật lý người Mỹ Edward Lorentz đã nghiên cứu tìm lời giải cho phương trình mô tả các mẫu thời tiết. Mục tiêu của ông là dự đoán thời tiết trong dài hạn. Với sự trợ giúp của máy tính, ông đã có thể tìm ra lời giải, và nhận ra rằng ông đang phải giải quyết một dạng quy luật hành vi hoàn toàn mới. Một thay đổi rất nhỏ trong điều kiện ban đầu trong hệ thống thời tiết có thể dẫn tới những hậu quả không thể lường trước, ngay cả khi mọi thứ trong hệ thống đều kết nối với nhau theo một cách đã định. Trạng thái hiện tại của thời tiết không phải một yếu tố tiên đoán cho thời tiết trong vài ngày tới do chỉ cần một nhiễu động vô cùng nhỏ có thể gây ra những hành vi khác biệt vô cùng to lớn theo cấp số nhân. Phát kiến toán học này của Lorentz đã mang tới những thay đổi mạnh mẽ trong khoa học. Thế giới về căn bản là không thể đoán định khi đa số những quá trình trong tự nhiên đều vô cùng phức tạp. Điều này đồng nghĩa với sự kết thúc của sự chắc chắn mang tính khoa học, điều mà được coi là đặc tính căn bản của hệ thống “giản đơn” như trong bóng đèn điện, động cơ điện và các thiết bị điện tử sử dụng. Đoán định trước những hành vi của những hệ thống đúng nghĩa trên thực tế, về bản chất, đặc biệt là những thực thế sống là điều không thể. Vì vậy, những phán đoán trong dài hạn và sự quản lý đối với các hệ thống phức tạp được xem như là không thể. Trình tự xuất hiện Sự phức tạp được nói đến trong hệ thống thích nghi với phức tạp là tiềm năng xuất hiện của những hành vi khi đối mặt với những hiện tượng phức tạp và không đoán định. Những ví dụ về hệ thống thích nghi với phức tạp có thể kể đến như nền kinh tế của một quốc gia, hệ sinh thái, bộ não người, một phôi thai đang phát triển hay cả những đàn kiến. Mỗi hệ thống là một mạng lưới của nhiều tác nhân hoạt động đồng thời với nhau. Trong một nền kinh tế, các tác nhân có thể là những cá nhân hoặc các hộ gia đình. Trong hệ sinh thái, vai trò này thuộc về các giống loài. Các tế bào não chính là tác tác nhân trong một bộ não. Trong mỗi hệ thống này, mỗi tác nhân đều nằm trong một môi trường được tạo ra do chính những tác động và phản ứng của các tác nhân với nhau trong hệ thống. Những tác ộng qua lại liên tục giữa các tác nhân dẫn đến sự không cố định trong mọi yếu tố của môi trường. Trong nhiều năm qua, luật nhiệt động lực học thứ hai mà hệ thống có xu hướng rối loạn đã được chấp nhận rộng rãi. Một vài hệ thống có xu hướng theo trật tự và không rối loạn trong khi đó một số hệ thống khác lại không hướng tới sự rối loạn và đây là một trong những khám phá lớn trong khoa học nghiên cứu sự phức tạp. Sự trật tự có thể bắt nguồn từ những tương tác hồi đáp phi tuyến tính giữa các trạm mà mà mỗi trạm thực hiện nhiệm vụ riêng của mình. Những hành vi bất chợt có thể dễ dang được nhận ra như hành vi bay theo đàn của chim. Nghiên cứu sử dụng kích thích máy tính đã cho thấy rằng có thể mô tả hành vi bay theo đàn của chim bằng những quy luật đơn giản như khoảng giữa con chim này với con chim khác và khoảng cách từ 1 con chim tới những vật thể khác. Luật này được áp dụng riêng rẽ đối với mỗi con chim. Thực chat, đàn được tạo thành mỗi lần có kích thích, chính vì vậy sự tự tổ chức chính là một đặc tính cố hữu của CAS. Xa điểm cân bằng Nicolis và Prigogine 1989 chỉ ra rằng khi hệ thống vật lý hoặc hóa học bị đẩy ra khỏi điểm cân bằng thì nó có thể tồn tại hoặc phát triển. Nếu hệ thống duy trì ở trạng thái cân bằng, nó sẽ chết. Việc di chuyển ra khỏi vị trí cân bằng cho thể hiện cách mà hệ thống bị bắt buộc phải khám phá ra giới hạn của mình và tạo nên những cấu trúc khác biệt, những dạng quan hệ mới. Khi thay đổi lý quyết quản lý, mô hình của Kurt Lewin 1951 về xóa bỏ sự cố định của một hệ thống, thay đổi và cố định lại dựa trên lý tuyết về cân bằng động lực học. khi sự cân bằng bị tác động, các nguồn lực ủng hộ và ngăn cản thay đổi sẽ đưa hệ thống sang một điểm cân bằng khác. Tuy nhiên, trong một hệ thống thích nghi với phức tạp thì việc cố định hệ thống tại một điểm cân bằng, ổn định và vững chắc là vô nghĩa. Quản lý thay đổi chính là tạo điều kiện thay đổi hơn là thay đổi. Trạng thái nghịch lý Những nghiên cứu khác về hệ thống thích nghi phức tạp đã chỉ ra động lực học kết nối cả sự sắp đặt và sự hỗn loạn. Điều này củng quan niệm về sự không ổn đinh, giới hạn của sự hỗn loạn với đặc trưng là những nghịch lý Ổn định và không ổn định, cạnh tranh và hợp tác, theo thứ tự hoặc không theo thứ tự. Nguồn Phan Thanh Tú, Vũ Mạnh Chiến, Phạm Văn Kiệm, Lưu Đức Tuyến, Nguyễn Thị Hồng Nga 2018, Học Thuyết Doanh Nghiệp, NXB Lao Động – Xã Hội, trang 493-495. Đăng nhập Hệ thống phức tạp là một hệ thống bao gồm nhiều thành phần có thể tương tác với nhau. Ví dụ về các hệ thống phức tạp là khí hậu toàn cầu, sinh vật, não người, cơ sở hạ tầng như lưới điện, hệ thống giao thông hoặc liên lạc, các tổ chức kinh tế và xã hội như thành phố, hệ sinh thái, tế bào sống và cuối cùng là toàn bộ vũ trụ. Các hệ thống phức tạp là các hệ thống có hành vi rất khó mô hình hóa do sự phụ thuộc, cạnh tranh, mối quan hệ hoặc các loại tương tác khác giữa các bộ phận của chúng hoặc giữa một hệ thống nhất định và môi trường của nó. Các hệ thống " phức tạp " có các thuộc tính riêng biệt phát sinh từ các mối quan hệ này, chẳng hạn như phi tuyến tính, xuất hiện đột ngột, trật tự tự phát, thích ứng và các vòng phản hồi, trong số các mối quan hệ khác. Bởi vì các hệ thống như vậy xuất hiện trong nhiều lĩnh vực khác nhau, sự tương đồng giữa chúng đã trở thành chủ đề của lĩnh vực nghiên cứu độc lập của chúng. Trong nhiều trường hợp, rất hữu ích khi biểu diễn một hệ thống như một mạng nơi các nút đại diện cho các thành phần và liên kết đến các tương tác của chúng. Trong quá trình huấn luyện mô hình, chắc hẳn bạn đã gặp trường hợp với vấn đề mô hình dự đoán tốt trên tập train nhưng không dự đoán tốt trên tập test. Đó được hiểu bởi vì do mô hình quá phức tạp nhưng lại được được huấn luyện với lượng dữ liệu có giới hạn khi sử dụng Maximum Likelihood Estimation. Đó là hiện tượng overfitting. Khi đó, chúng ta có thể giảm số lượng tham số của mô hình, tuy nhiên, chúng ta sẽ đối mặt với việc mô hình đơn giản quá không nắm bắt được các xu hướng của dữ liệu. Việc để hiểu rõ lý do tại sao mô hình đưa ra kết quả như vậy, chúng ta phải tìm hiểu hai khái niệm, đó là Bias và Variance. Các thuật toán Machine Learning sử dụng mô hình Xác suất thống kê có hai loại sai số không thể tránh khỏi là avoidable error sai số có thể giảm thiểu được và unavoidable error sai số không thể điều chỉnh được. Unavoidable error là sai số do sự biến thiên tự nhiên trong hệ thống. Trong khi đó, avoidable error được thì lại dễ kiểm soát hơn và có thể tăng độ chính xác trong bài toán. Bias và Variance là các thành phần của sai số có thể giảm thiểu được. Tuy nhiên Bias chỉ có thể giảm đến một mức độ nhất định. Việc giảm được sai số đòi hỏi phải lựa chọn mô hình có độ phức tạp và linh hoạt phù hợp, cũng như bộ dữ liệu train thích hợp. Do đó chúng ta cần phải hiểu được sự khác biệt của Bias cũng như Variance để giảm được độ sai số và xây dựng mô hình chính xác. Mục lục Bias là gì?Variance là gì?Bias-Variance trade offOverfitting và UnderfittingBias và Variance trong bài toán thực tế 1. Bias là gì? Bias hay còn được hiểu là độ lệch, thiên vị, thiên kiến là sai khác giữa giá trị dự đoán và giá trị chính xác ground truth của dự đoán đó. Khi xây dựng mô hình chúng ta mong muốn sẽ tạo ra bias thấp. Điều đó đồng nghĩa với giá trị dự báo sẽ gần với ground truth hơn. Thông thường những mô hình quá đơn giản được huấn luyện trên những bộ dữ liệu lớn sẽ dẫn tới bias lớn. Hiện tượng này còn được gọi là mô hình bị chệch. Nguyên nhân của bị chệch thường là do mô hình quá đơn giản trong khi dữ liệu có mối quan hệ phức tạp hơn và thậm chí nằm ngoài khả năng biểu diễn của mô hình. Vì vậy trong tình huống này để giảm bớt bias thì chúng ta thường sử dụng mô hình phức tạp hơn để tận dụng khả năng biểu diễn tốt hơn của chúng trên những tập dữ liệu kích thước lớn. Định nghĩa Toán học. \text{Bias}\left\hat\theta\right=\text{E}\left\hat\theta\right – \theta Qua đây, chúng ta phần nào cũng hiểu được “lệch/ chệch” của từ bias ở đây nghĩa là gì. Nếu \footnotesize{\text{Bias}\left\hat\theta\right \ne 0} thì ta gọi estimator bị bias biased estimator. Nếu \footnotesize{ \text{Bias}\left\hat\theta\right = 0} thì ta gọi là unbiased estimator. Tất nhiên ở đây, unbiased estimator sẽ tốt hơn so với biased estimator, vì cái dự đoán của chúng ta đúng chính xác so với thực tế. Tuy nhiên câu hỏi đặt ra là phải chăng bias thấp thậm chí là unbiased estimator đang giúp mô hình kết quả chính xác hơn trên tập train, vậy có phải điều này là tốt? Câu trả lời là có, nhưng chưa đủ. Thuật toán tuyến tính thường có bias cao, khiến chúng học nhanh. Trong linear regression, bias đề cập đến sai số được đưa vào bằng cách tính gần đúng một vấn đề trong cuộc sống thực, vấn đề trong cuộc sống có thể rất phức tạp nhưng lại bằng một mô hình đơn giản hơn nhiều. Mặc dù thuật toán tuyến tính có thể tạo ra sự sai lệch, nhưng nó cũng làm cho đầu ra của chúng dễ hiểu hơn. Thuật toán càng đơn giản, nó càng có nhiều khả năng sai lệch. Ngược lại, các thuật toán phi tuyến tính thường có bias thấp. 2. Variance là gì? Variance hay phương sai là khái niệm đặc trưng cho sự phân tán của giá trị dự đoán. Trong mô hình, variance cao được hiểu là hiện tượng mô hình của bạn dự báo ra giá trị có mức độ dao động lớn nhưng thiếu tổng quát. Yếu tố thiếu tổng quát được thể hiện qua việc giá trị dự báo có thể khớp tốt mọi điểm trên tập huấn luyện nhưng rất dao động xung quanh giá trị ground truth trên tập huấn luyện. Những lớp mô hình phức tạp được huấn luyện trên tập huấn luyện nhỏ thường xảy ra hiện tượng phương sai cao và dẫn tới việc học giả mạo thông qua bắt chước dữ liệu hơn là học qui luật tổng quát. Định nghĩa Toán học. \text{Var}\left\hat\theta\right=\text E\left\text{E}\left\hat\theta\right -\hat \theta\right Dưới đây là một số mô hình trong Machine Learning và Bias và Variance tương ứng của nó. Thuật toánBiasVarianceLinear RegressionCaoThấpLogistic RegressionCaoThấpSupport Vector MachineThấpCaoK Nearest NeighborThấpCaoDecision TreeThấpCaoBaggingThấpCao thấp hơn Decision TreeRandom forestThấpCao thấp hơn Decision Tree Bảng 1 3. Bias-Variance trade off Trong ảnh 5 dưới đây, điểm trung tâm là điểm dự đoán tối ưu, cũng chính là giá trị chính xác mà ta đang muốn hướng tới. Các điểm màu xanh là dự đoán mô hình đã đưa ra. Như đã nói ở trên, low bias giúp các điểm dự đoán nằm gần tâm nhất sai số thấp. Tuy nhiên, chỉ mỗi bias thấp thôi là chưa đủ. Nếu mô hình có variance cao, sự phân bố của các điểm dự đoán tản mát ra xung quanh và làm cho một vài dự đoán xa rời tâm hình tròn sai số cao. Bias và Variance có mối quan hệ nghịch trong Machine Learning, không có mô hình nào vừa đạt mức tối thiểu của cả Bias và Variance. Khi một kỹ sư dữ liệu sửa đổi thuật toán ML để phù hợp hơn với một tập dữ liệu nhất định, nó sẽ dẫn đến Bias thấp – nhưng đồng thời nó sẽ làm tăng Variance. Bằng cách này, mô hình sẽ phù hợp với tập dữ liệu đồng thời tăng khả năng đưa ra các dự đoán không chính xác. Điều tương tự cũng áp dụng khi tạo mô hình phương sai thấp với bias cao hơn. Mặc dù nó sẽ giảm nguy cơ dự đoán không chính xác, nhưng mô hình sẽ không khớp đúng với tập dữ liệu. Đó là sự cân bằng tinh tế giữa những bias và phương sai này. Ta sẽ đi xem xét một kết quả tổng quát sau. Giả sử chúng ta có một tập dữ liệu train gồm \footnotesize{n} điểm \footnotesize{D=\left\{x_1,y_1,x_2,y_2,\cdots,x_n,y_n\right\} } và một hàm huấn luyện được ước lượng từ tập huấn luyện là \footnotesize{\hat fx,D} . Ở đây ký hiệu \footnotesize{\hat fx,D} để thể hiện rằng hàm này được hồi quy dựa vào tập dữ liệu \footnotesize{D} huấn luyện. Kỳ vọng của chúng ta là hàm \footnotesize{\hat fx,D} sẽ gần xấp xỉ hàm thực tế là \footnotesize{fx} . Hàm \footnotesize{fx} biểu diễn mối quan hệ thực giữa \footnotesize{x} và \footnotesize{y} . Đồng thời chúng ta chấp nhận một phần sai số nhiễu \footnotesize{\epsilon} giữa hàm \footnotesize{fx} và giá trị ground truth . Đây là phần sai số luôn luôn tồn tại giữa mô hình dự báo và grouth truth. Hay nói cách khác, bất kì mô hình nào cũng sẽ có sai số nếu như dữ liệu là ngẫu nhiên và mối quan hệ giữa đầu vào \footnotesize{x} và đầu ra \footnotesize{y} không được sinh ra bởi một hàm số được chủ định trước. Chính vì không thể tránh khỏi nên sai số này được coi như là một thành phần sai số không thể tránh khỏi unvoidable error. Chúng ta giả định chúng như là thành phần nhiễu có kỳ vọng bằng \footnotesize{0} và phương sai là \footnotesize{\hat\sigma_\epsilon^2} . Như vậy y_i=fx_i+\epsilon_i Khi đó, Mean Squared Error \footnotesize {\text E \left\lefty-\hat fx;D\right^2\right} MSE – Trung bình bình phương sai số được xác định bởi Bias và Variance như sau \text{MSE}=\text{Bias}^2+\text{Variance}+\text{Unvoidable Error} Thật vậy, trước hết ta có nhận xét như sau \begin{matrix} f- \mathrm E\left\hat f\right = \mathrm {const}&1\\ \mathrm E\left\epsilon\right=0,\mathrm E\left\mathrm E\left\hat f\right-\hat f\right=\mathrm E\left\hat f\right-\mathrm E\left\hat f\right=0 & 2 \end{matrix} Bởi vì \footnotesize\hat f và \footnotesize \epsilon độc lập với nhau nên ta có \begin{aligned} \text E\left\lefty-\hat f\right^2\right&=\text E\left\leftf+\epsilon-\hat f\right^2\right \\ & = \text E\left\leftf-\text E\left\hat f\right+\epsilon+ \text E\left\hat f\right -\hat f\right^2\right \\ & = \text E\left\leftf-\text E\left\hat f\right\right^2\right+\text E \left\epsilon^2\right+\text E\left\left\text E\left\hat f\right-\hat f\right^2\right \\& \text{ }+2 \text E\left\leftf-\text E\left\hat f\right\right\epsilon\right +2 \text E\left\left\text E\left\hat f\right-\hat f\right\epsilon\right \\&\text{ }+2 \text E\left\left\text E\left\hat f\right-\hat f\right \leftf-\text E\left\hat f\right\right \right \\&= \leftf-\text E\left\hat f\right\right^2+\text E \left\epsilon^2\right+\text E\left\left\text E\left\hat f\right-\hat f\right^2\right \\&\text{ }+2 \leftf-\text E\left\hat f\right\right\text E\left\epsilon\right+2 \text E\left\left\text E\left\hat f\right-\hat f\right\right\text E\left\epsilon\right \\&\text{ }+2 \text E\left\left\text E\left\hat f\right-\hat f\right \leftf-\text E\left\hat f\right\right \right&\left\text{do } 1 \right\\ &= \leftf-\text E\left\hat f\right\right^2+\text E \left\epsilon^2\right+\text E\left\left\text E\left\hat f\right-\hat f\right^2\right& \left \text{do } 2 \right\\ &= \mathrm{Bias}^2\left\hat f\right + \sigma^2_\epsilon + \mathrm {Var} \left\hat f\right \end{aligned} Ảnh 6 dưới đây minh hoạt về tổng sai số so với Variance và Bias. Qua đó, chúng ta sẽ có cái nhìn rõ hơn vì sao phải đánh đổi giữa bias và variance Ở ảnh 6, chúng ta có thể thấy được độ sai số bias, variance, và tổng sai số liên hệ với độ phức tạp của mô hình model complexity. Nếu như độ phức tạp của mô hình tăng lên thì bias sẽ giảm và variance sẽ tăng. Khi mô hình quá đơn giản hay quá phức tạp thì tổng sai số cũng sẽ cao. Để giảm sai số của mô hình chúng ta cần phải giữ độ phức tạp của mô hình ở mức vừa đủ. 4. Overfitting và Underfitting Overfitting hay quá khớp là hiện tượng khi mô hình xây dựng thể hiện được chi tiết bộ dữ liệu train nhưng không dự đoán đủ tốt trên dữ liệu test. Một mô hình có hiện tượng overfitting đồng nghĩa là nó có high variance. Nguyên nhân bắt nguồn từ việc mô hình có nhiều tham số mô hình quá phức tạp so với lượng dữ liệu train. Điều này khiến mô hình dự đoán tốt trên dữ liệu train này. Tuy nhiên mô hình đã quá khớp vào tập dữ liệu train, kết quả dự đoán trên tập test sẽ không còn tốt hơn. Underfitting hay chưa khớp là hiện tượng khi mô hình xây dựng chưa có độ chính xác cao trong tập dữ liệu huấn luyện cũng như tổng quát hóa với tổng thể dữ liệu. Khi hiện tượng Underfitting xảy ra đồng nghĩa với việc mô hình có high bias. Nguyên nhân bắt nguồn từ việc mô hình có quá ít tham số, nó sẽ dẫn đến sự đơn giản quá mức so với cả dữ liệu train lẫn dữ liệu test. Good fitting vừa khớp là nằm giữa Overfitting và Underfitting. Tức là mô hình cho ra kết quả hợp lý trên cả tập train lẫn với tập test. Good fitting là mục tiêu của mọi bài toán, tuy nhiên, trên thực tế, vấn đề này rất khó thực hiện. Để đạt được good fitting chúng ta phải hiểu và tránh được Overfitting và Underfitting. Một số phương pháp dùng để tránh Overfitting và Underfitting như sau. OverfittingUnderfittingSử dụng giảm chiều dữ liệu và trích xuất đặc trưng Tăng feature cho dữ liệuTăng kích thước cho tập trainTìm kiếm các thuật toán phức tạp hơnSử dụng phương pháp regularizationSử dụng mixture model hoặc essemble learningSử dụng phương pháp BaggingSử dụng phương pháp Boosting Bảng 2 Có thể thấy, để giải quyết được vấn đề Overfitting, chúng ta phải đi giảm variance. Bản chất high variance cho thấy mô hình quá phức tạp so với dữ liệu train. Nên chúng ta cần tăng sự phức tạp của tập train bằng cách tăng kích thước của mô hình hoặc là sử dụng phương pháp Bagging. Hay là chúng ta có thể giảm độ phức tạp của model bằng cách giảm chiều dữ liệu, khi đó số lượng tham số của mô hình của mô hình cũng giảm theo. Chúng ta có thể tăng bias lên bằng cách sử dụng phương pháp regularization. Để giải quyết vấn đề Underfitting, về bản chất, chúng ta phải đi giảm bias. High bias cho thấy mô hình chúng ta đang quá đơn giản so với cả tập train lẫn tập test. Do đó, chúng ta cần tăng sự phức tạp của mô hình bằng cách tìm kiếm các phương pháp phức tạp hơn, sử dụng mixture model, essemble learning hoặc là phương pháp boosting. Việc tăng feature cho dữ liệu, về bản chất nó cũng sẽ tăng sự phức tạp của mô hình, việc tăng chiều dữ liệu sẽ khiến số lượng tham số của mô hình cũng tăng lên, nên từ đó mô hình cũng sẽ trở nên phức tạp hơn. 5. Bias-Variance trade off trong bài toán thực tế Đầu tiên là lấy ví dụ bạn đang trong quá trình hoàn thiện bài viết AI Club Writing để nộp, bạn muốn nhờ người khác lấy ý kiến đánh giá. Nhưng nếu bạn nhờ quá nhiều người, việc này sẽ khiến bạn có nhiều ý kiến khách quan hơn về bài viết. Chứng tỏ rằng mô hình đang có low variance và high bias bởi vì bài viết của bạn sẽ nhận được nhiều ý kiến trái chiều, từ khen cho tới chê, và đôi khi bạn có thể sẽ nhận được thông tin vô nghĩa, không cần thiết. Khi này bạn cần lựa chọn đưa bài viết cho 3 người có các điểm mạnh khác nhau. Bởi vì do những điểm mạnh khác nhau của 3 người này sẽ cho bạn phương sai cao để nhận về bias thấp. Đấy chính là Bias-Variance trade off. Trong trường hợp này, chúng ta có thể chấp nhận phương sai lớn để nhận về bias thấp. Tuy nhiên, không phải bài toán nào chúng ta cũng hướng tới đến bias thấp. Đôi khi chúng ta cần hướng tới sự cân bằng giữa bias và variance. Giả sử bạn đang lấy ý kiến khảo sát về việc người Việt Nam suy nghĩ gì về việc cho học sinh, sinh viên trở lại trường học trong bối cảnh hiện nay. Nếu bạn hỏi quá ít người, chỉ tầm 10 người đến từ các độ tuổi, nơi ở khác nhau. Thì khi đó, ý kiến bạn nhận được sẽ rất khác nhau. Bạn sẽ nhận được về phương sai cao tuy nhiên bias sẽ thấp bởi vì nó sẽ không thể đại diện được cho tổng thể được toàn bộ người dân Việt Nam. Để giải quyết vấn đề đó, bạn sẽ cần phải hỏi 5000 người. Tuy nhiên, nếu bạn hỏi 5000 học sinh đến từ Hồ Chí Minh để khái quát cho toàn bộ người Việt Nam ở tất các các độ tuổi và ở tất cả các vùng miền. Ở đây bạn đã có variance thấp nhưng bias lớn. Bạn cần khảo sát cả những người ở những độ tuổi và các nơi ở khác. Lúc này chúng ta sẽ có cân bằng được bias và variance. Lời kết Thông qua bài viết trên, vậy là chúng ta đã cùng nhau đi tìm hiểu về hai khái niệm quan trọng để giúp chúng ta cải thiện mô hình. Hy vọng với những mình chia sẻ mọi người sẽ có cái nhìn khái quát hơn về việc cải thiện mô hình. Cảm ơn mọi người đã ghé thăm Tutorial của CLB UIT-AI. Mọi ý kiến đóng góp bài viết, xin hãy để lại bình luận dưới bài viết. Tài liệu tham khảo Master in Data Science – Difference between bias and varianceVIBLO – The bias variance decompositiontowardsdatascience – Two important machine learning concepts to impove every modelPiMA – Bias và Variance Trí tuệ nhân tạo – Vấn đề Overfitting & Underfitting trong Machine Learning Wikipedia – Bias–variance tradeoffphamdinhkhanh – Độ chệch bias và phương sai variancephamdinhkhanh – Sự đánh đổi giữa độ chệch và phương saiLinh nghiem – Đánh đổi thiên vị và phương sai trong cuộc sống Nói ra lời này, Đinh Hi có chút lo lắng nhìn Vương Trạch Vinh. Y đã nghĩ ngoài việc này thì đúng là không thể lấy được chuyện gì đả động được Vương Trạch Vinh. Mình nói chuyện này ra, nếu Vương Trạch Vinh có hứng thú thì coi như mình có thể dựa vào Em gái anh?Vương Trạch Vinh nói câu này xong liền từ từ hút thuốc. Hắn đang suy nghĩ nhanh về quan hệ của việc này. Nếu đối phương nói ra thì nhất định chính là có chuyện người ta không muốn Hi nghe Vương Trạch Vinh nói như vậy liền thở phào nhẹ nhõm. Đinh Hi cười khổ nói- Năm đó khi Phó chủ tịch học đại học thì rất thích em gái tôi. Đúng, em gái tôi là Đinh Thiến Thiến, bây giờ đang làm phó đoàn trưởng Vũ đoàn Trung nhà làm văn hóa. Vương Trạch Vinh thoáng cái hiện ra hình ảnh Đinh Thiến Thiến kia. Đối với người phụ nữ này thì Vương Trạch Vinh cũng thấy trên Tv. Mặc dù đã có tuổi nhưng lại không hề già chút nào, vẫn quyến rũ. Đối với người Đinh gia, Vương Trạch Vinh cũng không hiểu mấy. Có tài nguyên tốt như vậy mà đi làm văn giờ Đinh Hi coi như đã buông ra. Y vốn nghĩ giới văn hóa không phức tạp như chính trị, ai ngờ tiến vào mới biết chẳng đâu trong sạch cả. Y đang định chuyển nghề thì lão gia tử mất đi, mặc dù dựa vào quan hệ bao năm của lão gia tử thì vẫn có thể theo chính trị. Nhưng bọn họ biết năng lực của mình, theo chính trị thì nhất định bị người ta bóp chết, hơn nữa vốn yêu thích văn hóa nên mới ở trong ngành này. Đinh Hi chỉ coi như nửa theo chính trị. Bây giờ chỗ dựa lớn nhất chính là Trịnh Ân Bảo. Nhưng em gái mình không biết như thế nào, sau khi chồng chết lại nuôi con mà không kết hôn, cũng không liên lạc với Trịnh Ân Bảo, khiến y không thể làm gì khác là ám chỉ với Ngô Tán Lâm. Lúc này mới có việc Ngô Tán Lâm tích cực qua lại với nay tiết lộ với Vương Trạch Vinh, đây đúng là vấn đề nhạy cảm đã khiến Vương Trạch Vinh động khi làm rõ quan hệ giữa Đinh Hi và Ngô Tán Lâm, Vương Trạch Vinh mặc dù muốn quan hệ với Đinh Hi thì cũng không muốn nhanh như vậy đã tỏ thái độ- Đúng là việc thú vị, xem ra Bí thư Ngô cũng biết việc Trạch Vinh vừa nói như vậy, Đinh Hi biết mình phải nói ra- Nói vậy Bí thư Vương cũng hiểu các gia tộc Bắc Kinh. Đinh gia chúng tôi trước đây cũng rất tốt, hợp tác tốt với Hạng gia, làm mất lòng nhiều người. Sau khi lão gia tử đi thì Đinh gia rất khó khăn, nếu không phải có Hạng gia giúp thì đã có vấn đề. Không ngờ sau đó Hạng lão gia tử cũng đi, cứ như vậy quan hệ hai bên xa dần. Ở Trung Quốc nếu không có chỗ dựa cực mạnh thì rất khó Trạch Vinh nhớ đến tình hình Hạng gia sau khi lão gia tử qua đời và gật đầu. Nếu xuất hiện vấn đề gì thì đúng là có hậu quả lớn, khó trách các gia tộc đều phí công sức bồi dưỡng người kế nghiệp. Vương Trạch Vinh cũng không cắt ngang lời đối phương, hắn muốn biết tình hình cụ Hi hút một hơi thuốc rồi nói- Em gái tôi lúc học ở trường có không ít người theo đuổi, Phó chủ tịch cũng thích em tôi, hai người lúc ấy đã đến nhà của nhau. Tôi vốn không đồng ý, nhưng hai người kia lại quyết tâm. Cuối cùng không biết sao em tôi uống nhầm thuốc lại lấy một tên ngôi sao ca nhạc rất nổi Đinh Hi, Vương Trạch Vinh coi như hiểu thêm về đám thiếu gia Bắc Kinh. Tình hình lúc ấy có lẽ rất phức tạp. Là người Đinh gia thì sao có thể để ý người không có thế lực lớn chứ. Từ kinh nghiệm của Phó chủ tịch thì có thể thấy ông ta mặc dù có quan hệ nên mới phát triển, nhưng mới đầu không có quan hệ nào mạnh. Đinh Hi có lẽ là người phản đối mạnh Em gái anh về sau không liên lạc với Phó chủ tịch sao? Vương Trạch Vinh nếu xảy ra với người bình thường thì Vương Trạch Vinh không chú ý, nhưng đây là người sắp làm Tổng bí thư, Vương Trạch Vinh có chút hưng phấn nếu tìm ra bí Hi lắc đầu nói- Tôi không biết như thế nào cả, em gái tôi bây giờ vẫn không liên lạc với Phó chủ tịch, nếu không tôi cũng không phải lo lắng cho Đinh gia. Vương Trạch Vinh thầm nghĩ người ta có gặp hay không cũng không nhất định phải nói cho anh. Việc này có vấn thế Vương Trạch Vinh cảm thấy quan hệ với Đinh gia cũng không phải việc Bí thư Ngô cũng là do tôi lộ tin tức này Hi có chút do dự rồi Trạch Vinh cười cười, hắn biết là như vậy. Mặc kệ Đinh Hi có mục đích gì thì dùng việc này để ổn định Đinh gia cũng không phải không thể chấp Trạch Vinh nhìn Đinh Hi, hắn tin đám người xuất thân gia tộc lớn như vậy thì ngu đến đâu cũng lưu lại tay sau. Đinh Hi này nếu muốn thông qua việc này để lợi dụng Ngô Tán Lâm, thì sao không nghĩ đến vấn đề sau khi lợi dụng xong. Hơn nữa Đinh Thiến Thiến kia và Trịnh Ân Bảo có quan hệ không Vương Trạch Vinh nhìn tới đầy ẩn ý, Đinh Hi cười thầm trong lòng. Y đương nhiên biết điểm mấu chốt đã tới, có thể dựa vào Vương Trạch Vinh hay không chính là bây Tôi có chút tài liệu liên quan tới Bí thư Ngô, có lẽ có tác dụng với Bí thư Hi cẩn thận Đinh Hi nói có thứ gì đấy về Ngô Tán Lâm, Vương Trạch Vinh hơi động tâm, sau đó nói ra một câu- Tôi hôm nay tới đây chỉ để thư giãn mà ngờ Vương Trạch Vinh lại bỏ qua nhược điểm về Ngô Tán Lâm, Đinh Hi thoáng cái có chút lo lắng, kết quả này là điều y không ngờ Đinh Hi có chút lo lắng, Vương Trạch Vinh cười nói- Lão Đinh, vừa nãy nghe anh nói Đinh gia và Hạng gia vẫn hợp tác tốt, chúng ta phải duy trì mới Hi đang lo lắng nghe thấy vậy liền vui mừng ra mặt. Y đương nhiên nghe ra Vương Trạch Vinh đồng ý nhận mình nên rất cung kính nói- Bí thư Vương, sau này chỉ cần tôi có thể làm gì, tôi sẽ nghiêm túc đi Trạch Vinh cũng không phải không muốn lấy nhược điểm của Ngô Tán Lâm, nhưng cuối cùng cũng bỏ suy nghĩ mê người này đi. Ngô Tán Lâm dù không cần hắn ra tay cũng xong đời. Ngô Tán Lâm nhất định đã ngã, nếu như vậy mình không cần phải đâm làm gì. Hơn nữa mình sắp vào Bộ Chính trị, đối với hắn thì cố gắng không dùng mưu kế mới có lợi cho sự phát Chuyện Bắc Kinh thì anh cũng biết, thuận thế là rất quan Trạch Vinh cười Hi nghiêm túc nói- Bí thư Vương nói Trạch Vinh không cần không có nghĩa người khác không cần. Câu này của Vương Trạch Vinh đã nói rõ Đinh Hi phải làm gì. Đinh Hi biết Vương Trạch Vinh không muốn dính vào việc này, xem ra mình phải bố trí một Trạch Vinh đang phân tích quan hệ giữa Đinh gia và Trịnh Ân Bảo. Từ lời Đinh Hi, Vương Trạch Vinh cũng phân tích với mình, như vậy Đinh Thiến Thiến nhất định có tình cảm với Trịnh Ân Bảo, quan hệ nam nữ thì cũng rõ. Năm đó Trịnh Ân Bảo có lẽ là thanh niên nhiệt huyết, hai người cãi nhau hoặc xuất hiện nguyên nhân gì đấy nên chia tay. Chẳng qua nhiều năm qua đi ai biết Trịnh Ân Bảo và Đinh Thiến Thiến còn tình cảm không?Vương Trạch Vinh còn một suy nghĩ đó là chồng Đinh Thiến Thiến bị bệnh chết có quan hệ với Trịnh Ân Bảo không?Suy nghĩ này vừa lóe lên làm Vương Trạch Vinh phải giật Lão Đinh, sau này chúng ta phải tăng cường liên lạc. Nam Điền đang phát triển, rất cần các anh đến chỉ đạo về văn Trạch Vinh nói sang chuyện Hi biết bây giờ đã dựa vào Vương Trạch Vinh, ít nhất Vương Trạch Vinh không phản đối việc mình dựa vào. Đương nhiên từng đó là chưa đủ, phải tăng cường thêm Bí thư Vương, việc này dễ làm, chúng tôi lập tức liên lạc với Ban Tuyên giáo Tỉnh ủy Nam Hi liền tỏ thái độ Trạch Vinh cười nói- Hôm nay nói chuyện với anh rất người nói sang chuyện khác rồi cười cười đi về phòng Hồ Húc Đông đang ngồi đó nói chuyện với mọi người, Vương Trạch Vinh đúng là phục năng lực thích ứng của người Bộ trưởng Hồ đúng là nhảy Trạch Vinh cười Vương Trạch Vinh cùng Đinh Hi từ phòng khác đi ra, Hồ Húc Đông mặc dù có chút khó hiểu nhưng vẫn cười nói- Bí thư Vương không ở đây nên tôi mệt chết.

quan hệ phức tạp