- vừa được xem lúc

Tổng hợp kiến thức trên Elements of AI

0 0 7

Người đăng: Lê Huỳnh Đức

Theo Viblo Asia

Dưới đây là kiến thức mình tổng hợp sau khi học xong khoa học trên Elements of AI

**I. What is AI

_____________________ 1 _____________________

  1. Nên định nghĩa AI thế nào?
  • Tùy theo cách nhìn của mỗi người:
  • AI có thể là dạng sống nhân tạo có trí thông minh
  • AI có thể là mọi công nghệ xử lý dữ liệu

_____________________ 2 _____________________

  • Vài ứng dụng của AI:
  • Ứng dụng 1. Xe tự lái
  • Ứng dụng 2. Đề xuất nội dung
  • Ứng dụng 3. Xử lý ảnh và video

_____________________ 3 _____________________

Ứng dụng 1. Xe tự lái

  • Các kỹ thuật: +Tìm kiếm
  • Lập kế hoạch (để tìm đường đi phù hợp)
  • Thị giác máy tính (để xác định chướng ngại vật, đèn tín hiệu,... và đưa ra quyết định đối phó)

_____________________ 4 _____________________

Ứng dụng 2. Đề xuất nội dung Đề xuất nội dung phù hợp với người dùng trên các website, MXH...

_____________________ 5 _____________________

Ứng dụng 3. Xử lý ảnh và video

  • Ứng dụng: Được sử dụng trong nhiều ứng dụng của chính phủ, doanh nghiệp
  • Tự động gắn thẻ trên MXH
  • Kiểm soát hộ chiếu
  • ...
  • Điều chỉnh ảnh dưới phong cách của các họa sĩ
  • Tạo ra các nhân vật giống trong phim
  • Điểm hạn chế: Có thể tạo ra các ảnh, video giả mạo

_____________________ 6 _____________________

  • Tại sao khái niệm AI mơ hồ với mọi người:
  • Lý do 1: Không có định nghĩa thống nhất chính thức
  • Lý do 2: Di sản của khoa học viễn tưởng
  • Lý do 3: Những gì có vẻ DỄ DÀNG thực sự KHÓ...
  • Lý do 4: Những gì có vẻ KHÓ thực sự DỄ DÀNG...

_____________________ 7 _____________________

Lý do 1: Không có định nghĩa thống nhất chính thức

Ví dụ, 50 năm trước, các phương pháp tìm kiếm và lập kế hoạch tự động được coi là thuộc về lĩnh vực TTNT thì ngày nay các phương pháp như vậy được dạy cho mọi sinh viên IT. Tương tự, một số phương pháp xử lý thông tin không chắc chắn đang được hiểu rõ đến mức chúng có thể sẽ sớm được chuyển từ AI sang thống kê hoặc xác suất.

_____________________ 8 _____________________

Lý do 2: Di sản của khoa học viễn tưởng

_____________________ 9 _____________________

Lý do 3: Nhận biết những gì có vẻ dễ dàng là điều thực sự khó...

Khó biết nhiệm vụ nào dễ và nhiệm vụ nào khó Ví dụ, nhặt cái bút dưới đất lên là 1 nhiệm vụ mà chúng ta thấy rất dễ

Tuy nhiên, trong thực tế thì thì:

  • Bạn phải sử dụng mắt để quan sát xung quanh, tìm ra đâu là cái bút
  • Sau đó lập kế hoạch quỹ đạo cho bàn tay của bạn. chạm vào vật đó
  • Sau đó di chuyển bàn tay của bạn bằng cách co các cơ khác nhau theo trình tự và cố gắng bóp vật đó với một lực vừa đủ để giữ vật đó giữa các ngón tay của bạn. -> Vì vậy, đối với robot đây là việc khó

_____________________ 10 _____________________

Lý do 4: Nhận biết những gì có vẻ khó là điều thực sự dễ dàng...

Ví dụ, chơi cờ vua có vẻ khó, đòi hỏi luyện tập nhiều Tuy nhiên, đối với máy tính sau khi được lập trình các quy tắc thì nó có thể tính toán được rất nhiều phép toán và chơi tốt khi được training

Hoặc thành thạo Toán học có thể là việc khó khăn Tuy vậy, máy tính có thể giải quyết thông qia các bộ quy tắc đơn giản

_____________________ 11 _____________________

  • Một số lưu ý:
  • AI không phải là danh từ đếm được AI là một ngành khoa học, giống như toán học hay sinh học. Điều này có nghĩa là AI là một tập hợp các khái niệm, vấn đề và phương pháp để giải quyết chúng
  • Không thể so sánh 2 AI với nhau
  • Nếu bạn muốn nói chuyện chuyên nghiệp, hãy tránh nói "AI" mà thay vào đó hãy nói "an AI method"

_____________________ 12 _____________________

  1. Lĩnh vực liên quan

Bao gồm: Học máy, Khoa học dữ liệu, Học sâu, Robotics...

  • Học máy là các hệ thống cải thiện hiệu suất của chúng trong một nhiệm vụ nhất định với ngày càng nhiều kinh nghiệm hoặc dữ liệu.

  • "Độ sâu" của học sâu đề cập đến sự phức tạp của một mô hình toán học

  • Khoa học dữ liệu là một thuật ngữ chung bao gồm học máy, thống kê và một số khía cạnh của KHMT bao gồm thuật toán, lưu trữ dữ liệu và phát triển ứng dụng web. Khoa học dữ liệu cũng là một ngành thực tế đòi hỏi sự hiểu biết về lĩnh vực mà nó được áp dụng

_____________________ 13 _____________________

  • Robotics có nghĩa là xây dựng và lập trình robot để chúng có thể hoạt động trong các tình huống phức tạp trong thế giới thực. Theo một cách nào đó, người máy là thách thức cuối cùng của AI vì nó đòi hỏi sự kết hợp của hầu như tất cả các lĩnh vực của AI. Ví dụ:
    • Thị giác máy tính và nhận dạng giọng nói để cảm nhận môi trường
    • Xử lý ngôn ngữ tự nhiên, truy xuất thông tin và suy luận trong điều kiện không chắc chắn để xử lý hướng dẫn và dự đoán hậu quả của các hành động tiềm ẩn
    • Mô hình nhận thức và điện toán tình cảm (affective computing - hệ thống phản ứng với các biểu hiện cảm xúc của con người hoặc bắt chước cảm xúc) để tương tác và làm việc cùng với con người

Nhiều vấn đề về trí tuệ nhân tạo liên quan đến rô-bốt được tiếp cận tốt nhất bằng học máy, điều này làm cho học máy trở thành một nhánh trung tâm của trí tuệ nhân tạo dành cho rô-bốt.

Tóm lại, rô-bốt là một cỗ máy bao gồm các cảm biến (cảm nhận môi trường) và bộ truyền động (tác động lên môi trường) có thể được lập trình để thực hiện các chuỗi hành động.

Có thể nói, bất kỳ loại phương tiện nào có ít nhất một số mức độ tự chủ và bao gồm các cảm biến và bộ truyền động cũng được coi là robot.

Mặt khác, các giải pháp dựa trên phần mềm như chatbot dịch vụ khách hàng, ngay cả khi chúng đôi khi được gọi là “rô-bốt phần mềm”, không được tính là rô-bốt (thực).


**II. AI problem solving

_____________________ 1 _____________________

  1. Tìm kiếm và giải quyết vấn đề
  • Có nhiều cách để giải quyết một vấn đề
  • Các kỹ thuật tìm kiếm khác nhau có thể dẫn đến các giải pháp khác nhau
  • Giai đoạn đầu tiên của quá trình giải quyết vấn đề: xác định các lựa chọn và hậu quả của chúng. Điều này thường không hề tầm thường và có thể đòi hỏi phải suy nghĩ cẩn thận Sau khi điều này được thực hiện, chúng ta có thể tìm kiếm một chuỗi các hành động dẫn từ trạng thái ban đầu đến mục tiêu.

_____________________ 2 _____________________

  • Trong chương này, chúng ta sẽ thảo luận về hai loại vấn đề:
  • Tìm kiếm và lập kế hoạch trong môi trường tĩnh chỉ với một "tác tử"
  • Trò chơi có hai "tác tử" thi đấu với nhau

_____________________ 3 _____________________

  • Không gian trạng thái (The state space): là tập hợp các tình huống có thể xảy ra. Nếu nhiệm vụ là điều hướng từ địa điểm A đến địa điểm B, thì không gian trạng thái có thể là tập hợp các vị trí được xác định bởi tọa độ (x,y) của chúng mà có thể đạt được từ điểm bắt đầu A. Hoặc chúng ta có thể sử dụng một tập hợp các vị trí bị ràng buộc , ví dụ, các địa chỉ đường phố khác nhau để số lượng trạng thái có thể bị hạn chế

  • Chuyển tiếp (Transitions): là có thể di chuyển giữa trạng thái này sang trạng thái khác Chỉ nên tính các chuyển đổi trực tiếp có thể được thực hiện bằng một hành động duy nhất Một chuỗi nhiều chuyển đổi Ví dụ: từ A đến C là một đường dẫn chứ không phải là một chuyển đổi.

  • Chi phí (Costs): ví dụ thời gian, khoảng cách

_____________________ 4 _____________________

  1. Tìm kiếm và games
  • Trò chơi có tổng bằng không (zero-sum games) là một giả định mà cả hai người chơi đều chọn điều tốt nhất cho họ Và điều tốt nhất cho người này là điều tồi tệ nhất cho người kia
  • Kinh nghiệm tốt Ví dụ, các phương pháp phỏng đoán tốt cho cờ vua thường tính số lượng quân cờ có trọng số theo loại của chúng:
  • quân hậu thường được coi là có giá trị gấp hai lần quân xe
  • quân mã gấp ba lần quân tượng và gấp chín lần quân tốt
  • nhà vua có giá trị hơn tất cả những thứ khác cộng lại Hơn nữa, việc chiếm giữ các vị trí chiến lược quan trọng gần giữa bàn cờ được coi là một lợi thế và các phương pháp phỏng đoán gán giá trị cao hơn cho các vị trí đó.

** Xem thêm thuật toán Minimax


**III. Real world AI

_____________________ 1 _____________________

  1. Tỷ lệ cược và xác suất (Odds and probability)

Trong thế giới thực, mọi thứ hiếm khi rõ ràng, thông tin hiếm khi hoàn hảo

Lấy ví dụ về ô tô tự lái, bạn có thể đặt mục tiêu đi từ A đến B một cách hiệu quả và an toàn, tuân thủ mọi luật lệ. Nhưng điều gì sẽ xảy ra nếu tình trạng giao thông trở nên tồi tệ hơn dự kiến, có thể do một tai nạn phía trước? Thời tiết xấu đột ngột? Các sự kiện ngẫu nhiên như một quả bóng nảy trên đường phố hay một mảnh rác bay thẳng vào camera của ô tô?

Một chiếc ô tô tự lái cần sử dụng nhiều loại cảm biến, bao gồm cả cảm biến giống như sonar và camera, để phát hiện vị trí của nó và những gì xung quanh nó. Những cảm biến này không bao giờ hoàn hảo vì dữ liệu từ các cảm biến luôn bao gồm một số lỗi và không chính xác được gọi là “nhiễu”. Ví dụ, một cảm biến cho biết con đường phía trước rẽ trái, nhưng một cảm biến khác lại chỉ ra hướng ngược lại.

_____________________ 2 _____________________

Xác suất:

Lịch sử của AI đã chứng kiến ​​nhiều mô hình khác nhau để xử lý thông tin không chắc chắn và không chính xác. Ví dụ, Logic mờ Logic mờ ĐÃ TỪNG là cách tiếp cận tốt nhất để xử lý thông tin không chắc chắn và không chính xác Được sử dụng trong nhiều ứng dụng của khách hàng như máy giặt, nơi máy có thể phát hiện độ bẩn (một vấn đề về mức độ, không chỉ bẩn hay sạch) và điều chỉnh chương trình cho phù hợp

Tuy nhiên, xác suất lại là cách tiếp cận tốt nhất để lập luận trong điều kiện không chắc chắn và hầu hết tất cả các ứng dụng AI hiện tại đều dựa trên xác suất, ít nhất ở một mức độ nào đó.

_____________________ 3 _____________________

Bài học trọng tâm về xác suất:

  • Là khả năng nghĩ về sự không chắc chắn như một thứ có thể được định lượng ít nhất về mặt nguyên tắc. Có nghĩa là chúng ta có thể nói về sự không chắc chắn như thể nó là một con số - các con số có thể được so sánh (VD: điều này có khả năng xảy ra hơn điều kia), và chúng thường có thể đo lường được.

Bằng cách thu thập dữ liệu một cách có hệ thống, có thể đánh giá một cách nghiêm túc các tuyên bố xác suất và các con số đôi khi có thể được xác định là đúng hoặc sai. Nói cách khác, bài học quan trọng là sự không chắc chắn không nằm ngoài phạm vi suy nghĩ và thảo luận hợp lý, và xác suất cung cấp một cách có hệ thống để làm điều đó.

_____________________ 4 _____________________

Tỷ lệ cược:

Ví dụ: 3:1 (xác suất thắng là 1/4) 1:4 (tỉ lệ 1 thắng 4 thua tức là trung bình, phải chơi 5 lần mới có 1 lần thắng),...

_____________________ 5 _____________________

  1. Quy tắc Bayes (công thức Bayes)

Tỷ lệ cược trước và sau: Quy tắc Bayes có thể được thể hiện dưới nhiều hình thức. Đơn giản nhất là về tỷ lệ cược. Ý tưởng là lấy cơ hội cho một điều gì đó xảy ra (chống lại việc nó không xảy ra), mà chúng ta sẽ gọi là cơ hội trước. Từ "trước" đề cập đến tỷ lệ cược, trước khi có được một số thông tin mới có thể có liên quan. Mục đích của công thức là cập nhật tỷ lệ cược trước, khi có thông tin mới, để có được tỷ lệ cược sau

Ví dụ: tỉ lệ phần trăm chiến thắng trong 1 trận đấu thay đổi khi có bàn thắng được ghi

_____________________ 6 _____________________

Tỷ lệ khả năng xảy ra = A / B Với: A là: xác suất quan sát được trong trường hợp xảy ra sự kiện quan tâm (VD XS mưa) B là: xác suất quan sát trong trường hợp không có sự kiện nào (VD XS không mưa)

_____________________ 7 _____________________

Quy tắc Bayes chuyển đổi tỷ lệ cược trước thành tỷ lệ cược sau như sau: tỷ lệ cược sau = tỷ lệ khả năng × tỷ lệ cược trước

_____________________ 8 _____________________

Ví dụ: Tỷ lệ cược trước mô tả tình huống trước khi nhận được kết quả kiểm tra. Vì cứ 100 phụ nữ thì có 5 người bị ung thư vú, nên trung bình cứ 95 phụ nữ không bị ung thư vú thì có 5 phụ nữ bị ung thư vú, và do đó, tỷ lệ cược trước là 5:95. Tỷ lệ khả năng là xác suất có kết quả dương tính trong trường hợp ung thư chia cho xác suất có kết quả dương tính trong trường hợp không có ung thư. Với những con số trên, đây là kết quả của 80/100 chia cho 10/100, tức là 8. Quy tắc Bayes hiện đưa ra tỷ lệ mắc bệnh ung thư vú sau khi có kết quả xét nghiệm dương tính: tỷ lệ mắc sau = 8 × 5:95 = 40:95 Điều này cho kết quả 40 trên 135, hoặc khoảng 30%. Con số này cao hơn nhiều so với tỷ lệ mắc ung thư vú, 5 trên 100, hay 5%, nhưng vẫn có khả năng là người đó không bị ung thư. Nếu so sánh giải pháp với câu trả lời trực quan của mình, chúng có xu hướng khá khác nhau đối với hầu hết mọi người. Điều này cho thấy trực giác kém phù hợp như thế nào để xử lý thông tin không chắc chắn và mâu thuẫn.

_____________________ 9 _____________________

  1. Phân loại Naive Bayes

Một trong những ứng dụng hữu ích nhất của quy tắc Bayes là cái gọi là bộ phân loại Naive Bayes

Trình phân loại Bayes là một kỹ thuật học máy có thể được sử dụng để phân loại các đối tượng như tài liệu văn bản thành hai hoặc nhiều lớp. Bộ phân loại được đào tạo bằng cách phân tích một tập hợp dữ liệu đào tạo, trong đó các lớp chính xác được đưa ra. Trình phân loại Bayes có thể được sử dụng để xác định xác suất của các lớp cho một số quan sát khác nhau. Giả định trong mô hình là các biến đặc trưng là độc lập có điều kiện đối với lớp.

_____________________ 10 _____________________

Ví dụ: Bộ lọc thư rác: Các từ trong thông báo tương ứng với các biến đặc trưng, ​​do đó số lượng biến đặc trưng trong mô hình được xác định bởi độ dài của thông báo.

Tại sao gọi nó là "ngây thơ" - naive?: Ý tưởng là nghĩ về các từ được tạo ra bằng cách chọn từ này đến từ khác để việc lựa chọn từ chỉ phụ thuộc vào việc thư là thư rác hay hợp lệ. Nó không có sự phụ thuộc giữa các từ liền kề và thứ tự của các từ không có ý nghĩa. Trên thực tế, đây là lý do tại sao phương pháp này được gọi là ngây thơ.

Vì mô hình dựa trên ý tưởng rằng các từ có thể được xử lý độc lập Nên có thể xác định các từ cụ thể biểu thị thư rác ("free", "ưu đãi cuối cùng", "sale off", "nhấp vào quảng cáo") hoặc hợp lệ ("cuộc họp", "thuật toán").


**IV. Machine Learning

Học tập là yếu tố then chốt của trí thông minh. Điều này áp dụng cho cả trí thông minh tự nhiên và trí tuệ nhân tạo.

_____________________ 1 _____________________

  1. Các loại máy học
  • Trong hầu hết các vấn đề học máy phổ biến, chính xác một giá trị lớp là đúng tại một thời điểm.
  • Không thể xảy ra trường hợp một thể hiện thuộc về nhiều lớp (hoặc không có lớp nào) cùng một lúc.
  • 3 loại máy học:
  • Học có giám sát

  • Học không giám sát: Nhóm các mục tương tự để tạo thành "cụm" hoặc giảm dữ liệu thành một số lượng nhỏ "thuộc tính" quan trọng. Trực quan hóa dữ liệu cũng có thể được coi là học tập không giám sát.

  • Học tăng cường: Thường được sử dụng trong các tình huống mà một tác nhân AI như ô tô tự lái phải hoạt động trong một môi trường và có phản hồi về các lựa chọn tốt hay xấu với độ trễ nhất định. Cũng được sử dụng trong các trò chơi mà kết quả chỉ có thể được quyết định khi kết thúc trò chơi.

_____________________ 2 _____________________

  • Học có giám sát Ngoài việc học cách dự đoán nhãn chính xác trong bài toán phân loại, học có giám sát cũng có thể được sử dụng trong các tình huống mà kết quả dự đoán là một con số.

Ví dụ:

  • dự đoán số người sẽ nhấp vào quảng cáo của Google dựa trên nội dung quảng cáo và dữ liệu về hành vi trực tuyến trước đó của người dùng
  • dự đoán số vụ tai nạn giao thông dựa trên tình trạng đường xá và giới hạn tốc độ hoặc dự đoán giá bán bất động sản dựa trên về vị trí, kích thước và tình trạng của nó.
  • dự đoán giá nhà dựa trên kích thước nhà, số phòng ngủ, năm xây dựng, vị trí,... Những vấn đề này được gọi là hồi quy.

_____________________ 3 _____________________

! Những lưu ý

  • Nếu không cẩn thận, độ chính xác sẽ kém hơn mong đợi
  • Không chia tập dữ liệu thành 2 phần. Sử dụng dữ liệu đó làm dữ liệu huấn luyện và dữ liệu từ thực tế để đánh giá mô hình

-> Học cách tránh overfitting và chọn một mô hình không quá hạn chế, cũng không quá linh hoạt, là một trong những kỹ năng cần thiết nhất của DS

_____________________ 4 _____________________

  • Học không giám sát

Các phương pháp học tập không giám sát điển hình cố gắng tìm hiểu một số loại "cấu trúc" bên dưới dữ liệu. Ví dụ như trực quan hóa nơi các vật phẩm giống nhau được đặt gần nhau và các vật phẩm khác nhau ở xa nhau hơn. Nó cũng có thể có nghĩa là phân cụm khi chúng tôi sử dụng dữ liệu để xác định các nhóm hoặc "cụm" các mục tương tự nhau nhưng khác với dữ liệu trong các cụm khác.

Ví dụ: các chuỗi cửa hàng tạp hóa thu thập dữ liệu về hành vi mua sắm của khách hàng Để hiểu rõ hơn về khách hàng của mình, cửa hàng có thể trực quan hóa dữ liệu bằng biểu đồ trong đó mỗi khách hàng được biểu thị bằng một dấu chấm và những khách hàng có xu hướng mua cùng một sản phẩm được đặt gần nhau Ví dụ, 'những người đam mê thực phẩm tốt cho sức khỏe với ngân sách thấp', 'những người yêu thích sản phẩm cao cấp',...

_____________________ 5 _____________________

Một ví dụ khác về học tập không giám sát có thể được gọi là mô hình tổng quát (generative modeling. Điều này đã trở thành một cách tiếp cận nổi bật trong vài năm qua khi một kỹ thuật học sâu được gọi là GAN - Generative Adversarial Networks đã dẫn đến những tiến bộ vượt bậc. Với một số dữ liệu, chẳng hạn như ảnh chụp khuôn mặt của mọi người, một mô hình tổng quát có thể tạo ra nhiều dữ liệu giống nhau hơn: hình ảnh khuôn mặt của mọi người trông giống thật hơn nhưng nhân tạo hơn.

_____________________ 6 _____________________

  1. The Nearest Neighbor Classifier - Hàng xóm gần nhất
  • Chọn điểm gần nhất và được thêm vào lớp chứa điểm đó

** Định nghĩa "gần nhất" Sử dụng khoảng cách Euclid để quyết định mục nào gần nhất có thể không phải lúc nào cũng hợp lý Ví dụ: Đầu vào là văn bản, trong đó không rõ cách các mục được vẽ trong biểu diễn hình học và khoảng cách như thế nào. Do đó, nên chọn số liệu khoảng cách trên cơ sở từng trường hợp.

Ví dụ: Tập hợp những người thích nghe nhạc pop. Khi có nhiều người nghe đi nghe lại 1 bài mới ra thì hệ thống sẽ đề xuất cho những người còn lại; khi có nhiều người không quan tâm đến 1 bài hát thì hệ thống không đề xuất cho những người còn lại

_____________________ 7 _____________________

  1. Regression - Hồi quy

Sự khác biệt giữa phân loại và hồi quy: Có một sự khác biệt nhỏ nhưng quan trọng trong loại dự đoán mà chúng ta nên đưa ra trong các tình huống khác nhau.

Ví dụ:

  • trình phân loại hàng xóm gần nhất chọn nhãn lớp cho bất kỳ mục nào trong số các lựa chọn thay thế đã cho (như thư rác/hợp lệ hoặc 0,1,2,...,9)
  • hồi quy tuyến tính tạo ra một dự đoán số không phải là bị ràng buộc là một số nguyên (một số nguyên trái ngược với một cái gì đó như 3,14).

Vì vậy, HỒI QUY tuyến tính PHÙ HỢP hơn trong các tình huống mà biến đầu ra có thể là bất kỳ CON SỐ nào như giá của sản phẩm, khoảng cách đến chướng ngại vật, doanh thu phòng vé của bộ phim Chiến tranh giữa các vì sao tiếp theo, v.v.

_____________________ 8 _____________________

Ý tưởng cơ bản trong hồi quy tuyến tính là "cộng tác động" của từng biến đặc trưng để tạo ra giá trị dự đoán. Thuật ngữ kỹ thuật cho "công tác động" là tổ hợp tuyến tính. Ý tưởng rất đơn giản và nó có thể được minh họa bằng hóa đơn mua sắm của bạn.

Suy nghĩ về hồi quy tuyến tính như một hóa đơn mua sắm: Giả sử bạn đến cửa hàng tạp hóa và mua 2,5kg khoai tây, 1,0kg cà rốt và 2 chai sữa. Nếu giá khoai tây là 2€ mỗi kg, giá cà rốt là 4€ mỗi kg và một chai sữa là 3€ Thì hóa đơn, do nhân viên thu ngân tính toán, tổng cộng là 2,5 × 2€ + 1,0 × 4€ + 2 × 3€ = 15€. Trong hồi quy tuyến tính, lượng khoai tây, cà rốt và sữa là đầu vào của dữ liệu. Đầu ra là chi phí mua sắm của bạn, điều này rõ ràng phụ thuộc vào cả giá cả và số lượng mỗi sản phẩm bạn mua.

  • "tuyến tính" có nghĩa là mức tăng đầu ra khi một đặc trưng đầu vào được tăng thêm một lượng cố định luôn giống nhau.

_____________________ 9 _____________________

  • Trong thuật ngữ hồi quy tuyến tính, GIÁ của các sản phẩm khác nhau sẽ được gọi là HỆ SỐ hoặc TRỌNG SỐ. Một trong những ưu điểm chính của hồi quy tuyến tính là khả năng diễn giải dễ dàng của nó (trên thực tế, các trọng số đã học có thể thú vị hơn các dự đoán của kết quả đầu ra)

  • Trên thực tế, đầu ra không phải lúc nào cũng được xác định đầy đủ bởi đầu vào, do nhiều yếu tố gây ra sự không chắc chắn hoặc "nhiễu" trong quy trình. Ví dụ việc mua sắm tại một khu chợ nơi giá của bất kỳ sản phẩm nhất định nào có thể thay đổi theo thời gian. Trong những tình huống như vậy, có thể ước tính giá nhưng chỉ với một số độ chính xác hạn chế.

  • Tìm các trọng số tối ưu hóa sự trùng khớp giữa kết quả đầu ra được dự đoán và kết quả thực tế trong dữ liệu huấn luyện là một bài toán thống kê có thể dễ dàng giải quyết vấn đề này ngay cả đối với các tập dữ liệu lớn.

_____________________ End _____________________

Bình luận