- vừa được xem lúc

Muốn trở thành chuyên gia trong lĩnh vực Machine Learning? Đây là một số điều cần biết

0 0 17

Người đăng: Vo Thi Nhu Kim

Theo Viblo Asia

Trí tuệ nhân tạo là từ khóa không ít người biết đến, nó được nhiều chuyên gia nghiên cứu trong nhiều thập niên qua. Tuy nhiên, trong mười năm qua Machine Learning (ML) (Các kỹ thuật máy học) cuối cùng đã đạt được đủ hiệu quả và tính thực tiễn để áp dụng trên quy mô lớn trong các công ty và tổ chức. Tuy nhiên, việc áp dụng này, vẫn còn ở giai đoạn đầu. Hầu hết các tổ chức vẫn đang trong giai đoạn đầu để đạt được sự thành thạo trong công nghệ này và phát triển chúng ở quy mô doanh nghiệp.

Do đó, tiềm năng cho các chuyên gia trong lĩnh vực này là rất lớn , được chứng minh bởi sự gia tăng ổn định của các khóa học và số người việc làm với ML . Cộng với sự gia tăng của các tin tuyển dụng ML của các công ty. Vậy vai trò và vị trí trong lĩnh vực này là gì? Bạn nên học gì? Tương lai nghề nghiệp ở ML sẽ như thế nào?

Hãy bắt đầu bằng cách xem xét điều gì làm cho ML khác với các lĩnh vực về máy tính khác.

1. Machine Learning là gì?

Machine Learning chúng ta có thể dịch theo tiếng việt là Máy học. Trong suốt quá trình phát triển của máy tính, chúng ta đã coi máy tính như một cỗ máy thực hiện các lệnh một cách chính xác và không thể sai lầm. Các nhà khoa học máy tính đã tập trung vào các thuật toán được phát triển thông qua các kỹ năng phân tích của riêng họ và các chứng minh toán học đảm bảo kết quả chính xác của họ.

Mặc dù cách tiếp cận này cực kỳ thành công, nhưng còn có những hạn chế, vẫn còn nhiều vấn đề quá phức tạp đối với máy tính vì chúng chỉ dựa trên các kỹ năng mà con người làm tốt (không phải máy móc) như xác định các đối tượng hoặc hiểu ngôn ngữ tự nhiên.

Vì vậy, họ phải từ bỏ cách tiếp cận thuần túy thuật toán và giúp máy tính phát triển các kỹ năng giống như cách con người làm: học bằng cách làm gương.

Trong đó có sự khác biệt cơ bản giữa Machine Learning và các lĩnh vực khác của khoa học máy tính: hành vi của phần mềm không chỉ phụ thuộc vào mã mà còn phụ thuộc vào dữ liệu chúng tôi cung cấp trong quá trình đào tạo.

Sự phụ thuộc vào dữ liệu này tạo ra một tập hợp các nhu cầu ngoài những nhu cầu mà chúng ta phải đối mặt trong khoa học máy tính truyền thống. Kết quả là, các vai trò và sự nghiệp mới cũng đã xuất hiện. Tóm lại, là Machine Learning một lĩnh vực của trí tuệ nhân tạo liên quan đến việc nghiên cứu và xây dựng các kĩ thuật cho phép các hệ thống "học" tự động từ dữ liệu để giải quyết những vấn đề cụ thể. Ví dụ như các máy có thể "học" cách phân loại thư điện tử xem có phải thư rác (spam) hay không và tự động xếp thư vào thư mục tương ứng. Học máy rất gần với suy diễn thống kê (statistical inference) tuy có khác nhau về thuật ngữ.

Học máy có liên quan lớn đến thống kê, vì cả hai lĩnh vực đều nghiên cứu việc phân tích dữ liệu, nhưng khác với thống kê, học máy tập trung vào sự phức tạp của các giải thuật trong việc thực thi tính toán. Nhiều bài toán suy luận được xếp vào loại bài toán NP-khó, vì thế một phần của học máy là nghiên cứu sự phát triển các giải thuật suy luận xấp xỉ mà có thể xử lý được.

2. Ứng dụng và Thị trường

Ngày nay, đã có nhiều ứng dụng ML thương mại, một số ứng dụng phổ biến nhất là:

  • Phân tích hồ sơ khách hàng để đưa ra quyết định về việc cấp tín dụng hoặc ưu tiên các hoạt động tiếp thị
  • Hệ thống khuyến nghị cho các sản phẩm, dịch vụ và nội dung
  • Hệ thống phát hiện gian lận
  • Dự báo nhu cầu và tối ưu hóa hậu cần
  • Phân tích ngôn ngữ tự nhiên để định tuyến hoặc trả lời tự động (chatbots)
  • Phân tích hình ảnh để phát hiện đối tượng và khuôn mặt
  • Nhận dạng văn bản và trích xuất cấu trúc tài liệu từ hình ảnh
  • Chuyển lời nói sang văn bản
  • Bản dịch giữa các ngôn ngữ
  • Khám sàng lọc cho các bài kiểm tra hình ảnh y tế

Một số thị trường sử dụng ML nhiều nhất là dịch vụ trực tuyến, dịch vụ tiếp thị và dịch vụ tài chính, nhưng vẫn có tiềm năng trong tất cả các ngành. Điểm khó lớn nhất đối với việc áp dụng toàn cầu ngày nay không phải là năng lực của các thuật toán hay hệ thống mà là ở việc xác định và mô hình hóa các vấn đề, thu thập dữ liệu cần thiết cho đào tạo và tích hợp các mô hình với hệ thống trong sản xuất.

Một điểm quan trọng là các lĩnh vực ứng dụng này có mức độ tổng quát hoặc cụ thể khác nhau. Ví dụ, các ứng dụng như nhận dạng khuôn mặt có nhiều khả năng được tổng quát hóa hơn và do đó sử dụng các mô hình được bán dưới dạng sản phẩm của các công ty công nghệ. Xử lý ngôn ngữ tự nhiên (NLP) được hưởng lợi rất nhiều từ dữ liệu đào tạo và kiến thức cụ thể về văn hóa. Do đó, có nhiều cơ hội hơn cho sự phát triển của khu vực. Các vấn đề liên quan đến dữ liệu có cấu trúc, chẳng hạn như phân tích rủi ro, có liên quan nhiều đến các đặc điểm cụ thể của doanh nghiệp và thường được phát triển theo cách tùy chỉnh.

3. Vai trò và Nghề nghiệp

Thị trường việc làm ML rất mới, răt năng động và chắc chắn sẽ tiếp tục phát triển, nhưng chúng ta đã có thể tìm thấy một số vai trò chung trong một số tổ chức . Những vai trò này không nhất thiết phải được thực hiện bởi những người khác nhau và không có gì lạ khi thấy một chuyên gia ML duy nhất thực hiện một vài trong số chúng. Điều đó nói lên rằng, khi các giải pháp dựa trên ML ngày càng trở nên phức tạp và quan trọng đối với các doanh nghiệp, thì sự chuyên môn hóa sẽ tăng lên.

VAI TRÒ VÀ CÔNG VIỆC CỦA MACHINE LEARNING

  • Nhà khoa học dữ liệu
  • Kỹ sư ML / MLOps (machine learning operations)
  • Nhà phân tích
  • Nhà nghiên cứu ML

NHÀ KHOA HỌC DỮ LIỆU

Nhà khoa học dữ liệu hiện là chức danh phổ biến nhất cho những người làm việc với ML. Thuật ngữ này có lịch sử lâu đời nhưng mới trở nên phổ biến trong một thập kỷ trở lại đây . Về cơ bản, khoa học dữ liệu là sự kết hợp của khoa học máy tính với thống kê để xử lý, hiểu và biến đổi khối lượng lớn dữ liệu. Ban đầu, vai trò của nhà khoa học dữ liệu tập trung vào phân tích mô tả, mô hình thống kê và thiết kế kiểm thử, nhưng vai trò này đương nhiên mở rộng sang việc tạo ra các mô hình ML.

Ngày nay, nhiều người liên kết vai trò của nhà khoa học dữ liệu chủ yếu với máy học, nhưng công việc phân tích vẫn rất quan trọng, thậm chí còn có thể áp dụng và hữu ích hơn cho các hoạt động hàng ngày của một tổ chức.

Nhờ kỹ năng phân tích tuyệt vời của mình, một nhà khoa học dữ liệu có thể tự nhiên chuyển sang các lĩnh vực phân tích kinh doanh hoặc đào sâu vào các khía cạnh tính toán trong công việc của mình để chuyển sang nghề kỹ sư phần mềm. Đặc biệt, kỹ thuật dữ liệu có rất nhiều sự chồng chéo với khoa học dữ liệu.

KỸ SƯ ML / MLOPS

Bản thân một mô hìng ML không làm được gì nhiều. Nó cần được tích hợp với các hệ thống hiện có, vừa để tiêu thụ dữ liệu đào tạo vừa cung cấp các dự đoán về dữ liệu mới. Nếu chúng ta muốn mô hình duy trì hiệu suất của nó, chúng ta cũng cần theo dõi và tự động hóa quá trình đào tạo của nó và đảm bảo rằng nó có thể tái sản xuất.

Những khía cạnh nói trên và các khía cạnh khác gần với các lĩnh vực như kỹ thuật dữ liệu, DevOps (development operations) và kỹ thuật phần mềm hơn là toán học và thống kê; chúng được gọi chung là MLOps . Trong nhiều tổ chức, vai trò của kỹ sư ML hoặc MLOps tồn tại để giải quyết những khía cạnh này Kỹ thuật ML là một chuyên ngành của kỹ thuật phần mềm, vì vậy một người trong lĩnh vực đó có thể chuyển đổi sang các lĩnh vực phần mềm khác mà không gặp nhiều khó khăn, chẳng hạn như kỹ thuật dữ liệu hoặc phát triển phụ trợ.

NHÀ PHÂN TÍCH

Trước khi đưa ra quyết định sử dụng máy học, ai đó cần xác định, hiểu và định lượng vấn đề kinh doanh. Trong nhiều công ty, trách nhiệm đó thuộc về nhà phân tích kinh doanh, một người kết hợp kiến thức về lĩnh vực kinh doanh với các kỹ năng toán học phân tích và các công cụ phát triển phần mềm.

Không có khóa đào tạo cụ thể cho các nhà phân tích, nhưng những chuyên gia này thường được đào tạo trong một lĩnh vực có thành phần STEM mạnh mẽ, chẳng hạn như kỹ thuật, kinh tế hoặc quản trị. Phạm vi công việc của một nhà phân tích rất rộng và đòi hỏi sự thoải mái với sự mơ hồ. Các nhà phân tích sẵn sàng đào sâu kiến thức kỹ thuật của họ có thể trở thành nhà khoa học hoặc kỹ sư dữ liệu. Một quá trình chuyển đổi tự nhiên khác là chuyên môn hóa lĩnh vực kinh doanh hoặc quản lý.

NHÀ NGHIÊN CỨU ML

Vẫn còn rất nhiều chỗ để phát triển các thuật toán máy học mới, đó là những gì các nhà nghiên cứu ML làm. Điều này tích hợp học thuật và công nghiệp; nhiều bài báo quan trọng nhất có các đồng tác giả từ các công ty công nghệ và trường đại học.

Tuy nhiên, thực tế này phổ biến hơn nhiều ở các quốc gia đi đầu trong phát triển máy học, chẳng hạn như Hoa Kỳ, Canada và Trung Quốc. Ở hầu hết các quốc gia khác, đầu tư tư nhân vào nghiên cứu hạn chế hơn nhiều. Những người quyết định gia nhập khu vực tư nhân sau khi theo đuổi giáo dục đại học về ML thường đảm nhận các vai trò trong khoa học dữ liệu hoặc kỹ thuật ML.

4. Chúng ta nên học gì?

Vì ML với tư cách là một nghề, một lĩnh vực tương đối mới, nên không có sự đồng thuận nào liên quan đến kiến thức và chương trình giảng dạy trong giáo dục học thuật chính thức hoặc đào tạo chuyên nghiệp. Tuy nhiên, có một số con đường tự nhiên dành cho những ai muốn theo nghề:

KHOA HỌC MÁY TÍNH VÀ KỸ THUẬT PHẦN MỀM

Mô hình ML là phần mềm, vì vậy kiến thức về khoa học máy tính và kỹ thuật phần mềm là nền tảng cần thiết để làm việc với các công nghệ này. Đặc biệt, Deep Learning (mạng nơ-ron có cấu trúc phức tạp, nguyên nhân dẫn đến sự bùng nổ của các ứng dụng ML hiện nay) đã xuất hiện trong lĩnh vực khoa học máy tính.

Hầu hết các nút thắt thực tế đối với sự phát triển và áp dụng máy học về cơ bản là các vấn đề về kỹ thuật và phần mềm, chẳng hạn như tích hợp, bảo trì và khả năng mở rộng. Những vấn đề này là cốt lõi của kỹ thuật ML nhưng các nhà khoa học dữ liệu cũng cần một nền tảng kiến thức tính toán để đạt được hiệu quả trong công việc của họ.

SỐ LIỆU THỐNG KÊ

Phần lớn các thuật toán ML cần một lượng lớn dữ liệu để huấn luyện (và càng nhiều dữ liệu, kết quả càng tốt). Điều này có nghĩa là làm việc với một lượng lớn dữ liệu trở thành một kỹ năng cơ bản và đây thường là bước tốn thời gian nhất trong quy trình. Công cụ tốt nhất từng được phát triển để hiểu và chuyển đổi dữ liệu là thống kê.

ML là một kỹ thuật thống kê cơ bản, vì vậy không có mô hình nào chính xác 100% (nếu bạn phát triển một mô hình như vậy, có thể bạn đã mắc sai lầm hoặc vấn đề không cần ML được giải quyết ngay từ đầu).

Thống kê không chỉ cần thiết cho việc thao tác dữ liệu đào tạo, mà điều này thậm chí còn quan trọng hơn để hiểu kết quả của mô hình ML và tác động của nó khi áp dụng trong thực tế. Ngoài ra, nhiều mô hình được sử dụng rộng rãi trong thực tế, chẳng hạn như cây quyết định và hồi quy logistic hoặc tuyến tính có nguồn gốc từ thống kê.

Điều thú vị là nhiều người bắt tay vào sự nghiệp trong lĩnh vực máy học và khoa học dữ liệu từ nền tảng khoa học, chẳng hạn như vật lý, khoa học thần kinh hoặc toán học. Điều này rất có ý nghĩa khi tính đến tất cả các kỹ thuật được sử dụng trong các ngành này, nhằm mục đích rút ra kiến thức từ hàng núi dữ liệu thực nghiệm. Quy trình khoa học có rất nhiều điểm chung với ML, một giải pháp thay thế khả thi cho những ai không muốn theo đuổi sự nghiệp học thuật.

DEEP LEARNING (HỌC SÂU)

Deep Learning là một tập hợp con của ngành máy học dựa trên một tập hợp các thuật toán để cố gắng mô hình dữ liệu trừu tượng hóa ở mức cao bằng cách sử dụng nhiều lớp xử lý với cấu trúc phức tạp, hoặc bằng cách khác bao gồm nhiều biến đổi phi tuyến.

Học sâu là một phần của một họ các phương pháp học máy rộng hơn dựa trên đại diện học của dữ liệu. Một quan sát (ví dụ như, một hình ảnh) có thể được biểu diễn bằng nhiều cách như một vector của các giá trị cường độ cho mỗi điểm ảnh, hoặc một cách trừu tượng hơn như là một tập hợp các cạnh, các khu vực hình dạng cụ thể, vv. Một vài đại diện làm khiến việc học các nhiệm vụ dễ dàng hơn (ví dụ, nhận dạng khuôn mặt hoặc biểu hiện cảm xúc trên khuôn mặt) từ các ví dụ. Một trong những hứa hẹn của học sâu là thay thế các tính năng thủ công bằng các thuật toán hiệu quả đối với học không có giám sát hoặc nửa giám sát và tính năng phân cấp.

Các nghiên cứu trong lĩnh vực này cố gắng thực hiện các đại diện tốt hơn và tạo ra các mô hình để tìm hiểu các đại diện này từ dữ liệu không dán nhãn quy mô lớn. Một số đại diện được lấy cảm hứng bởi những tiến bộ trong khoa học thần kinh và được dựa trên các giải thích của mô hình xử lý và truyền thông thông tin trong một hệ thống thần kinh, chẳng hạn như mã hóa thần kinh để cố gắng để xác định các mối quan hệ giữa các kích thích khác nhau và các phản ứng liên quan đến thần kinh trong não.

KHOA HỌC NHÂN VĂN

Công nghệ luôn phải tồn tại để phục vụ nhu cầu của con người, nhưng đôi khi chúng ta dễ dàng đánh mất thực tế đó khi chúng ta bị kích thích bởi những thách thức hoặc đột phá về kỹ thuật. Khi công nghệ ngày càng trở nên mạnh mẽ và tiến vào các lĩnh vực ngày càng phức tạp thì việc chú trọng đến yếu tố con người trở nên cấp thiết. Nếu không, chúng ta có nguy cơ giải quyết vấn đề sai hoặc làm cho nó trở nên tồi tệ hơn.

Hơn nữa, khi một số mối quan tâm cấp thấp hơn trở nên tự động hơn, các chuyên gia ML có xu hướng có giá trị hơn nếu họ có thể hiểu được các tương tác giữa hệ thống của họ và những người sẽ sử dụng hoặc bị ảnh hưởng bởi chúng.

Một cách để tránh quá lạc vào mê cung kỹ thuật là nghiên cứu một số ngành liên quan đến bản chất của trải nghiệm con người, chẳng hạn như triết học, tâm lý học hoặc khoa học xã hội như xã hội học. Ví dụ, nghiên cứu một chút tâm lý học sẽ giúp ích rất nhiều trong vấn đề này, và thậm chí bạn có thể sẽ thích nó. Các khóa học về nhân văn cũng sẽ cung cấp cho bạn những công cụ cần thiết để giao tiếp hiệu quả bằng văn bản và trình bày những phát hiện của bạn với một nhóm các bên liên quan.

ĐẠO ĐỨC

Ngày nay, công nghệ đã có tác động to lớn đến mọi lĩnh vực của xã hội, từ giải trí đến chính trị và trên thị trường lao động. Với khả năng giải quyết các vấn đề mới của ML, tầm ảnh hưởng của ML sẽ ngày càng lớn. Vì lý do này, đạo đức không còn là một điều trừu tượng học thuật xa vời đối với các chuyên gia công nghệ, mà là một phần trọng tâm trong công việc

Đặc biệt, trong ML có vấn đề về sự thiên vị. Vì ML cần sử dụng dữ liệu hiện có để hướng dẫn đào tạo mô hình, nên rất dễ dàng để họ tái tạo những bất cân xứng của xã hội mà họ được đưa vào, chẳng hạn như phân biệt giới tính và phân biệt chủng tộc cấu trúc. Giải quyết sai lệch không dễ dàng và đôi khi giải pháp duy nhất để tránh duy trì sự bất đối xứng có thể là loại bỏ toàn bộ tập dữ liệu hoặc thậm chí quyết định rằng vấn đề không nên được giải quyết bằng ML. Các chuyên gia trong lĩnh vực này sẽ ngày càng cần chuẩn bị tinh thần để tham gia vào các cuộc thảo luận và cố gắng đưa ra các quyết định có đạo đức.

5. Còn Vai trò của Máy tính Truyền thống thì sao?

Một điều chúng ta không nên quên là ML không phải là một sự thay thế mà là một sự bổ sung cho máy tính truyền thống, một lĩnh vực cực kỳ phù hợp và phát triển nhanh chóng theo đúng nghĩa của nó. Các kiến thức cơ bản về ML sẽ cần thiết cho các chuyên gia trong tương lai, nhưng không phải ai cũng cần phải chuyên sâu về nó.

Điều chắc chắn duy nhất mà chúng ta có thể có về tương lai của thị trường việc làm AI là nó sẽ tiếp tục thay đổi và nhanh chóng. Một số vai trò mới mà chúng ta thậm chí không thể tưởng tượng. Để chuẩn bị thì chúng ta luôn cần có một nền tảng vững chắc về các nguyên tắc cơ bản như khoa học máy tính, thống kê và kỹ thuật phần mềm, đồng thời theo kịp sự phát triển không ngừng của lĩnh vực này.

Cuối cùng, điều quan trọng là chúng ta không đánh mất yếu tố con người. Cách tốt nhất để dự đoán tương lai là tạo ra nó và trách nhiệm của chúng ta trong tương lai đó tiếp tục phát triển.

Tham khảo:

https://builtin.com/machine-learning/machine-learning-careers https://vi.wikipedia.org/wiki/Ngành_STEM#:~:text=STEM – Khoa học%2C Công nghệ,và Mathematics (Toán học). https://vi.wikipedia.org/wiki/Học_sâu

Bình luận

Bài viết tương tự

- vừa được xem lúc

Hành trình AI của một sinh viên tồi

Mình ngồi gõ những dòng này vào lúc 2h sáng (chính xác là 2h 2 phút), quả là một đêm khó ngủ. Có lẽ vì lúc chiều đã uống cốc nâu đá mà giờ mắt mình tỉnh như sáo, cũng có thể là vì những trăn trở về lý thuyết chồng chất ánh xạ mình đọc ban sáng khiến không tài nào chợp mắt được hoặc cũng có thể do mì

0 0 146

- vừa được xem lúc

[Deep Learning] Key Information Extraction from document using Graph Convolution Network - Bài toán trích rút thông tin từ hóa đơn với Graph Convolution Network

Các nội dung sẽ được đề cập trong bài blog lần này. . Tổng quan về GNN, GCN. Bài toán Key Information Extraction, trích rút thông tin trong văn bản từ ảnh.

0 0 219

- vừa được xem lúc

Tìm hiểu về YOLO trong bài toán real-time object detection

1.Yolo là gì. . Họ các mô hình RCNN ( Region-Based Convolutional Neural Networks) để giải quyết các bài toán về định vị và nhận diện vật thể.

0 0 284

- vừa được xem lúc

Encoding categorical features in Machine learning

Khi tiếp cận với một bài toán machine learning, khả năng cao là chúng ta sẽ phải đối mặt với dữ liệu dạng phân loại (categorical data). Khác với các dữ liệu dạng số, máy tính sẽ không thể hiểu và làm việc trực tiếp với categorical variable.

0 0 259

- vừa được xem lúc

TF Lite with Android Mobile

Như các bạn đã biết việc đưa ứng dụng đến với người sử dụng thực tế là một thành công lớn trong Machine Learning.Việc làm AI nó không chỉ dừng lại ở mức nghiên cứu, tìm ra giải pháp, chứng minh một giải pháp mới,... mà quan trọng là đưa được những nghiên cứu đó vào ứng dụng thực tế, được sử dụng để

0 0 72

- vừa được xem lúc

Xây dựng hệ thống Real-time Multi-person Tracking với YOLOv3 và DeepSORT

Trong bài này chúng ta sẽ xây dựng một hệ thống sử dụng YOLOv3 kết hợp với DeepSORT để tracking được các đối tượng trên camera, YOLO là một thuật toán deep learning ra đời vào tháng 5 năm 2016 và nó nhanh chóng trở nên phổ biến vì nó quá nhanh so với thuật toán deep learning trước đó, sử dụng YOLO t

0 0 316