- vừa được xem lúc

Data Science, công việc hấp dẫn nhất thế kỷ 21 - [Data Science Series]

0 0 37

Người đăng: Hoàng Đinh

Theo Viblo Asia

I. Data Science, công việc hấp dẫn nhất thế kỷ 21

Trong thế giới mà mọi thứ dựa trên dữ liệu, các Data Scientist (nhà khoa học dữ liệu) nổi lên như một mặt hàng nóng hổi mà nhà nhà, người người săn tìm. Các cuộc tìm kiếm, tranh giành nhân tài trong lĩnh vực Data Science đã bắt đầu. Các chuyên gia ước tính rằng hàng triệu việc làm về Data Science có thể vẫn còn trống vì thiếu nhân sự. Tìm kiếm các Data Scientist trên toàn cầu không chỉ đơn thuần là tìm kiếm nhân sự trong lĩnh vực thống kê (statisticians) hoặc khoa học máy tính (computer scientist). Trên thực tế, các công ty đang tìm kiếm những nhân sự đáp ứng được các kỹ năng như:

  • Có chuyên môn trong một lĩnh vực bất kỳ
  • Một số kinh nghiệm trong lập trình phần mềm (Software Engineering)
  • Kỹ năng phân tích và phân tích
  • Kỹ năng giao tiếp, kể chuyện

Kỹ thuật số đã thay đổi cuộc sống của chún tag một cách nhanh chóng trong 10 năm qua. Kích thước của vũ trụ kỹ thuật số khoảng 130 tỷ gigabyte vào năm 1995. Đến năm 2020, con số này sẽ tăng lên đến 40.000 tỷ gigabyte (gấp hơn 300 lần hiện tại). Các công ty sẽ cần bổ sung hàng trăm ngàn, thậm chí lên đến hàng triệu nhân sự trong lĩnh vực kỹ thuật số để có thể tồn tại trong kỷ nguyên kỹ thuật số này. Không có gì lạ khi Harvard Business Review gọi là Data Science là công việc quyến rũ nhất trong thế kỷ 21.

Một báo cáo của Viện McKinsey Global cảnh báo về sự thiếu hụt tài năng lớn về data và analyst. Vào năm 2018, riêng Mỹ có thể phải đối mặt với sự thiếu hụt 140.000 đến 190.000 người có kỹ năng deep analytical cũng như 1,5 triệu managers và analysts có khả năng phân tích bigdata để đưa ra quyết định hiệu quả.

Bởi vì cuộc cách mạng kỹ thuật số đã chạm đến mọi khía cạnh của cuộc sống, cơ hội được hưởng lợi từ việc hiểu về các hành vi của con người là rất lớn. Với một bộ dữ liệu phù hợp, các nhà bán lẻ có thể nhìn vào thói quen mua hàng của người dùngđể đưa ra những quyết định giúp tăng lợi nhuận. Tuy nhiên, họ chỉ có thể làm vậy nếu họ có các Data Scientist làm việc cho họ. Chính vì vậy, nó giống như một cuộc chạy đua vũ trang để tìm kiếm các Data Scientist.

Với sự thiếu hụt Data Scientist, các nhà tuyển dụng sẵn sàng trả tiền rất nhiều tiền cho những tài năng trong lĩnh vực này.

  • Michael Chui, một hiệu trưởng tại McKinsey, đã chia sẻ trong một cuộc phỏng vấn: "Khoa học dữ liệu đã trở nên liên quan và cần thiết với mọi công ty ... có một cuộc cạnh tranh về tuyển dụng các tài năng ở vị trí này".
  • Một ví dụ khác, ông Paul Minton từ một nhân viên phục vụ nhà hàng mới mức lương $20.000 1 năm. Ông học nhiều môn chuyên ngành liên quan đến toán ở trường đại học, tham gia một khóa học kéo dài ba tháng về Data Science và đã thay đổi mọi thứ. Ông đã kiếm được hơn $100.000 1 năm với vai trò Data Scientist công ty khởi nghiệp ở San Francisco.

II. Định nghĩa

Mặc dù Data Science và Big Data được sử dụng khá phổ biến, tuy nhiên mọi người thường không hiểu rõ, hiểu mơ hồ, hoặc hiểu nhưng không thể diễn đạt. Một câu hỏi tưởng chừng đơn giản như Data Science là gì?, Data Scientist là gì?,... có thể dẫn đến nhiều câu trả lời. Trong bài viết này, mình sẽ cố gắng giải thích và định nghĩa những khai niệm này theo góc nhìn của tác giả trong quyển sách Getting Started with Data Science của IBM

1. Data Scientist là gì

Data Scientist là một người tìm ra giải pháp cho các vấn đề bằng cách phân tích dữ liệu bằng các công cụ phù hợp và sau đó nói với những câu chuyện để truyền đạt những phát hiện của mình (data storytelling) cho các bên có liên quan (stakeholder) – từ lãnh đạo cấp cao, quản lý đến khách hàng. Nói một cách dễ hiểu, Data Scientist là những người làm việc cũng dữ liệu và cho ra các insight và truyền đạt các insight này với các bên liên quan. Kích thước dữ liệu lớn hay nhỏ, sử dụng các công cụ phân tích nào (ví dụ như Machine Learning) sẽ không quan trọng, miễn là có một tâm trí tò mò, khả năng phân tích và truyền đạt những phát hiện, thì tôi coi họ là một Data Scientist.

2. Data Science là gì

Nếu bạn đã hiểu Data Scientist là gì thì thật dễ dàng để định nghĩa Data Science là gì 😄 . Data Science chính là những gì mà các Data Scientist làm. Data Science là một lĩnh vực liên quan đến xử lý dữ liệu, phân tích và trích xuất thông tin chi tiết từ dữ liệu bằng các phương pháp thống kê và thuật toán máy tính khác nhau. Đây là một lĩnh vực đa ngành kết hợp Toán học, Thống kê và Khoa học máy tính

3. Điều gì tạo nên một Data Scientist?

Điều quan trọng nhất cho một Data Scientist chính là tính tò mò. Một Data Scientist phải là một với một tâm trí rất tò mò, sẵn sàng dành thời gian và công sức để khám phá những linh cảm của mình. Trong báo chí, các biên tập viên gọi nó là nose for news. Không phải tất cả các phóng viên biết tin tức nằm ở đâu. Chỉ những người có nose for news mới nhận được câu chuyện. Tò mò cũng quan trọng không kém đối với các nhà khoa học dữ liệu như đối với các nhà báo.

Tham khảo từ quyển Getting Started with Data Science của IBM

Bình luận

Bài viết tương tự

- vừa được xem lúc

Hành trình AI của một sinh viên tồi

Mình ngồi gõ những dòng này vào lúc 2h sáng (chính xác là 2h 2 phút), quả là một đêm khó ngủ. Có lẽ vì lúc chiều đã uống cốc nâu đá mà giờ mắt mình tỉnh như sáo, cũng có thể là vì những trăn trở về lý thuyết chồng chất ánh xạ mình đọc ban sáng khiến không tài nào chợp mắt được hoặc cũng có thể do mì

0 0 146

- vừa được xem lúc

[Deep Learning] Key Information Extraction from document using Graph Convolution Network - Bài toán trích rút thông tin từ hóa đơn với Graph Convolution Network

Các nội dung sẽ được đề cập trong bài blog lần này. . Tổng quan về GNN, GCN. Bài toán Key Information Extraction, trích rút thông tin trong văn bản từ ảnh.

0 0 219

- vừa được xem lúc

Tìm hiểu về YOLO trong bài toán real-time object detection

1.Yolo là gì. . Họ các mô hình RCNN ( Region-Based Convolutional Neural Networks) để giải quyết các bài toán về định vị và nhận diện vật thể.

0 0 284

- vừa được xem lúc

Encoding categorical features in Machine learning

Khi tiếp cận với một bài toán machine learning, khả năng cao là chúng ta sẽ phải đối mặt với dữ liệu dạng phân loại (categorical data). Khác với các dữ liệu dạng số, máy tính sẽ không thể hiểu và làm việc trực tiếp với categorical variable.

0 0 259

- vừa được xem lúc

TF Lite with Android Mobile

Như các bạn đã biết việc đưa ứng dụng đến với người sử dụng thực tế là một thành công lớn trong Machine Learning.Việc làm AI nó không chỉ dừng lại ở mức nghiên cứu, tìm ra giải pháp, chứng minh một giải pháp mới,... mà quan trọng là đưa được những nghiên cứu đó vào ứng dụng thực tế, được sử dụng để

0 0 72

- vừa được xem lúc

Xây dựng hệ thống Real-time Multi-person Tracking với YOLOv3 và DeepSORT

Trong bài này chúng ta sẽ xây dựng một hệ thống sử dụng YOLOv3 kết hợp với DeepSORT để tracking được các đối tượng trên camera, YOLO là một thuật toán deep learning ra đời vào tháng 5 năm 2016 và nó nhanh chóng trở nên phổ biến vì nó quá nhanh so với thuật toán deep learning trước đó, sử dụng YOLO t

0 0 316