- vừa được xem lúc

Data Analysis là gì? - [Data Analyst Series]

0 0 22

Người đăng: Hoàng Đinh

Theo Viblo Asia

Data Analysis là quá trình thu thập, làm sạch, phân tích và khai thác dữ liệu, giải thích kết quả và báo cáo các phát hiện.

Data Analysis giúp các doanh nghiệp hiểu hiệu suất trong quá khứ của họ và giúp họ ra quyết định cho các hành động trong tương lai tốt hơn.

I. Các loại Analytics

Sử dụng Data Analysis, giúp các doanh nghiệp tiết kiệm thời gian và tài nguyên quý giá và cũng đảm bảo thành công lớn hơn. Chúng ta sẽ khám phá bốn loại Data Analysis chính, mỗi loại có một mục tiêu và vai trò khác nhau trong quá trình Data Analysis.

1. Descriptive Analytics (Phân tích mô tả)

Phân tích mô tả giúp trả lời các câu hỏi về những gì đã xảy ra trong một khoảng thời gian nhất định bằng cách tóm tắt dữ liệu trong quá khứ và trình bày các phát hiện cho các bên liên quan. Nó giúp cung cấp những hiểu biết thiết yếu về các sự kiện trong quá khứ. Ví dụ: theo dõi hiệu suất trong quá khứ dựa trên các chỉ số hiệu suất chính của tổ chức hoặc phân tích dòng tiền.

2. Diagnostics Analytics (Phân tích chẩn đoán)

Phân tích chẩn đoán giúp trả lời câu hỏi. Tại sao nó lại xảy ra? Nó lấy những insight từ các phân tích mô tả để đào sâu hơn từ đó tìm ra nguyên nhân của kết quả. Ví dụ, một sự thay đổi đột ngột trong lưu lượng truy cập vào một trang web mà không có nguyên nhân rõ ràng hoặc tăng doanh số trong một khu vực không có thay đổi trong tiếp thị.

3. Predictive Analytics (Phân tích dự đoán)

Phân tích dự đoán giúp trả lời câu hỏi, điều gì sẽ xảy ra tiếp theo? Lịch sử dữ liệu và xu hướng được sử dụng để dự đoán kết quả trong tương lai. Một số lĩnh vực mà doanh nghiệp áp dụng phân tích dự đoán là đánh giá rủi ro và dự báo doanh số. Mục tiêu của phân tích dự đoán là dự báo những gì có thể xảy ra trong tương lai. Tất cả các dự đoán là xác suất trong tự nhiên.

4. Prescriptive Analytics (Phân tích theo quy định)

Phân tích theo quy định giúp trả lời câu hỏi, nên làm gì về nó? Bằng cách phân tích các quyết định và sự kiện trong quá khứ, khả năng của các kết quả khác nhau. Được ước tính trên cơ sở mà một quá trình hành động được quyết định. Xe tự lái là một ví dụ tốt về phân tích theo quy định. Họ phân tích môi trường để đưa ra quyết định liên quan đến tốc độ, thay đổi làn đường, chọn con đường nào để đi, v.v. hoặc các hãng hàng không tự động điều chỉnh giá vé dựa trên nhu cầu của khách hàng. Giá xăng, thời tiết hoặc giao thông trên các tuyến đường.

II. Quá trình phân tích dữ liệu

Bây giờ chúng ta hãy xem xét một số bước chính trong bất kỳ quy trình phân tích dữ liệu nào.

1. Hiểu được vấn đề và kết quả mong muốn.

Phân tích dữ liệu bắt đầu bằng việc hiểu vấn đề cần được giải quyết và kết quả mong muốn cần đạt được. Bạn đang ở đâu và nơi bạn muốn đến được xác định rõ ràng trước khi quá trình phân tích có thể bắt đầu. Giai đoạn này của quá trình bao gồm quyết định những gì sẽ được đo lường. Ví dụ, số lượng sản phẩm X được bán trong một khu vực và cách nó sẽ được đo, ví dụ. Trong một mùa lễ hội, khi bạn biết bạn sẽ:

Đo lường những gì Đo lường nó như thế nào Dữ liệu bạn yêu cầu Nguồn dữ liệu bạn cần để lấy dữ liệu này Các công cụ tốt nhất cho công việc

2. Làm sạch dữ liệu

Sau khi thu thập dữ liệu, bước tiếp theo là khắc phục các vấn đề chất lượng trong dữ liệu có thể ảnh hưởng đến tính chính xác của phân tích. Đây là một bước quan trọng vì độ chính xác của phân tích chỉ có thể được đảm bảo nếu dữ liệu đã được làm sạch. Bạn sẽ làm sạch dữ liệu cho các giá trị và ngoại lệ sai hoặc không đầy đủ. Ví dụ: dữ liệu nhân khách hàng trong đó trường độ tuổi có giá trị 150 là một ngoại lệ. Bạn cũng sẽ chuẩn hóa dữ liệu đến từ nhiều nguồn.

3. Phân tích và khai thác dữ liệu.

Khi dữ liệu đã được làm sạch, bạn sẽ trích xuất và phân tích dữ liệu từ các góc nhìn, quan điểm khác nhau. Bạn cần đứng ở nhiều góc nhìn khác nhau để hiểu các xu hướng, xác định các mối tương quan và tìm các mẫu và biến thể.

4. Giải thích kết quả.

Sau khi phân tích, dữ liệu của bạn và có thể tiến hành nghiên cứu thêm, có thể là một vòng lặp lặp đi lặp lại. Sau khi đã hoàn thành bước phân tích cuối, bạn cần giải thích kết quả của mình, bạn cần đánh giá xem phân tích của bạn có thể bảo vệ được trước sự phản đối hay không, và nếu có bất kỳ hạn chế hoặc hoàn cảnh nào mà theo đó, phân tích của bạn có thể không còn chính xác.

5. Trình bày những phát hiện

Cuối cùng, mục tiêu của bất kỳ phân tích nào là tác động đến việc ra quyết định. Khả năng giao tiếp và trình bày những phát hiện của bạn theo những cách rõ ràng và có tác động là một phần quan trọng của quá trình phân tích dữ liệu cũng trong phân tích. Report, Dashboard, biểu đồ, đồ thị, bản đồ,... là một số cách mà bạn có thể trình bày dữ liệu của mình.

Tham khảo từ khoá học Data Analyst của IBM

Bình luận

Bài viết tương tự

- vừa được xem lúc

Data bias trong phân tích dữ liệu

Hi các bạn, để tiếp tục chuỗi bài chia sẻ về nghiệp vụ của BA, hôm nay mình sẽ chia sẻ một chút về Data analysis (phân tích dữ liệu) - một kỹ thuật khá là rộng và cũng rất quan trọng với BA trong thời

1 0 106

- vừa được xem lúc

Data Mining - Khai phá dữ liệu - [Data Science Series]

I. Data Mining là gì. Quá trình khai phá dữ liệu là một quá trình phức tạp bao gồm kho dữ liệu chuyên sâu cũng như các công nghệ tính toán. 1.

0 0 30

- vừa được xem lúc

Data Science, công việc hấp dẫn nhất thế kỷ 21 - [Data Science Series]

I. Data Science, công việc hấp dẫn nhất thế kỷ 21.

0 0 25

- vừa được xem lúc

Thao tác cơ bản với khung dữ liệu trong R (phần 1)

Giới thiệu. R là một ngôn ngữ lập trình bậc cao, nó được tạo ra với mục đích dành cho các công việc liên quan đến phân tích dữ liệu, thống kê và học máy.

0 0 23

- vừa được xem lúc

Thao tác cơ bản với khung dữ liệu trong R (phần 2)

Giới thiệu. R là một ngôn ngữ lập trình bậc cao, nó được tạo ra với mục đích dành cho các công việc phân tích dữ liệu, thống kê và học máy.

0 0 14

- vừa được xem lúc

Ngôn ngữ lập trình sử dụng trong Data Science - [Data Science Series]

Có một số lượng lớn các lựa chọn khi nói đến ngôn ngữ lập trình nói riêng và ngôn ngữ lập trình trong Data Science . Mỗi người đều có điểm mạnh và điểm yếu của riêng và sẽ không có ai trả lời đúng cho

0 0 20