- vừa được xem lúc

HOW TO FIND DUPLICATE VALUES IN SQL

0 0 45

Người đăng: Sunny

Theo Viblo Asia

Bài viết này xuất phát từ bài toán mà mình gặp rất nhiều trong quá trình test data. Bạn cần visualize lên các dashboard hay đơn giản cần export raw data để lấy dữ liệu chính xác. Nhưng dữ liệu của bạn được kéo về từ nhiều nguồn khác nhau? Bạn cần check raw data có bị duplicate hay không? Vậy cách check là gì? Bài viết sẽ chia sẻ tips để có thể check được duplicates data.

Đầu tiên để check được table đó bị duplicate data không, Cần xác định được unique key của nó. Tức là tập hợp một/nhiều columns gộp lại với nhau tạo thành 1 giá trị unique của table. Sẽ được chia thành 02 trường hợp như sau:

  1. Duplicate Values in One Column
  2. Duplicate Values in Multiple Columns

1. Duplicate Values in One Column

Giả sử có 1 sample data như sau:

Và ở table này unique key = {OrderID} Tức là với mỗi OrderID sẽ là 1 và duy nhất. Nếu có từ 2 hoặc nhiều giá trị OrderID trùng nhau --> Bi duplicate data.

  • Query:
SELECT OrderID, COUNT(OrderID)
FROM Orders
GROUP BY OrderID
HAVING COUNT(OrderID)>1

2. Duplicate Values in Multiple Columns

Giả sử có sample data như sau:

Table này có unique key = {OrderID, ProductID}. Tức là ví dụ OrderID = 10248, ProductID = 11 thì tập hợp {OrderID, ProductID}. = {10248, 11} là 1 và duy nhất. Nếu có từ 2 rows trở lên trong table có trùng 2 giá trị trên --> Bị duplicate data.

  • Query
SELECT OrderID, ProductID, COUNT(*)
FROM OrderDetails
GROUP BY OrderID, ProductID
HAVING COUNT(*)>1

Note:

  • Khi có nhiều cột cần check duplicate (tức là table đó có nhiều columns tạo nên unique key) thì bạn chỉ cần thêm các columns_name vào sau select, và group by.
  • Ngoài ra có 1 cách hữu dụng khác bạn có thể sử dụng để check bên cạnh việc dùng hàm group by and having. Đó là dùng row_number () over (partition by.... ordery by....)--> Hàm này sẽ được chia sẻ ở bài viết sau.

3. TIPS

Bài toán: Cần lấy toàn bộ thông tin (all columns) của các rows bị duplicate trong table?

  • Như ở mục (1) và (2) đã chỉ ra cách để tìm ra những rows bị duplicate data. Nhưng nếu ta muốn có thêm thông tin của các dữ liệu này? Ta có thể dùng inner join (join) như sau:
SELECT a.*
FROM OrderDetails a
JOIN (SELECT OrderID, ProductID, COUNT(*)
FROM OrderDetails GROUP BY OrderID, ProductID
HAVING count(*) > 1 ) b
ON a.OrderID = b.OrderID
AND a.ProductID = b.ProductID
ORDER BY a.OrderID

hoặc

select * from OrderDetails a where ( OrderID, ProductID ) in ( select OrderID, ProductID from OrderDetails group by OrderID, ProductID having count(*) > 1 )

4. Link tài liệu tham khảo:

1.https://learnsql.com/blog/how-to-find-duplicate-values-in-sql/

Bình luận

Bài viết tương tự

- vừa được xem lúc

Các mô hình phát triển phần mềm

1. Định nghĩa. Mô hình phát triển phần mềm hay quy trình phát triển phần mềm xác định các pha/ giai đoạn trong xây dựng phần mềm. Có nhiều loại mô hình phát triển phần mềm khác nhau ví dụ như:.

0 0 112

- vừa được xem lúc

Tìm hiểu về kỹ thuật phân tích giá trị biên và phân vùng tương đương trong kiểm thử hộp đen

Để đảm bảo được chất lượng của một hoặc nhiều dự án phần mềm QA cần phải tạo được bộ testcase phù hợp.Để thực hiện việc kiểm tra phần mềm với thời gian ngắn nhất mà vẫn đạt chất lượng cao nhất cần phải hiểu sâu về nghiệp vụ của phần mềm và linh hoạt trong việc thiết kế testcase.

0 0 237

- vừa được xem lúc

Single Page Application Concept

Bạn đã từng nghe về một trang wed Single page hay chưa? Dạo gần đây Single page application là một cái tên đang nổi trong xu hướng phát triển web. Mặc dù concept này đã ra đời hơn chục năm nay.

0 0 52

- vừa được xem lúc

Top 15 xu thế kiểm thử phần mềm trong năm 2021

. Năm 2021 dự kiến những công nghệ sau sẽ lên ngôi:. . AI (Artificial intelligence) và ML (Machine Learning). Robotics.

0 1 177

- vừa được xem lúc

Xử lý Table, Frame và Dynamic Element của Web trong Selenium Script – Selenium Tutorial #18

Table, Frame và Dynamic Element là các phần thiết yếu không thể thiếu của bất kỳ web project nào. Chúng ta hãy cùng nhau tìm hiểu cách xử lý chúng trong tập lệnh selenium nhé.

0 0 100

- vừa được xem lúc

Exploratory testing - Kiểm thử thăm dò

I. Định nghĩa. 1. Exploratory testing là gì.

0 0 142