Trong quá trình làm việc với Excel, việc gặp phải dữ liệu bị trùng lặp là không tránh khỏi, đặc biệt khi bạn phải xử lý với một lượng dữ liệu lớn. Dữ liệu trùng nhau không chỉ gây ra nhầm lẫn mà còn ảnh hưởng đến tính chính xác của các phân tích dữ liệu. Nhưng đừng lo, Excel cung cấp nhiều công cụ mạnh mẽ giúp bạn dễ dàng lọc và xử lý dữ liệu trùng lặp.
Trong bài này, mình sẽ có một bảng như sau:
STT | Tên | Năm Sinh | Nơi Ở |
---|---|---|---|
1 | Anh | 2003 | Hà Nội |
2 | Bình | 1999 | TP HCM |
3 | Chi | 1993 | Đà Nẵng |
4 | Dương | 1982 | Hải Phòng |
5 | Em | 2005 | Cần Thơ |
6 | Giang | 1983 | Nha Trang |
7 | Hiếu | 2002 | Hue |
8 | Linh | 1996 | Vinh |
9 | Minh | 1981 | Quảng Ninh |
10 | Nam | 1985 | Bình Dương |
11 | Oanh | 1989 | Đăk Lăk |
12 | Phương | 1986 | Cà Mau |
13 | Quý | 2000 | Kiên Giang |
14 | Thành | 1987 | Lâm Đồng |
15 | Uyên | 1992 | Thanh Hóa |
16 | Vân | 2001 | Nghệ An |
17 | Xuân | 1980 | Hà Tĩnh |
18 | Yến | 1998 | Quảng Bình |
19 | Lan | 1984 | Quảng Trị |
20 | Hoa | 1992 | Bắc Kạn |
Nhập vào Excel
Sử dụng tính năng Remove Duplicates
Bước 1: Chọn dữ liệu
- Chọn tab Dữ liệu trên thanh công cụ.
- Bấm vào nút ba chấm > Sau đó click vào Loại bỏ nội dung trùng lặp.
Bước 2: Thiết lập lọc dữ liệu
- Nếu dữ liệu của bạn có dòng tiêu đề, đảm bảo đã tick vào Dữ liệu của tôi có đầu trang.
- Chọn Chọn tất cả cột để áp dụng cho toàn bộ dữ liệu hoặc chỉ chọn một số cột cụ thể. Ở đây mình cần lọc cột Nơi Ở nên chỉ chọn cột tương ứng.
Bước 3: Xóa dữ liệu trùng
- Nhấn “OK” để xóa dữ liệu trùng. Excel sẽ thông báo số dữ liệu trùng đã xóa và số dữ liệu duy nhất còn lại.
Sử dụng tính năng Conditional Formatting
- Vào tab Trang đầu, bấm vào nút ba chấm, chọn Định dạng có điều kiện > Quy tắc tô sáng sau đó chọn Giá trị trùng lặp.
- Chọn phạm vi áp dụng để làm nổi bật dữ liệu trùng lặp, Kiểu quy tắc, màu định dạng sau đó chọn Hoàn tất.
- Màu sắc sẽ làm nổi bật dữ liệu trùng lặp hoặc duy nhất
Lọc dữ liệu trùng bằng Advanced Filter
- Mở thẻ “Data”, sau đó chọn “Sort & Filter” và click vào “Advanced”.
- Chọn “Filter the list, in-place” hoặc “Copy to another location” tùy vào mục đích sử dụng.
- Tick vào “Unique records only” để chỉ lọc ra dữ liệu duy nhất.
Lưu ý: Tính năng này mình không thấy trong bản Office 365.
Lọc dữ liệu trùng bằng Pivot Table
- Chọn dữ liệu, vào thẻ Chèn và chọn PivotTable. Cấu hình như bảng Tạo PivotTable bên dưới rồi OK để tạo một bảng mới.
- Kéo cột muốn lọc vào ô Hàng và Giá trị. Bạn sẽ thấy các giá trị lớn hơn 1 là các ô trùng.
Sử dụng công thức để lọc dữ liệu trùng
- Giả sử bạn muốn lọc dữ liệu trùng giữa hai bảng, sử dụng công thức
=IF(ISNA(VLOOKUP(A2,Sheet1!A:C,1,0)),"Unique","Duplicate")
để kiểm tra.
Bằng cách áp dụng 5 phương pháp trên, bạn có thể dễ dàng lọc và quản lý dữ liệu trùng lặp trong Excel, từ đó nâng cao hiệu quả công việc và độ chính xác của các phân tích dữ liệu. Đừng quên kiểm tra và sử dụng tính năng phù hợp với nhu cầu cụ thể của bạn để đạt được kết quả tốt nhất.
Nội dung trên đã cung cấp một hướng dẫn chi tiết về cách lọc dữ liệu trùng nhau trong Excel, giúp bạn xử lý dữ liệu một cách nhanh chóng và hiệu quả. Hãy thực hành để thành thạo các thủ thuật này, chúc bạn thành công!