Cách viết và kiểm tra bộ lọc Regex cho Google Analytics (Có ví dụ)

Biểu thức chính quy Regex Bộ lọc Google Analytics

Như với nhiều bài viết của tôi ở đây, tôi thực hiện một số nghiên cứu cho một khách hàng và sau đó viết về nó ở đây. Thành thật mà nói, có một vài lý do tại sao… thứ nhất là tôi có trí nhớ khủng khiếp và thường nghiên cứu trang web của riêng mình để tìm thông tin. Thứ hai là để giúp những người khác cũng có thể đang tìm kiếm thông tin.

Biểu thức chính quy (Regex) là gì?

Regex là một phương pháp phát triển để tìm kiếm và xác định một mẫu ký tự trong văn bản để khớp hoặc thay thế văn bản. Tất cả các ngôn ngữ lập trình hiện đại đều hỗ trợ Biểu thức chính quy.

Tôi thích biểu thức chính quy (regex) nhưng họ có thể hơi bực bội hoặc tức giận khi học và kiểm tra. Google analytics có một số khả năng tuyệt vời… nơi bạn có thể tạo các chế độ xem với các biểu thức chính quy hoặc lọc dữ liệu của mình trong các biểu thức chính quy.

Ví dụ: nếu tôi chỉ muốn xem lưu lượng truy cập trên các trang thẻ của mình, tôi có thể lọc / tag / trong cấu trúc liên kết cố định của mình bằng cách sử dụng:

/tag\/

Ở đó, cú pháp rất quan trọng. Nếu tôi chỉ sử dụng “thẻ”, tôi sẽ nhận được tất cả các trang có thẻ cụm từ trong đó. Nếu tôi đã sử dụng “/ tag” thì bất kỳ URL nào bắt đầu bằng thẻ sẽ được đưa vào, chẳng hạn như / tag-management bởi vì Google Analytics mặc định bao gồm bất kỳ ký tự nào sau biểu thức chính quy. Vì vậy, tôi cần đảm bảo rằng tôi có bao gồm dấu gạch chéo sau… nhưng nó phải có một ký tự thoát trên đó.

bộ lọc trang regex

Kiến thức cơ bản về cú pháp Regex

cú pháp Mô tả
^ Bắt đầu với
$ Kết thúc với
. Một ký tự đại diện cho bất kỳ ký tự nào
* Không hoặc nhiều hơn mục trước
.* Khớp với bất kỳ ký tự nào trong
? Không hoặc một lần của mục trước đó
+ Một hoặc nhiều lần của mục trước đó
| Toán tử OR
[abc] A hoặc b hoặc c (có thể là bất kỳ số ký tự nào)
[az] Phạm vi từ a đến z (có thể là bất kỳ số ký tự nào)
[AZ] Phạm vi từ A đến Z (viết hoa)
[0-9] Phạm vi từ 0 đến 9 (có thể là bất kỳ số nào)
[a-zA-Z] Phạm vi từ a đến Z hoặc A đến Z
[a-zA-Z0-9] Tất cả các ký tự chữ và số
1 {} Chính xác 1 trường hợp (có thể là bất kỳ số nào)
{1-4} Phạm vi từ 1 đến 4 phiên bản (có thể là bất kỳ số nào)
{1,} 1 hoặc nhiều trường hợp (có thể là bất kỳ số nào)
() Nhóm các quy tắc của bạn
\ Thoát các ký tự đặc biệt
\d Ký tự số
\D Ký tự không phải chữ số
\s Khoảng trắng
\S Khoảng trắng
\w Từ
\W Không phải từ (dấu chấm câu)

Ví dụ về Regex cho Google Analytics

Vì vậy, hãy đưa ra một số ví dụ về một số Bộ lọc tuỳ chỉnh. Một trong những đồng nghiệp của tôi đã yêu cầu tôi hỗ trợ để xác định một trang nội bộ có đường dẫn /mục lục ngoài tất cả các bài đăng trên blog được viết với năm trong liên kết cố định:

Mẫu bộ lọc tùy chỉnh của tôi cho trường bộ lọc Url yêu cầu:

^/(index|[0-9]{4}\/)

Về cơ bản, điều đó có nghĩa là tìm kiếm / chỉ mục HOẶC bất kỳ đường dẫn số 4 chữ số nào kết thúc bằng dấu gạch chéo. Tôi đã tạo chế độ xem trong Analytics và thêm chế độ này làm bộ lọc:

Bộ lọc Chế độ xem Google Analytics

Dưới đây là một số ví dụ khác:

  • Bạn có một blog với năm trong đường dẫn liên kết cố định URL và bạn muốn lọc danh sách thành bất kỳ năm nào. Vì vậy, tôi muốn có 4 chữ số bất kỳ theo sau bởi một dấu gạch chéo. Yêu cầu mẫu bộ lọc URl:

^/[0-9]{4}\/

  • Bạn muốn so sánh tất cả các trang của mình mà tiêu đề có Giấy chứng nhận or cấp giấy chứng nhận trong đó. Dạng bộ lọc tiêu đề trang:

(.*)certificat(.*)

  • Bạn muốn so sánh hai trang đích dựa trên Phương tiện Chiến dịch của chúng được chuyển vào URL chiến dịch Google Analytics as utm_medium = thư trực tiếp or tìm kiếm có trả tiền.

(direct\smail|paid\ssearch)

  • Bạn muốn so sánh tất cả các sản phẩm là áo sơ mi nam dựa trên đường dẫn URL. Yêu cầu mẫu bộ lọc URl:

^/mens/shirt/(.*)

  • Bạn muốn so sánh tất cả các trang được đánh số với đường dẫn URL kết thúc bằng số. Yêu cầu mẫu bộ lọc URl:

^/page/[1-9]*/$

  • Bạn muốn loại trừ một loạt các Địa chỉ IP. Loại trừ Dạng bộ lọc Địa chỉ IP:

123\.456\.789\.[0-9]

  • Bạn muốn bao gồm trang thankyou.html nơi gửi thành công dựa trên chuỗi truy vấn thành công = true. Yêu cầu mẫu bộ lọc URl:

thankyou\.html\?success=true

Cách kiểm tra biểu thức Regex của bạn

Thay vì thử và sai trong Google Analytics, tôi thường chỉ chuyển sang regex101, một công cụ tuyệt vời để kiểm tra các biểu thức chính quy của bạn. Nó thậm chí còn chia nhỏ cú pháp của bạn cho bạn và cung cấp chi tiết về biểu thức chính quy của bạn:

biểu thức chính quy regex101

Xây dựng, Kiểm tra và Gỡ lỗi Regex

Bạn nghĩ gì?

Trang web này sử dụng Akismet để giảm spam. Tìm hiểu cách xử lý dữ liệu nhận xét của bạn.