Sử dụng biểu thức chính quy trong PHP
Các hàm PHP có sử dụng biểu thức chính quy RegExp làm pattern như các hàm preg_match, preg_replace, preg_grep ...
thì các biểu thức chính quy được viết theo quy tắc chung trình bày tại
Biểu thức chính quy RegExp
nhưng tuân theo Biểu thức chính quy tương thích với PERL
với một số lưu ý như sau:
Sử dụng ký nhiệu nhận biết biểu thức RegExp
Các biểu thức chính quy nhận biết nằm trong cặp ký hiệu tùy chọn
/.../
hoặc
#...#
hoặc
+...+
hoặc
%...%
Ví dụ như viết biểu thức theo Biểu thức chính quy RegExp thông thường, rồi chuyển sang tương thích với PERL để sử dụng với PHP
RegExp thông thường | RegExp tương thích PERL có thể là |
foo bar |
/foo bar/ |
^[^0-9]$ |
#^[^0-9]$# |
php |
+php+ |
[a-zA-Z0-9_-] |
%[a-zA-Z0-9_-]% |
Sử dụng thêm các ký hiệu tập hợp ký tự
Ngoài các ký hiệu tập hợp ký tự chung (Tập ký tự trong RegEx),
thì có một số ký hiệu có thể sử dụng với PHP.
Các ký hiệu này biểu diễn bởi cách viết biểu thức như sau: [: ký_hiệu :]
alnum | Ký tự chữ và số |
alpha | Các chữ |
ascii | Ký tự có mã 0 - 127 |
blank | Khoảng trắng |
cntrl | Các ký tự điều khiển |
digit | Số (giống \d) |
graph | Các ký tự in ra được, trừ khoảng trắng |
lower | ký tự thường |
Ký tự in được, cả khoảng trắng | |
punct | Ký tự in được, trừ chữ và số |
space | khoảng trắng (nó không hẳng tương ứng với \s) |
upper | Ký tự viết hoa |
word | "word" các từ (giống \w) |
xdigit | số hexadecimal |