Bài viết này là một trong số những bài thuộc chỉ mục bổ sung của Sub-Series JavaScript
trong Series Tự Học Lập Trình Web Một Cách Thật Tự Nhiên. Ở đây chúng ta sẽ điểm qua một vài phương thức thường sử dụng để làm việc với các chuỗi ký tự, và làm quen với một công cụ mới giúp chúng ta nhận dạng các chuỗi ký tự cần thao tác xử lý.
Biểu thị các ký tự đặc biệt trong một chuỗi string
Các ký tự đặc biệt được biểu thị trong chuỗi bằng cách mở đầu với ký hiệu \
.
escape.js
console.log('Dấu nháy đơn \' trong chuỗi');
// Dấu nháy đơn ' trong chuỗi console.log("Dấu nháy kép \" trong chuỗi");
// Dấu nháy kép " trong chuỗi console.log('Gạch nghiêng lùi lại \\ đi');
// Gạch nghiêng lùi lại \ đi console.log('Xuống dòng\nmới');
// Xuống dòng
// mới
Chuyển đổi một giá trị bất kỳ sang kiểu chuỗi string
Trong những trường hợp chúng ta truyền một giá trị thuộc kiểu khác vào thao tác xử lý yêu cầu một chuỗi. Thì giá trị đó sẽ được JavaScript tự động chuyển đổi bằng phương thức .toString()
của kiểu giá trị tương ứng. Trong trường hợp các kiểu giá trị đặc biệt không có phương thức .toString()
thì sẽ được chuyển đổi bằng hàm String()
.
string.js
var thing = { age: 1001 }; // thing.toString() -> '[object object]'
console.log('value | ' + thing);
// 'value | [object Object]' /* Ghi đè phương thức .toString() kế thừa của class Object */ thing.toString = function() { return '{ age: ' + this.age + ' }';
}; // thing.toString() -> '{ age: 1001 }'
console.log('value | ' + thing);
// 'value | { age: 1001 }' /* null & undefined không thể sử dụng phương thức .toString() */ // String(null) -> 'null'
console.log('value | ' + null);
// 'value | null' // String(undefined) -> 'undefined'
console.log('value | ' + undefined);
// 'value | undefined'
Dạng mẫu của chuỗi String Template
Một dạng mẫu string template
của chuỗi được khoanh vùng bởi một cặp dấu nháy ngược backstick
. Các string template
sẽ duy trì sự hiện diện của các ký tự khoảng trống thay vì lược giản giống như các chuỗi thông thường và chúng ta có thể viết chuỗi trên nhiều dòng code.
template.js
var template = ` code in console remains spaces
`;
console.log(template);
// code in console
// remains spaces
Bên cạnh đó thì các string template
cho phép chúng ta truyền vào các giá trị nội dung là các biến hoặc các biểu thức tính toán, mà không cần viết tách rời các chuỗi ở dạng ghép nối bằng phép +
.
template.js
var name = 'sky';
var age = 1001;
var message = `Thing is ${name}, and time is ${age - 1 + 1} years.`;
console.log(message);
// 'Thing is sky, and time is 1001 years.'
Các string template
còn được sử dụng với các hàm theo cách viết khá đặc biệt, không sử dụng các dấu ngoặc đơn khi truyền vào hàm. Lúc này hàm được gọi sẽ nhận được tham số đầu tiên là mảng các chuỗi con, và các tham số tiếp theo lần lượt là các biến đặt trong string template
.
tagged.js
var name = 'sky';
var age = 1001; const tag = function (subStringArray, first, second) { console.log(subStringArray); console.log(`${first} , ${second}`);
}; // tag tag`Thing is ${name}, and time is ${age} years.`; // ['Thing is ', ', and time is ', ' years.']
// 'sky, 1001'
Một số phương thức phổ biến của string
string.charAt(index)
- lấy ra ký ở vị tríindex
trong chuỗistring
.string.charCodeAt(index)
- lấy ra mã ký tự ở vị tríindex
trong chuỗistring
.
char.js
var text = 'The quick brown fox jumps over the lazy dog.';
console.log( text.charAt(10) ); // b
console.log( text.charCodeAt(10) ); // 98
string1.concat(string2)
- nối 2 chuỗi str1
và str2
, trả về kết quả là một chuỗi mới.
concat.js
var str1 = 'brown ';
var str2 = 'fox';
console.log( str1.concat(str2) );
// 'brown fox'
string.slice(start, end)
- tách lấy chuỗi con từ vị trí start
đến vị trí end
.
slice.js
var text = 'The quick brown fox jumps over the lazy dog.';
console.log( text.slice(10, 19) ); // 'brown fox'
string.split(str | regexp)
- phân tách chuỗi string
thành mảng các chuỗi con bởi phần phần phân tách là str
hoặc regexp
(xem phần sau).
split.js
var text = 'The quick brown fox jumps over the lazy dog.';
console.log( text.split(' ') );
// ['The', 'quick', 'brown', 'fox', 'jumps', 'over', 'the', 'lazy', 'dog.']
string.startsWith(subString)
- kiểm tra chuỗistring
có khởi đầu bởisubString
hay không, có phân biệt chữ viết hoa/viết thường.string.endsWith(subString)
- kiểm tra chuỗistring
có kết thúc bởisubString
hay không, có phân biệt chữ viết hoa/viết thường.
with.js
var text = 'The quick brown fox jumps over the lazy dog.';
console.log( text.startsWith('the') ); // false
console.log( text.endsWith('dog.') ); // true
string.includes(subString)
- kiểm tra sự hiện diện của subString
trong string
, có phân biệt chữ viết hoa/viết thường.
includes.js
var text = 'The quick brown fox jumps over the lazy dog.';
console.log( text.includes('Fox') ); // false
- [
string.indexOf(subString)
hoặcstring.indexOf(subString, index)
] - tìm vị trí xuất hiện đầu tiên củasubString
trongstring
tính từindex
(nếu có tham sốindex
). - [
string.lastIndexOf(subString)
hoặcstring.lastIndexOf(subString, index)
] - tìm vị trí xuất hiện cuối cùng củasubString
trongstring
tính từindex
(nếu có tham sốindex
).
indexof.js
var text = 'The quick brown fox jumps over the lazy dog.';
console.log( text.indexOf('he', 10) ); // 32
console.log( text.lastIndexOf('he', 10) ); // 1
string.padStart(length, subStr)
- lặp chuỗisubStr
và nối vào trước nội dung củastring
để tạo ra chuỗi mới có độ dàilength
.string.padEnd(length, subStr)
- lặp chuỗisubStr
và nối vào sau nội dung củastring
để tạo ra chuỗi mới có độ dàilength
.
pad.js
var thing = 'sky'; console.log( thing.padStart(9, '.') );
// '......sky' console.log( thing.padEnd(9, '.') );
// 'sky......'
string.repeat(n)
- lặp chuỗi string
để tạo ra chuỗi mới dài gấp n
lần.
repeat.js
var text = 'o';
console.log( sky.repeat(9) );
// 'ooooooooo'
string.toUperCase()
- Tạo ra chuỗi mới từstring
với nội dung được chuyển toàn bộ thành chữ viết hoa.string.toLowerCase()
- Tạo ra chuỗi mới từstring
với nội dung được chuyển toàn bộ thành chữ viết thường.
case.js
var text = 'The Quick Brown Fox'; console.log( text.toUpperCase() );
// 'THE QUICK BROWN FOX' console.log( text.toLowerCase() );
// 'the quick brown fox';
string.trimStart()
- xóa các khoảng trống ở đầu chuỗistring
để tạo ra chuỗi mới.string.trimEnd()
- xóa các khoảng trống ở cuối chuỗistring
để tạo ra chuỗi mới.string.trim()
- xóa các khoảng trống ở đầu và cuối chuỗistring
để tạo ra chuỗi mới.
trimg.js
var text = ' sky ';
var trimmed = text.trim();
console.log( trimmed.length ); // 3
Biểu thức thường thị Regular Expression
Các biểu thức thường thị regular expression
, viết tắt là regex
hay regexp
được sử dụng để biểu thị dạng thức pattern
của chuỗi mà chúng ta muốn tìm kiếm và làm việc trong một chuỗi lớn hơn hoặc nội dung văn bản lớn. Các regular expression
được sử dụng kèm với các phương thức của class String
giúp chúng ta nhanh chóng thực hiện các thao tác nhạn dạng, tìm kiếm, thay thế, phân tách các chuỗi, v.v...
Để tạo ra một biểu thức regexp
chúng ta có thể sử dụng cú pháp khởi tạo trực tiếp giống như việc khởi tạo mảng hay object
không thông qua các class
, hoặc khởi tạo bằng class RegExp
.
regexp.js
// tìm kiếm chuỗi có các chữ cái `b`
// ở giữa chữ cái `a` và `c` // khởi tạo trực tiếp có cách viết ngắn gọn
var oneRegexp = /ab+c/; // sử dụng class RegExp khi không biết trước pattern
var patternString = 'ab+c';
var anotherRegexp = new RegExp(patternString); // thay thế chuỗi con tìm thấy trong một chuỗi ban đầu
console.log('aabbbbbbbccc'.replace(oneRegexp, 'B'));
// 'aBcc'
Các regexp
có thể được gắn cờ flag
biểu thị cho chế độ duyệt kiểm tra chuỗi:
/pattern/i
- cời
haycase-insensitive
biểu thịpattern
sẽ được tìm kiếm trong chuỗi mà không phân biệt chữ cái viết hoa hay viết thường./pattern/m
- cờm
haymultiline
biểu thịpattern
sẽ được tìm kiếm trên nhiều dòng chứ không dừng lại ở ký tự ngắt dòng\n
có mặt trong chuỗi./pattern/g
- cờg
hayglobal
biểu thịpattern
sẽ được tìm kiếm với tất cả các khả năng xuất hiện trong chuỗi chứ không chỉ kết quả đầu tiên tìm thấy.
regexp.js
var text = 'The quick brown fox jumps over the lazy dog.'; // tìm kiếm vị trí chuỗi con 'th', có phân biệt chữ viết hoa/viết thường
var thCaseSensitive = /th/;
console.log( text.search(thCaseSensitive) );
// 31 '..e lazy dog.' // tìm kiếm vị trí chuỗi con 'th', không phân biệt chữ viết hoa/viết thường
var thIgnoreCase = /th/i;
console.log( text.search(thIgnoreCase) );
// 0 '..e quick brown fox jumps over the lazy dog.'
Để học các ký hiệu quy ước trong pattern
và có thể viết ra các regexp
đáp ứng tiêu chí tìm kiếm linh động, bạn có thể tham khảo các liên kết dưới đây.
- Các lớp ký tự trong
regexp
- Các kiểm tra ràng buộc
- Các nhóm và các dải ký tự
- Các ký hiệu định lượng ký tự
- Biểu thị các thuộc tính unicode
Một số phương thức để sử dụng regexp
với string
Ngoài phương thức string.search(regexp)
trong ví dụ ở phần trên, chúng ta còn có thể sử dụng regexp
với string
trong nhiều trường hợp khác nữa. Dưới đây là danh sách một số phương thức của string
và regexp
phổ biến trong nhóm tác vụ tìm kiếm, thay thế, và phân tách chuỗi.
regexp.exec(string)
- tìm kiếm một chuỗi con phù hợp. Kết quả trả về một mảng chứa các thông tin liên quan đến tác vụ tìm kiếm đang thực hiện, hoặcnull
nếu đã di chuyển đến hết chuỗistring
.regexp.test(string)
- kiểm tra để tìm ít nhất một kết quả phù hợp trong chuỗistring
. Kết quả trả về làtrue
hoặcfalse
.string.match(regexp)
- kiểm traregexp
nhận được có xuất hiện trong chuỗistring
hay không. Kết quả trả về là một mảng chứa tất cả các chuỗi con phù hợp, hoặcnull
.string.matchAll(regexp)
- tương tự vớistring.match(regexp)
. Kết quả trả về là mộtcollection
hỗ trợ lặp hayiterator
.string.search(regexp)
- tìm kiếm một kết quả phù hợp gần nhất. Trả về trị số chỉ vị trí của kết quả tìm được, hoặc-1
nếu không tìm thấy.string.replace(regexp, newstring)
- thay thế kết quả tìm thấy với một chuỗi con mớinewstring
.string.replaceAll(regexp, newstring)
- thay thế tất cả các kết quả phù hợp với chuỗi con mớinewstring
.string.split(regexp)
- Phân tách chuỗistring
tại các vị trí phù hợp. Trả về một mảng chứa các chuỗi con.
replace.js
var text = 'The quick brown fox jumps over the lazy dog.'; // thay thế tất cả các chuỗi con 'th'
// không phân biệt chữ hoa/thường
var newText = text.replaceAll(/th/ig, '...');
console.log(newText);
// '...e quick brown fox jumps over ...e lazy dog.'
Kết thúc bài viết
Bài viết bổ sung và điểm danh các phương thức phổ biến làm việc với kiểu dữ liệu string
của chúng ta tới đây là kết thúc. Trong bài sau, chúng ta sẽ nói sơ lược về 2 kiểu dữ liệu phổ biến được sử dụng để làm thành phần định danh cho các object
trong môi trường chạy code JavaScript. Hẹn gặp lại bạn trong bài viết tiếp theo.
(Sắp đăng tải) [JavaScript] Bài 21 - Date & Symbol