Đừng chặn vòng lặp sự kiện (Don't block the Event Loop) - Phần 2

Đừng chặn vòng lặp sự kiện (Don't block the Event Loop) - Phần 2

Bài viết trong chủ đề này:
  1. Đừng chặn vòng lặp sự kiện (Don't block the Event Loop) - Phần 1
  2. Đừng chặn vòng lặp sự kiện (Don't block the Event Loop) - Phần 2
Tin ngắn hàng ngày dành cho bạn
  • Cảm ơn threads.net của nhà Meta vì nó là nguồn cảm hứng cho mình tạo ra chuyên mục này trên blog. Ban đầu hơi nghi ngờ về việc liệu tạo ra các bài viết ngắn như thế này có thu hút được người dùng, có ai ngày qua ngày quay trở lại đọc không, hay tất cả chỉ như dã tràng xe cát? Như mình đã nói rất nhiều là làm ra một tính năng không khó, nhưng vận hành nó làm sao cho hiệu quả mới là điều cần phải bận tâm.

    Giờ đây thời gian đã chứng minh tất cả. Chuyên mục Bài viết ngắn luôn đứng trong tốp 5 trang có lượt truy cập nhiều nhất trong ngày/tuần/tháng. Điều đó có nghĩa bạn đọc đã có thói quen quay trở lại nhiều hơn. Tại sao mình lại khẳng định như thế? Vì chuyên mục này gần như không hề được SEO trên các công cụ tìm kiếm như Google.

    Lại kể về thời xa xưa một chút. Thời gian đầu mình rất chịu khó đăng bài trên threads.net với hy vọng thu hút được nhiều người theo dõi, để từ đó khéo léo giới thiệu họ trở thành người dùng blog của mình. Nhưng càng về sau càng thấy "đuối" vì thuật toán của Threads ngày càng không phù hợp với định hướng của mình. Hay nói cách khác là nội dung tạo ra không ăn khách.

    Ví dụ các bài viết của mình thường mang khuynh hướng chia sẻ thông tin, tin tức, hoặc kinh nghiệm cá nhân rút ra sau khi học hoặc làm một cái gì đó. Dường như những bài viết như vậy không được đánh giá cao và thường bị chôn vùi chỉ sau hơn... 100 lượt xem. Hmm... Liệu vấn đề có phải là do mình? Biết thế sao không chịu thay đổi nội dung theo hướng phù hợp hơn với nền tảng?

    Mình đã quan sát Threads, các nội dung dễ lan toả nhất là có yếu tố gây tranh cãi hoặc một định kiến về vấn đề gì đó, đôi khi chỉ đơn giản là phát biểu "ngây ngô" một vấn đề gì đó mà họ biết chắc chắn có tương tác. Mà mình thì gần như là không hề thích định hướng người dùng theo nội dung kiểu này. Mọi người có thể bảo mình bảo thủ, mình chấp nhận. Mỗi người có định hướng nội dung và khán giả khác nhau, lựa chọn nằm ở họ.

    Thế là từ đó mình chủ yếu viết trên này. Chỉ thi thoảng có phát hiện hay lắm thì mới lên Threads "khoe". Ở đây hàng ngày vẫn có người vào đọc, dù cho bạn là ai thì mình tin chắc rằng các bạn nhận ra được thông điệp mà mình muốn truyền tải thông qua mỗi bài viết. Ít nhất chúng ta có chung một định hướng về nội dung. Đôi khi điều sợ nhất không phải là viết ra không ai đọc, mà là họ đọc xong rồi lãng quên trong phút chốc. Số lượng là quan trọng, nhưng chất lượng mới là thứ mang chúng ta lại gần nhau hơn.

    Cảm ơn tất cả 🤓

    » Xem thêm
  • Zed chắc là cộng đồng những nhà phát triển chịu khó lắng nghe người dùng nhất quả đất. Mới đây họ thêm tuỳ chọn để tắt tất tần tật tính năng AI có trong Zed. Trong khi nhiều bên khác đang muốn tích hợp sâu hơn và làm nhiều hơn với AI Agent. Quả là một nước đi táo bạo 🤔

    You Can Now Disable All AI Features in Zed

    » Xem thêm
  • Hôm nay mình đã cố gắng đi hẳn 8k bước trong một phiên để đo lường cho các bạn thấy. Quả là không ngoài dự đoán khi thời gian đi lên đến hơn 1 giờ và quãng đường ~6km 🤓

    À vài hôm nữa là hết tháng, tức là cũng tròn 1 tháng mình bắt đầu thói quen đi bộ mỗi ngày với mục tiêu 8k bước. Để đầu tháng sau mình tổng kết lại xem thế nào luôn ha.

    » Xem thêm

Đừng bao giờ chặn Event Loop

Tất cả các yêu cầu đến cho đến lúc nhận được phản hồi đều đi qua Event Loop. Điều này có nghĩa là nếu Event Loop dành thời gian quá lâu tại bất kỳ thời điểm nào thì tất cả yêu cầu hiện tại và yêu cầu mới sẽ không được xử lý.

Chúng ta nên đảm bảo rằng sẽ không bao giờ chặn Event Loop. Nói cách khác, mỗi hàm callbacks hoàn tất càng nhanh càng tốt. Điều này cũng áp dụng cho await, Promise.then, v.v...

Một cách tốt để đảm bảo điều này là xem xét về "độ phức tạp thuật toán" của các hàm callbacks của bạn. Nếu hàm callback xử lý không quan tâm đến số lượng đầu vào thì chúng ta sẽ đảm bảo được sự "công bằng" cho mỗi yêu cầu. Nếu callbacks thực hiện thực hiện các bước xử lý khác nhau tùy thuộc vào đối số của nó, thì chúng ta nên quan tâm trường hợp xấu nhất là mất bao nhiêu thời gian.

Ví dụ một yêu cầu không quan tâm đầu vào:

app.get('/constant-time', (req, res) => {
  res.sendStatus(200);
});

Còn đây là một yêu cầu mà thời gian xử lý phụ thuộc vào tham số đầu vào.

app.get('/countToN', (req, res) => {
  const n = req.query.n;
  for (let i = 0; i < n; i++) {
    // thực hiện một điều gì đó mỗi lần lặp
  }
  res.sendStatus(200);
});

Node.js sử dụng V8 Engine, công cụ này khá nhanh cho nhiều hoạt động phổ biến. Tuy nhiên, nó cũng có một số trường hợp ngoại lệ đó là làm việc với các biểu thức regexps hoặc JSON.

REDOS: Tấn công từ chối dịch vụ bằng biểu thức regexp

Một cách phổ biến để khiến Event Loop bị chặn là sử dụng một biểu thức regexp "dễ bị tổn thương". Vì thế chúng ta nên tránh việc sử dụng các biểu thức regex dễ bị tổn thương.

Hiểu đơn giản rằng đôi khi chúng ta cần sử dụng regexp để xác định hay tìm kiếm một chuỗi kí tự nào đó. Thật không may trong một số trường hợp, việc kết hợp các chuỗi regexp có thể mất một cơ số thời gian theo cấp số nhân tuỳ thuộc vào chuỗi đầu vào.

Một biểu thức regexp dễ bị tổn thương là một biểu thức regexp có thể mất thời gian theo cấp số nhân, và điều này dẫn đến REDOS. Việc xác định các biểu thức regexp có thực sự mất nhiều thời gian theo cấp số nhân hay không là một câu hỏi khó trả lời, và nó tùy thuộc vào việc bạn đang sử dụng Perl, Python, Ruby, Java, JavaScript v.v... nhưng đây là một số quy tắc áp dụng trên tất cả các ngôn ngữ này:

  • Tránh các định lượng lồng nhau như. Động cơ regexp của V8 có thể xử lý một số trong những một cách nhanh chóng, nhưng những người khác là dễ bị tổn thương.(a+)*
  • Tránh OR với các mệnh đề chồng chéo. Một lần nữa, đây là những đôi khi nhanh chóng.(a|a)*
  • Tránh sử dụng backreferences. Không có động cơ regexp có thể đảm bảo đánh giá những trong thời gian tuyến tính.(a.*) \1
  • Nếu bạn đang thực hiện đối sánh chuỗi đơn giản, hãy sử dụng hoặc tương đương cục bộ. Nó sẽ rẻ hơn và sẽ không bao giờ mất nhiều hơn .indexOf O(n)

Nếu bạn không chắc chắn liệu biểu thức chính quy của mình có dễ bị tổn thương hay không, hãy nhớ rằng Node.js thường không gặp sự cố khi báo cáo kết quả trùng khớp ngay cả đối với regexp dễ bị tổn thương và chuỗi đầu vào dài. Hành vi hàm mũ được kích hoạt khi có một không phù hợp nhưng Node.js không thể chắc chắn cho đến khi nó cố gắng nhiều đường dẫn thông qua chuỗi đầu vào.

Có một số công cụ để kiểm tra độ an toàn của biểu thức regexp:

Tuy nhiên, chúng không hẳn sẽ bắt được tất cả các regexps dễ bị tổn thương.

Một cách tiếp cận khác là sử dụng một công cụ regexp khác nhau. Bạn có thể sử dụng mô-đun node-re2, sử dụng công cụ regexp RE2 nhanh chóng của Google. Nhưng được cảnh báo, RE2 không phải là 100% tương thích với regexps của V8, do đó, kiểm tra hồi quy nếu bạn trao đổi trong mô-đun nút-re2 để xử lý regexps của bạn. Và regexps đặc biệt phức tạp không được hỗ trợ bởi node-re2.

Core modules tiêu tốn nhiều thời gian

Một số modules lõi của Node.js có các API đồng bộ "có chi phí đắt", bao gồm:

  • Encryption
  • Compression
  • File System
  • Child Process

Các API này rất tốn kém, bởi vì chúng liên quan đến tính toán đáng kể (mã hóa, nén), yêu cầu I/O (tệp I/O) hoặc có khả năng cả hai (quá trình con). Các API này được thiết kế để tạo kịch bản thuận tiện, nhưng không dành cho việc sử dụng trong ngữ cảnh máy chủ. Nếu bạn thực thi chúng trên Vòng lặp Sự kiện, chúng sẽ mất nhiều thời gian hơn để hoàn thành so với hướng dẫn JavaScript thông thường, chặn Vòng lặp Sự kiện.

Trong một máy chủ, bạn không nên sử dụng các API đồng bộ sau đây từ các mô-đun này:

Encryption:

  • crypto.randomBytes (sync)
  • crypto.randomFillSync (sync)
  • crypto.pbkdf2Sync (sync)

Bạn cũng nên cẩn thận về việc cung cấp đầu vào lớn cho các thói quen mã hóa và giải mã.

Compression:

  • zlib.inflateSync
  • zlib.deflateSync

File System:

Không sử dụng API hệ thống tệp đồng bộ. Ví dụ, nếu các tập tin bạn truy cập là trong một hệ thống tập tin phân phối như NFS, thời gian truy cập có thể khác nhau rất nhiều.

Child Process:

  • child_process.spawnSync
  • child_process.execSync
  • child_process.execFileSync

JSON DOS

JSON.parse cũng là một hoạt động "có chi phí đắt". Nó phụ thuộc vào độ dài của dữ liệu đầu vào, cho nên có thể mất nhiều thời gian đáng ngạc nhiên. JSON.stringify cũng vậy, chúng có độ phức tạp lên đến O(n)n.

Nếu máy chủ của bạn thao tác các đối tượng JSON, đặc biệt là xử lý dữ liệu nhận từ một từ một client, bạn nên thận trọng về kích thước của chúng.

Ví dụ: Chúng ta tạo ra một đối tượng chuỗi có kích thước 2^21, và sau đó JSON.parse nó. Chuỗi có kích thước là 50MB. Phải mất 0.7 giây để stringify các đối tượng, 0.03 giây để indexOf, và 1.3 giây để parse chuỗi.

var obj = { a: 1 };
var niter = 20;

var before, str, pos, res, took;

for (var i = 0; i < niter; i++) {
  obj = { obj1: obj, obj2: obj };
}

before = process.hrtime();
str = JSON.stringify(obj);
took = process.hrtime(before);
console.log('JSON.stringify took ' + took);

before = process.hrtime();
pos = str.indexOf('nomatch');
took = process.hrtime(before);
console.log('Pure indexof took ' + took);

before = process.hrtime();
res = JSON.parse(str);
took = process.hrtime(before);
console.log('JSON.parse took ' + took);

Để khắc phục tình trạng này, có một số module trên npm cung cấp các API JSON bất đồng bộ như:

  • JSONStream.
  • Big-Friendly JSON, có API stream cũng như các phiên bản bất đồng bộ của các API JSON tiêu chuẩn bằng cách sử dụng mô hình partitioning-on-the-Event-Loop.

Tổng kết

Bài viết trên đây đã đưa ra một số hành vi tưởng chừng như đơn giản nhưng lại gây ảnh hưởng rất lớn đến Event Loop. Ở bài viết sau chúng ta sẽ cũng nhau tìm hiểu những giải pháp để xử lý việc "chặn" Event Loop.

Cao cấp
Hello

Tôi & khao khát "chơi chữ"

Bạn đã thử viết? Và rồi thất bại hoặc chưa ưng ý? Tại 2coffee.dev chúng tôi đã có quãng thời gian chật vật với công việc viết. Đừng nản chí, vì giờ đây chúng tôi đã có cách giúp bạn. Hãy bấm vào để trở thành hội viên ngay!

Bạn đã thử viết? Và rồi thất bại hoặc chưa ưng ý? Tại 2coffee.dev chúng tôi đã có quãng thời gian chật vật với công việc viết. Đừng nản chí, vì giờ đây chúng tôi đã có cách giúp bạn. Hãy bấm vào để trở thành hội viên ngay!

Xem tất cả

Đăng ký nhận thông báo bài viết mới

hoặc
* Bản tin tổng hợp được gửi mỗi 1-2 tuần, huỷ bất cứ lúc nào.

Bình luận (0)

Nội dung bình luận...