5 điều gây rò rỉ bộ nhớ (memory leak) trong Node.js và cách khắc phục

5 điều gây rò rỉ bộ nhớ (memory leak) trong Node.js và cách khắc phục

Tin ngắn hàng ngày dành cho bạn
  • Mấy hôm trước OpenAI giới thiệu Deep Research - một công cụ duyệt web để nghiên cứu và cho ra một bản tổng hợp chỉ trong vài chục phút - so với nhiều giờ làm việc đối với con người, theo như họ công bố.

    Tính năng này hiện chỉ có sẵn cho người dùng Pro. Mặc dù chưa được dùng thử, nhưng qua nhiều bài viết đều nhấn mạnh vào sự ấn tượng trước khả năng của công cụ mới này. Nếu vẫn chưa biết Deep Research làm được gì thì bạn cứ hình dung như thế này: Nói với nó "Tôi cần thông tin nghiên cứu về lượng tiêu thụ cà phê của thế giới trong năm ngoái". Thế thôi! Ngồi chờ một lúc để nó tìm kiếm và tổng hợp lại kết quả và gửi lại cho bạn một bài báo cáo chi tiết. Chà, ghê thật chứ!

    Ngay lập tức huggingface đã lên một bài viết cố gắng tái tạo lại công cụ này theo cách của họ. Chi tiết tại Open-source DeepResearch – Freeing our search agents. Và không có gì ngạc nhiên khi cả 2 đều mang hơi hướng của AI Agents.

    » Xem thêm
  • Sống đủ lâu trong thế giới Internet, bạn có thể thấy rằng mọi người ở đây khá háo hức chạy theo xu hướng và chúng lan truyền với tốc độ chóng mặt.

    Chỉ vài tháng trước, chúng ta vẫn còn kinh ngạc về trí thông minh của các mô hình ngôn ngữ lớn (LLM) có thể trả lời giống như con người, và ngay sau đó, chúng đã được cập nhật với khả năng suy nghĩ và lý luận đáng kinh ngạc. Chúng được ứng dụng rộng rãi không chỉ trong lĩnh vực lập trình. Gần đây, thuật ngữ AI Agents đã tạo nên một sự khuấy động.

    Vậy, AI Agents là gì? Trong bài viết ngắn này, tất nhiên là không thể đưa ra một định nghĩa ngắn gọn nhưng toàn diện. Bạn đọc có thể tham khảo bài viết rất chi tiết này tại đây Agents | Chip Huyền. Để dễ hình dung hơn, AI Agents có thể được coi là một người hoặc một thực thể nào đó. Bản thân các Agents được trang bị tất cả các công cụ cần thiết. Từ đó, các Agents có thể kết hợp chúng để hoàn thành một nhiệm vụ mà chúng ta giao.

    Vẫn còn hơi mơ hồ phải không? Một ví dụ thực tế là khi bạn ra lệnh cho các Agents truy cập Facebook vào lúc 8 giờ tối mỗi ngày, kiểm tra bất kỳ tin tức nổi bật nào từ bạn bè, sau đó gửi tóm tắt đến Telegram. Vậy là xong!

    » Xem thêm
  • Hôm qua đến nay, lượt truy cập tới từ Facebook tăng đột biến. Thường như thế là do ai đó chia sẻ bài viết của blog vào một nhóm nào đó.

    Cơ mà lần này là liên kết trực tiếp đến trang chủ luôn. Tò mò ghê, không biết ai chia sẻ, chia sẻ ở đâu nữa. Muốn biết để tìm hiểu "insight" ghê 🥹

    » Xem thêm

Vấn đề

Rò rỉ bộ nhớ là hiện tượng ứng dụng không thể giải phóng bộ nhớ không cần dùng đến nữa trong quá trình hoạt động. Có thể ban đầu ứng dụng chạy rất mượt mà nhưng sau một thời gian lại trở nên chậm chạm, thậm chí giật lác khiến chúng bị "crash" và thứ bạn nhìn thấy lúc này rất có thể là thông báo JavaScript heap out of memory ở đâu đó trong console.

V8 trong Node.js được cung cấp mặc định 4GB cho dữ liệu cấp phát động hay còn gọi là Heap. Giới hạn này có thể tăng thêm nhưng đổi lại là hiệu năng của ứng dụng sẽ giảm sút. Các kiểu dữ liệu tham chiếu như Object, Function, Array sẽ được lưu trữ trong Heap. Chính vì thế nếu như quá nhiều đối tượng kể trên được cấp phát trong thời gian chạy (runtime) của ứng dụng sẽ gây ra hiện tượng tràn bộ nhớ.

Nếu đã biết được nguyên nhân sâu xa gây ra hiện tượng tràn bộ nhớ thì dưới đây là 5 điều phổ biến dẫn đến việc rò rỉ bộ nhớ cho đến khi không còn để mà rò rỉ nữa.

5 điều gây rò rỉ bộ nhớ

Khai báo biến toàn cục (Global Variables)

Biến toàn cục là các biến được khai báo với var hoặc this hoặc với cả các biến không được khai báo bằng từ khoá nào cả. Khi không được khai báo với từ khoá mặc định nó sẽ được gán vào window đối với trình duyệt.

function variables() {
  this.a = "Variable one";
  var b = "Variable two";
  c = "Variable three";
}

Những biến này sẽ không được trình thu gom rác của V8 giải phóng cho đến khi chúng được đặt thành null. Hãy đảm bảo rằng bạn kiểm soát được các biến mà bạn tạo ra khi khai báo toàn cục. Thận trọng hơn hãy sử dụng use strict để trình biên dịch cảnh báo bạn mỗi khi khai báo biến toàn cục.

Cần lưu ý khi sử dụng biến toàn cục để lưu trữ Object hay Array. Chúng sẽ không được giải phóng cho đến khi bạn đặt thành null, hay có thể dữ liệu lưu trữ bên trong nhiều lên đến mức mất kiểm soát, do đó chiếm một phần lớn bộ nhớ Heap.

Chia quá trình xử lý dữ liệu lớn thành các quá trình chunks và spawn

Điều gì sẽ xảy ra khi bạn cố gắng lấy ra hết vài triệu bản ghi trong cơ sở dữ liệu vào một đối tượng. Hay là đọc hết 1 triệu hàng trong file excel rồi xử lý chúng qua 77 49 bước nữa? Tin tôi đi khả năng cao bạn sẽ nhận được thông báo "Heap out of memory" trước khi mà có thể tiếp tục xử lý được đấy. Vì lúc này dữ liệu được nạp vào quá lớn sẽ khiến Heap nhanh chóng bị lấp đầy đến khi không còn chỗ chứa. Chưa kể đến việc xử lý dữ liệu trên một đối tượng lớn như thế sẽ khiến ứng dụng của bạn trở nên chậm chạm và gây ra nhiều vấn đề khác.

Có nhiều cách để giải quyết trường hợp này, nhưng phổ biến là các trường hợp chia nhỏ (chunks) từng phần dữ liệu ra để xử lý. Còn để tăng tốc xử lý thì hãy tạo thêm (spawn) một số tiến trình con trong Node như trong bài viết Worker threads là gì? Bạn đã biết khi nào thì sử dụng Worker threads trong node.js chưa? mà tôi đã đề cập trước đó.

Cẩn thận với setInterval

Cẩn thận với setInterval

setInterval là một hàm cho phép chúng ta lặp lại một tác vụ sau mỗi một thời gian nhất định. Sẽ không có gì khi bạn kiểm soát được số lượng các hàm setInterval. Nhưng việc không kiểm soát được cộng thêm nhiệm vụ nặng nề mà chúng phải gánh vác thì khả năng cao lượng bộ nhớ được phân bổ mất kiểm soát càng nhiều. Vì thế hãy đảm bảo clearTimeout được gọi khi setInterval không còn cần thiết nữa.

const arr = [];
 
const interval = setInterval(() => {
  arr.push(new Date());
}, 1000);

clearInterval(interval);

Loại bỏ các biến không dùng nữa khỏi Closure

Mặc dù Closure gây ra nhiều tranh cãi về việc nó gây ra rò rỉ bộ nhớ hay không tuy nhiên nhìn vào cách nó vẫn lưu giữ được giá trị của các biến ngay cả khi hàm đã return thể hiện rằng Heap vẫn phải chịu một phần chi phí lưu trữ này.

Ví dụ một hàm Closure sau:

const fn = () => {
  let Person1 = { name: "2coffee", age: 19 };
  let Person2 = { name: "hoaitx", age: 20 };
 
  return () => Person2;
};

Sau khi fn() được gọi và thực thi xong Person1 sẽ được giải phóng nhưng Person2 thì không bởi vì nó vẫn bị tham chiếu đến trong hàm trả về (return).

Unsubscribe khỏi Observers và Event Emiter

Observers và Event Emiter cũng có vấn đề tương tự như setInterval ở trên. Giữ các Observers trong thời gian dài có thể gây ra rò rỉ bộ nhớ. Hãy huỷ theo dõi các Observers bất cứ khi nào bạn không còn cần đến chúng.

Ví dụ:

const EventEmitter = require("events").EventEmitter;
const emitter = new EventEmitter();
 
const bigObject = {};
const listener = () => {
  doSomethingWith(bigObject);
};

emitter.on("event1", listener);

bigObject sẽ bị giữ lại cho đến khi listener được huỷ theo dõi.

emitter.removeEventListener("event1", listener);

Ngay cả Node.js cũng cảnh báo việc rò rỉ bộ nhớ nếu có hơn 10 trình lắng nghe sự kiện được gắn vào 1 bộ phát sự kiện.

emitter.on("event1", listener);
emitter.on("event2", listener2);
...
emitter.on("eventN", listenerN);

// sẽ nhận được cảnh báo giống như
// "(node) warning: possible EventEmitter memory leak detected. N listeners added. Use emitter.setMaxListeners() to increase limit."

Tổng kết

Phần lớn hiện tượng rò rỉ bộ nhớ khó phát hiện sớm cho đến khi bạn ứng dụng của bạn đột ngột lăn ra chết. Lúc này việc của bạn là phải tìm ra nguyên nhân và khắc phục sớm nhất có thể. Dựa vào 5 điều trên hy vọng sẽ giúp ích được cho bạn trong quá trình sửa chữa những sai lầm đó.

Nếu bạn còn phát hiện thêm những trường hợp nào có thể gây ra hiện tượng rò rỉ bộ nhớ cũng như cách để khắc phục thì hãy bình luận phía dưới cho mọi người cùng biết nhé!

Tham khảo:

Cao cấp
Hello

Bí mật ngăn xếp của Blog

Là một lập trình viên, bạn có tò mò về bí mật công nghệ hay những khoản nợ kỹ thuật về trang blog này? Tất cả bí mật sẽ được bật mí ngay bài viết dưới đây. Còn chờ đợi gì nữa, hãy bấm vào ngay!

Là một lập trình viên, bạn có tò mò về bí mật công nghệ hay những khoản nợ kỹ thuật về trang blog này? Tất cả bí mật sẽ được bật mí ngay bài viết dưới đây. Còn chờ đợi gì nữa, hãy bấm vào ngay!

Xem tất cả

Đăng ký nhận thông báo bài viết mới

hoặc
* Bản tin tổng hợp được gửi mỗi 1-2 tuần, huỷ bất cứ lúc nào.

Bình luận (0)

Nội dung bình luận...
Bấm hoặc cuộn mạnh để sang bài mới