Giải ngố: Mozilla/5.0 là gì? Tại sao trình duyệt nào cũng có chuỗi này trong User-Agent?

Giải ngố: Mozilla/5.0 là gì? Tại sao trình duyệt nào cũng có chuỗi này trong User-Agent?

Threads
  • Hai ngày cuối tuần mình ngồi lên bản cập nhật cho OpenNotas.

    Ai còn đang cần tìm một ứng dụng ghi chú đa nền tảng, đơn giản, tập trung vào bảo mật thì dùng thử OpenNotas xem thế nào ha! Tham gia cộng đồng tại đây nha https://t.me/opennotas 🤓

    » Xem thêm
  • Thêm một bản folk của VSCode về AI-native IDE. Bạn có thể "cắm" hầu hết các LLMs vào để sử dụng. Mình cũng chưa thử trải nghiệm nữa vì đang hơi lười, nên để đây cho các bạn "ngâm cứu" 😁

    Aide - The open-source AI-native IDE

    » Xem thêm
  • Có bạn nào trong lúc code mà bị "ngẫn tò te" hoặc "lú lẫn" trong mớ hỗn độn của mình viết ra chưa. Những lúc như thế tôi thường hay ngừng lại, thư giãn đầu óc, hoặc để mai tính tiếp. Ấy vậy mà rất hiệu quả nhé! Lúc sau xem lại cái tự nhiên thấy vấn đề ở đâu ngay.

    Hoặc cũng có thể thử áp dụng phương pháp "chú vịt vàng" - thử giải thích vấn đề đang gặp phải với vịt xem, nó sẽ cho thấy mâu thuẫn trong lời nói ra.

    Còn không có tiền mua vịt to thì xe túi mù ra vịt bé giống mình nè 😅

    » Xem thêm

Vấn đề

Một ngày đẹp trời khi đang nghiên cứu về chuỗi User-Agent (UA) của các trình duyệt web đang được sử dụng phổ biến hiện nay. Tuy chúng khá dài và có vẻ khác nhau trên các loại trình duyệt nhưng tôi nhận ra ngoài những chuỗi đặc trưng gợi nên tên của trình duyệt như Chrome/43.0.2357.65, Firefox/40.0, MSIE 9.0... thì gần như tất cả đều có chứa một chuỗi là Mozilla/5.0 hoặc ít phổ biến hơn là WebKit. Vậy thì chúng là gì và tại sao lại xuất hiện trong User-Agent? Tôi đã lật lại lịch sử và phát hiện ra một số thú vị về điều này.

Lịch sử của chuỗi UA

NCSA Mosaic là trình duyệt web đầu tiên trên thế giới, ngay khi ra mắt Mosaic đã tự gọi mình là NCSA_Mosaic/2.0 (Windows 3.1) thông qua chuỗi UA mà ta biết đến tận nay. Mosaic đã biết hiển thị hình ảnh cùng với văn bản :D.

Sau đó xuất hiện một trình duyệt web mới được gọi là "Mozilla", đó là viết tắt của "Mosaic Killer". Nhưng họ chợt nhận ra cái tên đó không mấy thú vị vì vậy Mozilla đã được đổi thành Netscape và Netscape tự gọi mình là Mozilla/1.0 (Win3.1).

Netscape hỗ trợ frame, frame đã trở nên phổ biến trong cộng đồng Internet nhưng Mosaic thì lại không hỗ trợ frame, do đó các nhà phát triển buộc phải kiểm tra loại trình duyệt đang dùng để gửi về frame. Nếu trình duyệt là Netscape thì gửi còn lại thì không :D.

Netscape sau đó đã chế nhạo Microsoft (MS), coi Windows là "poorly debugged device drivers" và Microsoft đã rất tức giận. Vì vậy Microsoft đã tạo ra trình duyệt web của riêng họ mà họ gọi là Internet Explorer (IE) với hy vọng nó sẽ trở thành một "Netscape Killer".

Tất nhiên IE phải hỗ trợ frame, nhưng IE không phải là Mozilla, nên nó không được cung cấp frame bởi các quản trị viên web. MS ngày càng mất kiên nhẫn và không muốn đợi họ tìm hiểu về IE. Vì vậy IE tuyên bố rằng nó "tương thích với Mozilla" và bắt đầu mạo danh Netscape tự gọi mình là Mozilla/1.22 (compatible; MSIE 2.0; Windows 95). Ngay lập tức IE đã nhận được frame, điều đó làm MS hài lòng nhưng các quản trị viên web lại bối rối. MS đã bán IE cùng với Windows khiến cho nó phổ biến và tốt hơn Netscape. Cuộc chiến trình duyệt đầu tiên đã nổ ra khắp nơi. 

Đúng như MS dự đoán Netscape đã bị thất thủ. Nhưng Netscape đã được tái sinh thành Mozilla và Mozilla đã xây dựng Gecko và tự gọi mình là Mozilla/ 5.0 (Windows; U; Windows NT 5.0; en-US; rv: 1.1) Gecko/20020826. Gecko khi đó là công cụ kết xuất hiển thị tốt nhất.

Mozilla tiếp tục đổi tên thành Firefox và tự gọi mình là Mozilla/5.0 (Windows; U; Windows NT 5.1; sv-SE; rv: 1.7.5) Gecko/20041108 Firefox/1.0. Firefox lúc này đang thể hiện vai trò duyệt web rất tốt. Gecko bắt đầu sinh sôi và các trình duyệt khác ra đời sử dụng mã của nó. Chúng tự gọi là những cái tên như Mozilla/ 5.0 (Macintosh; U; PPC Mac OS X Mach-O; en-US; rv: 1.7.2) Gecko/20040825 Camino/0.8.1 the one và Mozilla/5.0 (Windows; U; Windows NT 5.1; de; rv: 1.8.1.8) Gecko/20071008 SeaMonkey/1.0. Tất cả đều cố "giả vờ" mình là Mozilla và đều được cung cấp bởi Gecko.

Gecko là trình kết xuất hiển thị tốt còn IE thì ngược lại, điều đó khiến cho các quản trị viên web lại lục sục phân biệt mã trả về trình duyệt. Các trình duyệt khác cũng dần đuối sức trước Gecko.

Những tín đồ của Linux đã thấy điều đó và không thể ngồi yên vì thế họ đã chế tạo ra Konqueror có engine là KHTML mà họ cho là tốt "như" Gecko nhưng nó không phải là Gecko nên không được trả về mã của Gecko, vì vậy Konquerer bắt đầu tuyên bố "tương thích với Gecko" để có được mã của Gecko và tự gọi nó là Mozilla/5.0 (compatible; Konqueror/3.2; FreeBSD) (KHTML, like Gecko).

Sau đó Opera đến và nói "chắc chắn là chúng tôi nên cho phép người dùng tự quyết định họ thích chọn trình duyệt nào". Vì vậy Opera đã cho phép người dùng tự chọn các chuỗi UA là Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; vi) Opera 9.51 hoặc Mozilla/5.0 (Windows NT 6.0; U; en; rv: 1.8.1) Gecko/20061208 Firefox/2.0.0 Opera 9.51 hoặc Opera/9.51 (Windows NT 5.1; U; en).

Apple đã xây dựng Safari và sử dụng KHTML nhưng họ đã thêm nhiều tính năng nên dự án được tách ra và gọi nó là WebKit nhưng họ lại muốn mã của các trang được viết cho KHTML. Vì vậy Safari tự gọi mình là Mozilla/5.0 (Macintosh; U; PPC Mac OS X; de-de) AppleWebKit/85.7 (KHTML, like Gecko) Safari/85.5.

Một lần nữa MS lại mang Internet Explorer quay trở lại với một phiên bản mới. Họ gọi nó là Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.0) và nó hiển thị mã của Gecko rất tốt, nhưng chỉ khi quản trị viên web ra lệnh cho nó làm như vậy.

Cuối cùng Google đã xây dựng Chrome sử dụng Webkit giống như Safari, và tất nhiên Chrome muốn có các trang web được xây dựng cho Safari nên nó lại giả vờ là Safari. Chrome tự gọi mình là Mozilla/5.0 (Windows; U; Windows NT 5.1; vi-US) AppleWebKit/525.13 (KHTML, like Gecko) Chrome/0.2.149.27 Safari/525.13.

Các trình duyệt sau đó dù được sinh ra như thế nào thì chúng cũng "cố gắng" chạy đua để trở nên "giống như" các trình duyệt đã có trên thị trường Internet.

Cho đến lúc này hãy tóm tắt lại xem cuộc chiến trình duyệt đã để lại gì cho chúng ta. Chrome đã sử dụng WebKit và giả vờ là Safari, còn WebKit giả là KHTML và KHTML giả là Gecko, vậy là tất cả các trình duyệt đều giả vờ là Mozilla!!!

Tổng kết

Giới trình duyệt đã trải qua nhiều biến động để lại chuỗi UA hỗn loạn như hiện nay. Vào năm 2020, Chrome đã tuyên bố sẽ loại bỏ chuỗi UA ra khỏi trình duyệt thay vào đó là nhưng có vẻ vẫn chưa thực hiện được. Còn về thực tại, các lập trình viên đang viết mã để tương thích với Mozilla/5.0 mà thôi :D.

Tham khảo:

hoặc
* Bản tin tổng hợp được gửi mỗi 1-2 tuần, huỷ bất cứ lúc nào.
Author

Xin chào, tôi tên là Hoài - một anh Dev kể chuyện bằng cách viết ✍️ và làm sản phẩm 🚀. Với nhiều năm kinh nghiệm lập trình, tôi đã đóng góp một phần công sức cho nhiều sản phẩm mang lại giá trị cho người dùng tại nơi đang làm việc, cũng như cho chính bản thân. Sở thích của tôi là đọc, viết, nghiên cứu... Tôi tạo ra trang Blog này với sứ mệnh mang đến những bài viết chất lượng cho độc giả của 2coffee.dev.Hãy theo dõi tôi qua các kênh LinkedIn, Facebook, Instagram, Telegram.

Bạn thấy bài viết này có ích?
Không

Bình luận (2)

Nội dung bình luận...
Avatar
Hương Trịnh1 năm trước
Bỏ UA đi thì sao mà detect đc browser nữa nhỉ? Kb có phát minh gì mới sao?
Trả lời
Avatar
Xuân Hoài Tống1 năm trước
Mình cũng đoán là chắc có công nghệ gì đó thay thế
Avatar
Vũ Mạnh Đức2 năm trước
Oh thì ra là vậy thật thú vị h mới hiểu :D
Trả lời
Avatar
Xuân Hoài Tống2 năm trước
:D hay mà bạn