Mọi thứ đều "miễn phí" - Kỳ II - Miếng bánh mang tên dữ liệu

Mọi thứ đều "miễn phí" - Kỳ II - Miếng bánh mang tên dữ liệu

Threads
  • Tuôi" để ý là cứ đợt nào ham đọc cái là lại lười viết, tuần nay tuôi đang đọc một lúc 3 cuốn, à phải là đọc 2 và nghe 1.

    Cuốn sách ám ảnh nhất đến thời điểm hiện tại: Đại dương đen - thuật lại 12 câu chuyện của 12 người mắc bệnh trầm cảm. Thần kinh vững, nhưng mới đọc 2 câu truyện đầu thôi mà cảm giác ngộp thở, bứt rứt thật khó tả 😰

    Câu chuyện tiếp theo đó thì mang lại cảm giác dễ thở hơn vì họ kiểm soát được bản thân. Nhưng sang tiếp câu chuyện thứ 4, thứ 5 thì lại như một có một bàn tay siết họng mình lại. Không thể nhắm mắt mà nghe được á, có gì đó rất đáng sợ.

    Một câu mà mình cảm thấy ám ảnh nhất là khi ba mẹ của người mắc trầm cảm luôn miệng hỏi tại sao con lại như thế mỗi khi sắp lên cơn và gào thét. Họ chỉ đành bất lực trả lời là "Làm sao mà con biết! Cũng giống như hỏi một người bị ốm là tại sao lại ốm? Làm sao mà biết được chứ! Có ai muốn đâu!".

    » Xem thêm
  • Mistral.ai là một công ty AI có trụ sở tại Pháp, được biết đến với nhiều mô hình ngôn ngữ lớn Mistral. Mới đây họ vừa ra mắt thêm một số mô hình có kích thước siêu lớn, siêu mạnh... Nhưng tạm khoan nói đến vì Mistral Chat cũng vừa được ra mắt với nhiều tính năng hay ho tương tự như Chat GPT mà lại miễn phí 😇

    » Xem thêm
  • Qwen2.5-Coder-32B đang là tâm điểm của sự chú ý khi điểm số của nó đánh bại cả GPT-4o hay kể cả là Claude Sonet 3.5. Điều đáng chú ý là nó là mã nguồn mở. Điều đó đồng nghĩa với việc bạn hoàn toàn có thể kéo models về máy và chạy cục bộ dưới máy tính của mình. Nhưng...

    Để chạy được mô hình thì GPU máy tính phải đạt cấp độ quái vật. Cụ thể trong một bài đăng của người dùng thử nghiệm Qwen2.5-Coder-32B trên GTX 3090 thì tốc độ tối đa models cho ra nằm ở mức hơn 30 tokens/s.

    Hy vọng vài nữa sẽ có một bên như Groq hay SambaNova dựng lên để "kiểm thử" hiệu năng con chip của họ, và quan trọng hơn hết là cho anh em dùng "chùa" thì hay biết mấy 🫣

    Tham khảo: Qwen2.5-Coder-32B is an LLM that can code well that runs on my Mac

    » Xem thêm

Vấn đề

Mọi thứ đều miễn phí thì người dùng là "món hàng" - câu nói này chắc hẳn nhiều người đã nghe ở đâu đó. Hầu hết mọi người sẵn sàng làm ra các sản phẩm miễn phí để thu hút người dùng rồi sau đó tìm cách kiếm tiền trên tập người dùng này. Cách này rất phổ biến trong hiện tại bởi dễ tiếp cận và thu hút người dùng. Trong khi họ không cần trả tiền để sử dụng nhưng dữ liệu mà họ cung cấp lại là tiền đề cho các hoạt động kiếm tiền khác, ví dụ như quảng cáo.

Hãy tìm hiểu hai ví dụ lớn nhất trong ngành quảng cáo dựa trên dữ liệu người dùng là Facebook và Google.

Facebook cung cấp dịch vụ mạng xã hội miễn phí cho hàng tỷ người dùng trên toàn thế giới. Công ty kiếm tiền chủ yếu từ việc bán quảng cáo, và nguồn thu lớn nhất của Facebook đến từ việc thu thập dữ liệu người dùng, phân tích hành vi và sở thích của họ để phục vụ cho mục đích quảng cáo.

Facebook sử dụng rất nhiều thông tin cá nhân mà người dùng chia sẻ để tạo ra các hồ sơ chi tiết. Những hồ sơ này được phân tích để hiển thị quảng cáo đã được cá nhân hóa, nhằm tăng khả năng nhấp chuột và mua hàng. Tưởng tượng như bạn đang quan tâm đến một mặt hàng, nhưng không hề nói với Facebook biết, chỉ một phút sau, trang mạng xã hội bỗng ngập tràn quảng cáo về sản phẩm đó.

Tương tự, Google cung cấp một loạt dịch vụ miễn phí như công cụ tìm kiếm, Gmail, Google Maps, YouTube... Nguồn thu chính của Google cũng đến từ quảng cáo trực tuyến thông qua nền tảng Google Ads. Trong báo cáo quý I năm 2024, Alphabet (công ty mẹ của Google) ghi nhận 80,5 tỷ USD doanh thu trong đó tổng doanh thu quảng cáo là 61,66 tỷ USD, đủ để thấy hoạt động quảng cáo của họ mạnh đến mức nào.

Cũng như Facebook, Google thu thập dữ liệu từ các truy vấn tìm kiếm, email, lịch sử duyệt web, vị trí địa lý, và các tương tác của người dùng. Dữ liệu này được sử dụng để xây dựng hồ sơ người dùng và hiển thị quảng cáo được tùy chỉnh theo sở thích và hành vi của từng cá nhân. Ngoài ra hệ sinh thái của Google rất mạnh khi họ có thể thu thập hành vi người dùng qua nhiều kênh khác nhau.

Nhưng thế thì có ảnh hưởng gì đến những người dùng miễn phí?

Ảnh hưởng từ phần mềm miễn phí

Vào năm 2018, khi có thông tin rằng công ty tư vấn chính trị Cambridge Analytica đã thu thập và sử dụng trái phép dữ liệu cá nhân của hàng chục triệu người dùng Facebook mà không có sự đồng ý của họ. Cambridge Analytica thu thập dữ liệu của khoảng 87 triệu người dùng mà không được sự đồng ý.

Cambridge Analytica đã sử dụng dữ liệu thu thập được để phát triển các chiến lược quảng cáo chính trị nhắm mục tiêu chính xác đến từng cá nhân. Công ty này đã dùng dữ liệu đó để nhắm quảng cáo vào đích danh người dùng nhằm thao túng các hoạt động chính trị.

Hậu quả CEO của Facebook, Mark Zuckerberg, đã phải ra điều trần và thừa nhận những sai lầm trong việc quản lý dữ liệu người dùng. Cambridge Analytica bị giải thể. Các quốc gia và tổ chức trên toàn thế giới cũng đã bắt đầu triển khai các biện pháp bảo vệ dữ liệu chặt chẽ hơn, chẳng hạn như Quy định Bảo vệ Dữ liệu Chung (GDPR) của Liên minh Châu Âu.

Tương tự, vụ vi phạm dữ liệu của Google năm 2018 là một vụ bê bối lớn về quyền riêng tư dữ liệu. Trong đó API Google+ đã tiết lộ dữ liệu riêng tư của hơn năm trăm nghìn người dùng. Chrome - một trình duyệt web miễn phí được nhiều người dùng nhất cũng nhiều lần bị cáo buộc thu thập thông tin người dùng một cách âm thầm và lặng lẽ.

Tóm lại, chính họ đang dùng dữ liệu của người dùng miễn phí để kiếm tiền dựa trên hoạt động quảng cáo nhắm đến người dùng cuối. Ngoài ra, dữ liệu của người dùng còn gián tiếp cho các hành động thao túng hoặc nguy cơ rò rỉ bất kỳ lúc nào.

Trong khi hành vi quảng cáo dựa trên dữ liệu người dùng là hợp pháp. Có chăng những bê bối đều xoay xung quanh dữ liệu bị rò rỉ, từ đó bị lợi dụng vào mục đích xấu. Thì game, phần mềm hoặc thậm chí là đọc miễn phí lại ở phía ngược lại của cán cân công lý.

Ảnh hưởng từ phần mềm lậu

Phần mềm lậu cũng được kiếm tiền thông qua hình thức hiển thị quảng cáo. Các trang web tổng hợp phần mềm lậu tại một nơi và gắn quảng cáo ngập tràn trang web của họ. Ngược lại với quảng cáo chính thống, các quảng cáo này có phần cực đoan và dấu hiệu vi phạm pháp luật khi chứa những nội dung không lành mạnh. Chưa kể các quảng cáo độc hại và gây nhầm lẫn, thay vì tải về được phần mềm thì lại vô tình tải xuống một loạt mã độc khác.

Ngoài ra các phần mềm lậu thường được lưu trữ ở một số trang chia sẻ kém chất lượng, yêu cầu người dùng nạp tiền để tải nếu không phải tải xuống với một tốc độ cực kỳ chậm. Mục đích của cách làm này cũng là hiển thị quảng cáo, đồng thời chia hoa hồng nếu người dùng "chịu chi" cho lần tải xuống đó.

Nếu phần mềm lậu càng dễ tải xuống thì càng nguy hiểm khi nó có thể chứa mã độc. Các mã độc này rất đa dạng và phục vụ cho nhiều mục đích khác nhau. Cái thì spam quảng cáo, cái thì ghi lại hành trình phím (Keylogger), cái thì ăn cắp Cookie để xâm phạm trái phép tài khoản người dùng, cái thì ăn trộm luôn dữ liệu người dùng hoặc biến máy tính thành một phần tử trong mạng botnet dùng cho những đợt tấn công quy mô lớn. Nhìn chung, một khi máy đã nhiễm mã độc, hậu quả rất ghê ghớm cho cá nhân và cả người khác.

Nhưng chưa hết, sử dụng phần mềm lậu vừa tiếp tay cho kẻ xấu và vừa giết chết cả doanh nghiệp vừa và nhỏ khác. Mỗi lần ai đó sử dụng phần mềm lậu hoặc vi phạm bản quyền, điều đó tạo ra một tiền lệ và khuyến khích những người khác làm theo. Điều này làm suy yếu nền kinh tế sáng tạo, làm giảm động lực của các nhà phát triển, nghệ sĩ, và các nhà sáng tạo nội dung tiếp tục sản xuất những sản phẩm chất lượng. Khi bạn sử dụng phần mềm lậu, bạn không đóng góp vào việc phát triển, cải thiện, và bảo mật của phần mềm đó. Các nhà phát triển không nhận được nguồn tài chính cần thiết để tiếp tục duy trì và nâng cấp sản phẩm, dẫn đến sự suy giảm chất lượng và tính năng.

Như vậy, một lần nữa dữ liệu người dùng lại là miếng bánh ngon. Nhưng không phải dành cho những người nông dân cần cù mà lại rơi vào tay những tên địa chủ nứt đố đổ vách. Tôi tin rằng chỉ cần chịu khó quan sát một chút, bạn đọc sẽ nhận ra được mánh khoé của cái mác mang tên miễn phí độc hại.

Cuối cùng thì cái "lợi ích" của "người dùng miễn phí" là một phần mềm chất lượng thấp, được khuyến mãi thêm "mã độc" và dữ liệu có nguy cơ bị rò rỉ bất kỳ lúc nào. Nhà phát triển không có thêm doanh thu để cải tiến chất lượng trong khi những kẻ tạo sân chơi cho phần mềm lậu thì lại được hưởng lợi cho những "tác phẩm độc hại" tạo ra.

Tham khảo:

hoặc
* Bản tin tổng hợp được gửi mỗi 1-2 tuần, huỷ bất cứ lúc nào.
Author

Xin chào, tôi tên là Hoài - một anh Dev kể chuyện bằng cách viết ✍️ và làm sản phẩm 🚀. Với nhiều năm kinh nghiệm lập trình, tôi đã đóng góp một phần công sức cho nhiều sản phẩm mang lại giá trị cho người dùng tại nơi đang làm việc, cũng như cho chính bản thân. Sở thích của tôi là đọc, viết, nghiên cứu... Tôi tạo ra trang Blog này với sứ mệnh mang đến những bài viết chất lượng cho độc giả của 2coffee.dev.Hãy theo dõi tôi qua các kênh LinkedIn, Facebook, Instagram, Telegram.

Bạn thấy bài viết này có ích?
Không

Bình luận (0)

Nội dung bình luận...