Mọi thứ đều "miễn phí" - Kỳ II - Miếng bánh mang tên dữ liệu

Mọi thứ đều "miễn phí" - Kỳ II - Miếng bánh mang tên dữ liệu

Những mẩu tin ngắn hàng ngày dành cho bạn
  • countless.dev là một trang web khá thú vị khi mà nó so sánh giá tiền sử dụng các mô hình LLMs của các nhà cung cấp khác nhau.

    Tại đây bạn có thể nhìn thấy tất cả các mô hình ngôn ngữ lớn phổ biến bởi các nhà cung cấp như OpenAI, Azure, Mistral... Bảng giá cho mỗi 1M tokens đầu vào/ra. Hoặc thậm chí có thể so sánh chúng với nhau để tìm ra nhà cung cấp hoặc mô hình rẻ nhất tuỳ theo mục đích sử dụng.

    » Xem thêm
  • 1,2 năm trước, Kubernetes (k8s) tự nhiên được nhắc đến như một hiện tượng, chắc vì nó bá quá nên ai cũng muốn học và sử dụng. Nó là một công cụ "Automating deployment, scaling, and management of containerized applications" - Vâng! nghe hay ho đấy chứ 🤤.

    Hồi đó thì mình đang đam mê với Docker, đặc biệt là Docker Swarm, cũng tương tự như k8s ý nhưng ở quy mô nhỏ hơn. Docker Swarm thì có vẻ ít phức tạp hơn nhiều so với k8s. Mà như thế cũng tốt vì nó đã và đang đáp ứng rất tốt nhu cầu sử dụng của mình lúc đó, lại còn bớt đi phần phức tạp, lằng nhằng.

    Ấy thế mà 1-2 tháng trở lại đây, các bài viết có tiêu đề "bạn có thực sự cần đến Kubernetes" lại đang nổi lên với tần suất dày hơn. Quả thật k8s rất mạnh nhưng cũng quá phức tạp. Tại sao phải cố dùng dao "mổ trâu để giết gà" cơ chứ? Trừ khi bạn lường trước được độ phức tạp khi muốn áp dụng một công nghệ. Một cái nữa k8s tiêu tốn tài nguyên và nguồn lực ghê ghớm, để vận hành được nó không đơn giản là dựng lên được là xong mà còn phải có rất nhiều nhiều kiến thức nữa 😨.

    À, chắc cũng một phần nữa là do các "ông lớn" đang tập trung đẩy mạnh vào Serverless, giảm bớt sự phức tạp trong khâu vận hành đi, thay vào đó là nên tập trung vào phát triển ứng dụng.

    Bên cạnh đó, thì cái tên WASM cũng đang được nhắc đến rất là nhiều 🤔

    Do you really need Kubernetes in your company/startup? | dev.to

    Do You Really Need Kubernetes?

    » Xem thêm
  • Trước mình cứ khen lấy khen để Serverless, rằng tối ưu chi phí xuống 0đ để duy trì blog các thứ. Đúng là như vậy thật! Nhưng bên cạnh đó serverless cũng có các mặt tối đáng để lưu tâm đấy!

    Hôm kia mình phải mất ngày trời để truy tìm và khắc phục sự cố chỉ vì gọi hàm build-in của Cloudflare KV. Cụ thể là hàm list với limit 1000 - tức là một lần gọi nó trả về 1000 keys của KV. Cơ mà đời không như là mơ. Con số 1000 chỉ là trên lý thuyết. Lúc thì trả về vài trăm, lúc thì vài chục, thậm chí lúc thì lẹt đẹt có vài cái. Thế là làm tắc nghẽn cả hệ thống. À mà cũng không phải là nghẽn mà là hệ thống "nhàn rỗi" quá không có việc gì để làm, trong khi thực tế đáng ra nó phải xử lý cả trăm ngàn cái keys cơ 🥲

    » Xem thêm

Vấn đề

Mọi thứ đều miễn phí thì người dùng là "món hàng" - câu nói này chắc hẳn nhiều người đã nghe ở đâu đó. Hầu hết mọi người sẵn sàng làm ra các sản phẩm miễn phí để thu hút người dùng rồi sau đó tìm cách kiếm tiền trên tập người dùng này. Cách này rất phổ biến trong hiện tại bởi dễ tiếp cận và thu hút người dùng. Trong khi họ không cần trả tiền để sử dụng nhưng dữ liệu mà họ cung cấp lại là tiền đề cho các hoạt động kiếm tiền khác, ví dụ như quảng cáo.

Hãy tìm hiểu hai ví dụ lớn nhất trong ngành quảng cáo dựa trên dữ liệu người dùng là Facebook và Google.

Facebook cung cấp dịch vụ mạng xã hội miễn phí cho hàng tỷ người dùng trên toàn thế giới. Công ty kiếm tiền chủ yếu từ việc bán quảng cáo, và nguồn thu lớn nhất của Facebook đến từ việc thu thập dữ liệu người dùng, phân tích hành vi và sở thích của họ để phục vụ cho mục đích quảng cáo.

Facebook sử dụng rất nhiều thông tin cá nhân mà người dùng chia sẻ để tạo ra các hồ sơ chi tiết. Những hồ sơ này được phân tích để hiển thị quảng cáo đã được cá nhân hóa, nhằm tăng khả năng nhấp chuột và mua hàng. Tưởng tượng như bạn đang quan tâm đến một mặt hàng, nhưng không hề nói với Facebook biết, chỉ một phút sau, trang mạng xã hội bỗng ngập tràn quảng cáo về sản phẩm đó.

Tương tự, Google cung cấp một loạt dịch vụ miễn phí như công cụ tìm kiếm, Gmail, Google Maps, YouTube... Nguồn thu chính của Google cũng đến từ quảng cáo trực tuyến thông qua nền tảng Google Ads. Trong báo cáo quý I năm 2024, Alphabet (công ty mẹ của Google) ghi nhận 80,5 tỷ USD doanh thu trong đó tổng doanh thu quảng cáo là 61,66 tỷ USD, đủ để thấy hoạt động quảng cáo của họ mạnh đến mức nào.

Cũng như Facebook, Google thu thập dữ liệu từ các truy vấn tìm kiếm, email, lịch sử duyệt web, vị trí địa lý, và các tương tác của người dùng. Dữ liệu này được sử dụng để xây dựng hồ sơ người dùng và hiển thị quảng cáo được tùy chỉnh theo sở thích và hành vi của từng cá nhân. Ngoài ra hệ sinh thái của Google rất mạnh khi họ có thể thu thập hành vi người dùng qua nhiều kênh khác nhau.

Nhưng thế thì có ảnh hưởng gì đến những người dùng miễn phí?

Ảnh hưởng từ phần mềm miễn phí

Vào năm 2018, khi có thông tin rằng công ty tư vấn chính trị Cambridge Analytica đã thu thập và sử dụng trái phép dữ liệu cá nhân của hàng chục triệu người dùng Facebook mà không có sự đồng ý của họ. Cambridge Analytica thu thập dữ liệu của khoảng 87 triệu người dùng mà không được sự đồng ý.

Cambridge Analytica đã sử dụng dữ liệu thu thập được để phát triển các chiến lược quảng cáo chính trị nhắm mục tiêu chính xác đến từng cá nhân. Công ty này đã dùng dữ liệu đó để nhắm quảng cáo vào đích danh người dùng nhằm thao túng các hoạt động chính trị.

Hậu quả CEO của Facebook, Mark Zuckerberg, đã phải ra điều trần và thừa nhận những sai lầm trong việc quản lý dữ liệu người dùng. Cambridge Analytica bị giải thể. Các quốc gia và tổ chức trên toàn thế giới cũng đã bắt đầu triển khai các biện pháp bảo vệ dữ liệu chặt chẽ hơn, chẳng hạn như Quy định Bảo vệ Dữ liệu Chung (GDPR) của Liên minh Châu Âu.

Tương tự, vụ vi phạm dữ liệu của Google năm 2018 là một vụ bê bối lớn về quyền riêng tư dữ liệu. Trong đó API Google+ đã tiết lộ dữ liệu riêng tư của hơn năm trăm nghìn người dùng. Chrome - một trình duyệt web miễn phí được nhiều người dùng nhất cũng nhiều lần bị cáo buộc thu thập thông tin người dùng một cách âm thầm và lặng lẽ.

Tóm lại, chính họ đang dùng dữ liệu của người dùng miễn phí để kiếm tiền dựa trên hoạt động quảng cáo nhắm đến người dùng cuối. Ngoài ra, dữ liệu của người dùng còn gián tiếp cho các hành động thao túng hoặc nguy cơ rò rỉ bất kỳ lúc nào.

Trong khi hành vi quảng cáo dựa trên dữ liệu người dùng là hợp pháp. Có chăng những bê bối đều xoay xung quanh dữ liệu bị rò rỉ, từ đó bị lợi dụng vào mục đích xấu. Thì game, phần mềm hoặc thậm chí là đọc miễn phí lại ở phía ngược lại của cán cân công lý.

Ảnh hưởng từ phần mềm lậu

Phần mềm lậu cũng được kiếm tiền thông qua hình thức hiển thị quảng cáo. Các trang web tổng hợp phần mềm lậu tại một nơi và gắn quảng cáo ngập tràn trang web của họ. Ngược lại với quảng cáo chính thống, các quảng cáo này có phần cực đoan và dấu hiệu vi phạm pháp luật khi chứa những nội dung không lành mạnh. Chưa kể các quảng cáo độc hại và gây nhầm lẫn, thay vì tải về được phần mềm thì lại vô tình tải xuống một loạt mã độc khác.

Ngoài ra các phần mềm lậu thường được lưu trữ ở một số trang chia sẻ kém chất lượng, yêu cầu người dùng nạp tiền để tải nếu không phải tải xuống với một tốc độ cực kỳ chậm. Mục đích của cách làm này cũng là hiển thị quảng cáo, đồng thời chia hoa hồng nếu người dùng "chịu chi" cho lần tải xuống đó.

Nếu phần mềm lậu càng dễ tải xuống thì càng nguy hiểm khi nó có thể chứa mã độc. Các mã độc này rất đa dạng và phục vụ cho nhiều mục đích khác nhau. Cái thì spam quảng cáo, cái thì ghi lại hành trình phím (Keylogger), cái thì ăn cắp Cookie để xâm phạm trái phép tài khoản người dùng, cái thì ăn trộm luôn dữ liệu người dùng hoặc biến máy tính thành một phần tử trong mạng botnet dùng cho những đợt tấn công quy mô lớn. Nhìn chung, một khi máy đã nhiễm mã độc, hậu quả rất ghê ghớm cho cá nhân và cả người khác.

Nhưng chưa hết, sử dụng phần mềm lậu vừa tiếp tay cho kẻ xấu và vừa giết chết cả doanh nghiệp vừa và nhỏ khác. Mỗi lần ai đó sử dụng phần mềm lậu hoặc vi phạm bản quyền, điều đó tạo ra một tiền lệ và khuyến khích những người khác làm theo. Điều này làm suy yếu nền kinh tế sáng tạo, làm giảm động lực của các nhà phát triển, nghệ sĩ, và các nhà sáng tạo nội dung tiếp tục sản xuất những sản phẩm chất lượng. Khi bạn sử dụng phần mềm lậu, bạn không đóng góp vào việc phát triển, cải thiện, và bảo mật của phần mềm đó. Các nhà phát triển không nhận được nguồn tài chính cần thiết để tiếp tục duy trì và nâng cấp sản phẩm, dẫn đến sự suy giảm chất lượng và tính năng.

Như vậy, một lần nữa dữ liệu người dùng lại là miếng bánh ngon. Nhưng không phải dành cho những người nông dân cần cù mà lại rơi vào tay những tên địa chủ nứt đố đổ vách. Tôi tin rằng chỉ cần chịu khó quan sát một chút, bạn đọc sẽ nhận ra được mánh khoé của cái mác mang tên miễn phí độc hại.

Cuối cùng thì cái "lợi ích" của "người dùng miễn phí" là một phần mềm chất lượng thấp, được khuyến mãi thêm "mã độc" và dữ liệu có nguy cơ bị rò rỉ bất kỳ lúc nào. Nhà phát triển không có thêm doanh thu để cải tiến chất lượng trong khi những kẻ tạo sân chơi cho phần mềm lậu thì lại được hưởng lợi cho những "tác phẩm độc hại" tạo ra.

Tham khảo:

Cao cấp
Hello

Tôi & khao khát "chơi chữ"

Bạn đã thử viết? Và rồi thất bại hoặc chưa ưng ý? Tại 2coffee.dev chúng tôi đã có quãng thời gian chật vật với công việc viết. Đừng nản chí, vì giờ đây chúng tôi đã có cách giúp bạn. Hãy bấm vào để trở thành hội viên ngay!

Bạn đã thử viết? Và rồi thất bại hoặc chưa ưng ý? Tại 2coffee.dev chúng tôi đã có quãng thời gian chật vật với công việc viết. Đừng nản chí, vì giờ đây chúng tôi đã có cách giúp bạn. Hãy bấm vào để trở thành hội viên ngay!

Xem tất cả

Đăng ký nhận thông báo bài viết mới

hoặc
* Bản tin tổng hợp được gửi mỗi 1-2 tuần, huỷ bất cứ lúc nào.
Author

Xin chào, tôi tên là Hoài - một anh Dev kể chuyện bằng cách viết ✍️ và làm sản phẩm 🚀. Với nhiều năm kinh nghiệm lập trình, tôi đã đóng góp một phần công sức cho nhiều sản phẩm mang lại giá trị cho người dùng tại nơi đang làm việc, cũng như cho chính bản thân. Sở thích của tôi là đọc, viết, nghiên cứu... Tôi tạo ra trang Blog này với sứ mệnh mang đến những bài viết chất lượng cho độc giả của 2coffee.dev.Hãy theo dõi tôi qua các kênh LinkedIn, Facebook, Instagram, Telegram.

Bạn thấy bài viết này có ích?
Không

Bình luận (0)

Nội dung bình luận...