Nếu bạn đã từng đọc được một bài viết nào đó trên Google hay xem một video rất hay trên Youtube nhưng giờ tìm lại hoàn toàn không thấy thì bạn đã trải nghiệm cảm giác: Mọi thứ trên Internet không tồn tại lâu dài như chúng ta đang nghĩ.
Nguyên nhân thì có rất nhiều:
1/ Thuật toán tìm kiếm của Google hay Youtube sẽ ưu tiên các bài mới, nhiều người xem và chia sẻ, còn nếu bài viết hay video nào dù rất hay nhưng đã cũ, ít người biết đến (có thể hay với bạn nhưng với cộng đồng thì chưa chắc họ cảm nhận được thông điệp từ bài viết đó nên thông tin không phổ biến). Do vậy khi bạn dùng keyword để tìm kiếm sẽ rất khó để lục, lọc lại trong vô vàn thông tin tương tự nhau theo kết quả trả về.
2/ Bài viết mà bạn đã xem có thể bị Google hoặc Youtube hay các nền tảng mạng xã hội kiểm duyệt và xóa mất tích vì nhiều lý do như vi phạm bản quyền (ta chưa xét đến luật bản quyền có hợp tình hợp lý hay chưa, vì đó là chủ đề hoàn toàn khác) hoặc vi phạm tiêu chuẩn cộng đồng hay đủ lý do mà nền tảng lưu trữ dữ liệu đó buộc phải xóa luôn dữ liệu này, khiến cho bạn (người xem) không thể tìm được thông tin mong muốn.
3/ Bài viết đó bị chính người upload lên xóa bỏ vì nhiều lý do cá nhân khác nhau. Hay các nguyên nhân khác khiến cho việc tìm kiếm dữ liệu cũ là hoàn toàn không khả thi trong thời đại ngày nay.
Như vậy khi việc lưu trữ dữ liệu và chia sẻ công khai không ổn định vì nhiều lý do từ kỹ thuật cho đến chính sách vận hành của nền tảng, thì việc người dùng ở góc độ cá nhân (individual level) như bạn có thể nghĩ đến các phương án sau để tìm kiếm được thông tin bạn quan tâm.
1/ Bạn tìm hiểu Usenet hoặc các mạng darknet, deepnet, ... để tra cứu tìm hiểu thông tin liên quan. Và đi kèm theo đó là một loạt các vấn đề kỹ thuật về ẩn danh và yêu cầu bạn có một nền tảng vi tính nhất định để bảo mật khi lướt web ở các mạng chìm này. Mình không đi sâu vào chủ đề này, bạn có thể tìm hiểu thông qua tài liệu liên quan nhé.
2/ Bạn sẽ tự thiết lập kho tài liệu cá nhân ngay trên ổ cứng máy tính của mình hoặc trên Google Drive hay Telegram (vốn cho upload không giới hạn dung lượng) và chia sẻ nội bộ với nhau.
Như vậy, trong trường hợp bạn chọn cách lưu trữ dữ liệu trên Google Drive cá nhân và muốn cho việc "tìm kiếm và chia sẻ" trở nên thuận tiện hơn cho chính bạn (index theo keyword trong nội dung của file) và tạo ra cộng đồng nhỏ của những người thân quen cùng chia sẻ dữ liệu đó, thì bạn có thể tìm hiểu mô hình "Thư viện cá nhân sử dụng phần mềm Recoll" mà mình đang cung cấp. Đây là giải pháp giúp bạn xây dựng kho dữ liệu riêng biệt, vừa đủ đơn giản để bạn kiểm soát mọi thứ, vừa đủ mạnh mẽ để tìm kiếm nhanh thông tin bạn cần và bảo mật theo mức độ bạn quan tâm.
Mến chào bạn, trong một thế giới ngày càng đồng bộ hóa, khi ai có câu hỏi nào mà hỏi ChatGPT cũng sẽ ra được câu trả lời na ná nhau, khi bạn search Google ngày càng có ít bài viết sắc sảo do con người thật viết ra từ tâm huyết, trí tuệ của họ, thì thời điểm đó bạn hình dung là thế giới đang trở nên kém đa dạng hơn bao giờ hết, chúng ta cần thiết lập các kho tư liệu cá nhân, trước hết, chỉ để cho chính mình lưu trữ và chia sẻ với cộng đồng của mình những bài viết thực sự có ý nghĩa, giúp duy trì dấu ấn cá nhân sống động trong một kỷ nguyên ngày càng ảo hóa.
Xin dành những điều tốt đẹp nhất cho thế hệ tiếp theo,
All the best for the next generation,
Duc Nguyen,
Founder of tuhocr.com and thuviencanhan.com
Cơ duyên mình quan tâm đến món thiết lập thư viện cá nhân này cũng là từ chuyện mình làm nghiên cứu, việc quá mất time cho chuyện tìm kiếm tài liệu, download sách, báo, trích dẫn đã làm cho mình phát hiện ra "phần lớn thời gian của mình" chỉ dành cho việc tìm ra đúng tài liệu mình quan tâm. OK, mình làm giải pháp này trước hết cho công việc nghiên cứu về các model thống kê trong R để phục vụ việc training học viên ngày càng tốt hơn, mình cũng chia sẻ giải pháp với các bạn làm nghiên cứu hay training muốn setup thư viện tài liệu để giúp tiết kiệm thời gian cho mọi người.
Note: thực tế có rất nhiều giải pháp và cách tiếp cận cho việc setup một kho tư liệu cloud như mình đang trình bày, tuy nhiên mình trải nghiệm cũng khá nhiều, và thấy khi Google Drive (lưu data) + Recoll (index theo keyword) thì sẽ cho ra giải pháp tiện lợi, khả thi cho đa số anh em làm nghiên cứu.
Câu chuyện thư viện này còn dài tập, bạn có thể tìm hiểu về chủ đề "Information should flow freely", tạm dịch: thông tin phải được tự do dịch chuyển, thì bạn xem bài viết này nhé. https://www.memoryoftheworld.org/blog/2019/10/25/free-libraries-for-every-soul/