Xây dựng cơ sở dữ liệu khoa học xã hội: nền tảng số cho nghiên cứu và tư vấn chính sách trong kỷ nguyên phát triển mới
Anh-tin-bai

Hình minh họa

I. Bối cảnh và yêu cầu đặt ra đối với khoa học xã hội trong chuyển đổi số

Nghị quyết số 57-NQ/TW về đột phá phát triển khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia đã xác lập một định hướng mang tính nền tảng cho phát triển đất nước trong giai đoạn mới, trong đó nhấn mạnh yêu cầu “khai thác tối đa tiềm năng của dữ liệu, đưa dữ liệu thành tư liệu sản xuất chính, thúc đẩy phát triển nhanh cơ sở dữ liệu lớn, công nghiệp dữ liệu, kinh tế dữ liệu”. Định hướng này không chỉ dành cho khối kinh tế hay quản lý hành chính, mà có ý nghĩa đặc biệt quan trọng đối với khoa học xã hội - lĩnh vực trực tiếp nghiên cứu con người, xã hội, thể chế và các quá trình phát triển.

Trong bối cảnh đó, khoa học xã hội đang đứng trước yêu cầu chuyển đổi sâu sắc cả về cách tiếp cận, phương pháp nghiên cứu và hạ tầng dữ liệu. Các vấn đề xã hội ngày càng trở nên phức tạp, biến động nhanh và chịu tác động đan xen của nhiều yếu tố như chính sách, kinh tế, công nghệ, môi trường và hội nhập quốc tế. Trong bối cảnh đó, các phương thức nghiên cứu truyền thống, vốn dựa chủ yếu vào các đánh giá đơn lẻ, dữ liệu phân mảnh và quy mô nhỏ, ngày càng bộc lộ hạn chế trong việc cung cấp bằng chứng khoa học kịp thời, có hệ thống và đủ độ tin cậy phục vụ quá trình hoạch định và điều chỉnh chính sách.

Quá trình chuyển đổi số quốc gia đang tạo ra một khối lượng dữ liệu xã hội khổng lồ từ nhiều nguồn khác nhau, bao gồm dữ liệu hành chính, dữ liệu điều tra, dữ liệu số hóa từ các nền tảng dịch vụ công, dữ liệu lớn phát sinh từ tương tác xã hội và không gian số. Nếu được tổ chức, chuẩn hóa và khai thác một cách khoa học, các nguồn dữ liệu này có thể trở thành nền tảng quan trọng để đổi mới nghiên cứu khoa học xã hội, nâng cao chất lượng phân tích chính sách và tăng cường vai trò tư vấn của khoa học xã hội đối với Đảng và Nhà nước.

Thực tiễn cho thấy khoa học xã hội ở Việt Nam vẫn chưa có một cơ sở dữ liệu đủ mạnh, đủ mở và đủ tin cậy để đáp ứng yêu cầu đó. Dữ liệu nghiên cứu còn phân tán theo các đề tài, nhiệm vụ, chương trình; thiếu chuẩn chung; thiếu cơ chế chia sẻ, khai thác; đặc biệt thiếu các cuộc điều tra cơ bản quy mô lớn, được tiến hành lặp lại theo thời gian để tạo lập chuỗi dữ liệu dài hạn. Bên cạnh đó, không ít cán bộ nghiên cứu còn chưa am hiểu về khoa học dữ liệu, cả về lĩnh vực ưu tiên, phạm vi khảo sát, cũng như phương pháp vận hành điều tra ở tầm quốc gia. Trước yêu cầu của Nghị quyết 57-NQ/TW xác định dữ liệu là “tư liệu sản xuất chính”, việc xây dựng cơ sở dữ liệu xã hội và hệ sinh thái học thuật số cho khoa học xã hội không còn là lựa chọn mà đã trở thành yêu cầu chiến lược cấp thiết. Việc làm rõ vai trò của cơ sở dữ liệu khoa học xã hội trong tư vấn và hoạch định chính sách trở nên cấp bách, nhằm đảm bảo các quyết sách dựa trên bằng chứng, minh bạch và hiệu quả.

II. Vai trò của dữ liệu khoa học xã hội trong tư vấn và xây dựng chính sách

Cơ sở dữ liệu khoa học xã hội không chỉ là tập hợp các bộ số liệu phục vụ nghiên cứu, mà còn là nền tảng tri thức quan trọng phục vụ phát triển đất nước. Trong mô hình quản trị hiện đại, quản lý và điều hành chính sách công phải dựa trên bằng chứng, dữ liệu và phân tích khoa học, thay vì dựa vào kinh nghiệm hay nhận định cảm tính. Điều này đặc biệt đúng đối với các các lĩnh vực như kinh tế, lao động, việc làm, giáo dục, y tế, an sinh xã hội, môi trường và phát triển bền vững, nơi các quyết định chính sách có tác động trực tiếp, lâu dài đến xã hội.

Một hệ thống dữ liệu khoa học được thiết kế tốt cho phép theo dõi liên tục các xu hướng xã hội, nhận diện sớm các vấn đề nảy sinh và đánh giá tác động của chính sách một cách khách quan. Thông qua việc tích hợp dữ liệu điều tra cơ bản với dữ liệu hành chính, các cơ quan quản lý có thể trả lời những câu hỏi cốt lõi như chính sách đang tác động đến những nhóm xã hội nào, ở mức độ và theo chiều hướng ra sao; tác động đó có khác biệt giữa các vùng, các nhóm dân cư hay không; hiệu quả chính sách có bền vững theo thời gian hay không; và cần điều chỉnh chính sách theo hướng nào để bảo đảm mục tiêu phát triển nhanh và bền vững.

Trong khoa học xã hội, cơ sở dữ liệu là nền tảng cốt lõi của hệ sinh thái nghiên cứu, không chỉ phục vụ một đề tài đơn lẻ mà tạo lập nguồn dữ liệu dùng chung cho nhiều nghiên cứu. Nhờ khả năng so sánh theo thời gian, theo vùng và theo nhóm xã hội, cơ sở dữ liệu cho phép tích lũy, kiểm chứng và tái sử dụng kết quả nghiên cứu, góp phần nâng cao giá trị khoa học và tính ứng dụng chính sách. Trong bối cảnh nguồn lực nghiên cứu còn hạn chế, việc đầu tư xây dựng cơ sở dữ liệu khoa học xã hội giúp tối ưu hóa chi tiêu công, giảm trùng lặp trong hoạt động điều tra, khảo sát, đồng thời nâng cao chất lượng phân tích, dự báo và tư vấn chính sách dựa trên bằng chứng.

Quan trọng hơn, cơ sở dữ liệu khoa học xã hội còn là cầu nối giữa hoạt động nghiên cứu và quá trình xây dựng, triển khai, điều hành chính sách. Khi dữ liệu được chuẩn hóa, minh bạch và dễ tiếp cận, kết quả nghiên cứu không chỉ phản ánh thực trạng, mà còn có thể được kiểm chứng, khai thác và tích hợp trực tiếp vào các khâu hoạch định, triển khai, và đánh giá chính sách. Điều này góp phần nâng cao uy tín và vai trò của khoa học xã hội, tăng cường niềm tin của các nhà lãnh đạo, quản lý, đồng thời thúc đẩy hình thành mô hình hoạch định chính sách dựa trên bằng chứng khoa học.

III. Xây dựng cơ sở dữ liệu khoa học xã hội: Nền tảng của hệ sinh thái số

Xây dựng kế cơ sở dữ liệu khoa học xã hội cần được coi là nhiệm vụ chiến lược, mang tính nền tảng và dài hạn, không thể tiếp cận theo các đề tài hay nhiệm vụ khoa học đơn lẻ. Quá trình này phải đặt trọng tâm vào phát triển các bộ dữ liệu cốt lõi, có khả năng phản ánh toàn diện cấu trúc và động thái của xã hội, đồng thời bảo đảm tính liên thông, chuẩn hóa và khả năng mở rộng trong tương lai. Khi được thiết kế bài bản, cơ sở dữ liệu xã hội sẽ trở thành trụ cột của hệ sinh thái số, vừa tạo nền tảng cho nghiên cứu khoa học xã hội tích lũy, vừa phục vụ kịp thời cho tư vấn và hoạch định chính sách.

Một yêu cầu then chốt là phải đặt điều tra cơ bản vào vị trí trung tâm của chiến lược xây dựng cơ sở dữ liệu khoa học xã hội. Điều tra cơ bản không chỉ nhằm thu thập thông tin tại một thời điểm, mà được thiết kế để lặp lại theo chu kỳ, sử dụng bộ công cụ ổn định, cho phép tạo ra chuỗi dữ liệu dài hạn về các hiện tượng xã hội. Điều tra cơ bản là nền tảng dữ liệu chiến lược trong khoa học xã hội, phục vụ hoạch định, triển khai, điều hành và đánh giá chính sách đa ngành. Các khảo sát này thu thập thông tin trực tiếp từ hộ gia đình, cá nhân và các đơn vị, tổ chức về mức sống, thu nhập, việc làm, giáo dục, y tế và các vấn đề xã hội. Không chỉ tập trung vào các vấn đề xã hội, nội dung khảo sát còn bao phủ nhiều lĩnh vực khác. Dữ liệu thu thập từ khảo sát kinh tế giúp theo dõi việc làm, thu nhập, phân bổ nguồn lực và năng suất lao động. Khảo sát văn hóa, dân tộc, tôn giáo cung cấp dữ liệu về nhận thức, nắm bắt giá trị, niềm tin, hành vi tạo cơ sở xây dựng các chương trình giáo dục, bảo tồn di sản và phát triển văn hóa phù hợp, tạo cơ sở cho chính sách phát triển công bằng và đa dạng. Khảo sát môi trường và phát triển bền vững theo dõi chất lượng không khí, nước, đất, sử dụng tài nguyên và tác động biến đổi khí hậu, từ đó hỗ trợ chính sách quản lý và thích ứng bền vững.

Đặc điểm nổi bật của các khảo sát này là tính hệ thống, chuẩn hóa và khả năng đại diện, đảm bảo phản ánh trung thực thực trạng ở nhiều cấp độ. Khi kết hợp với nghiên cứu định tính, dữ liệu điều tra cơ bản giúp giải thích cơ chế, động lực và bối cảnh xã hội, kinh tế, văn hóa, môi trường, từ đó nâng cao năng lực dự báo, thiết kế và đánh giá chính sách dựa trên bằng chứng, góp phần phát triển các chương trình, chính sách hiệu quả và bền vững.

Bên cạnh khảo sát và điều tra cơ bản, xây dựng cơ sở dữ liệu khoa học xã hội cần chú trọng tích hợp nhiều nguồn dữ liệu khác, bao gồm dữ liệu hành chính, dữ liệu thống kê chính thức và dữ liệu số phát sinh từ các hệ thống thông tin. Việc tích hợp này không chỉ mở rộng độ bao phủ và chi tiết của dữ liệu, mà còn tạo điều kiện phân tích liên ngành, phục vụ hiệu quả hơn cho việc hoạch định, triển khai và đánh giá chính sách. Để đảm bảo tính chính xác và khả năng so sánh, cần xác định các chuẩn chung về khái niệm, biến số, đơn vị phân tích và mã hóa dữ liệu, đồng thời thiết lập cơ chế phối hợp chặt chẽ giữa các cơ quan thống kê, các bộ, ngành quản lý dữ liệu hành chính. Sự phối hợp này giúp đảm bảo dữ liệu khoa học xã hội chuẩn hóa, minh bạch và có khả năng đại diện, đồng thời nâng cao khả năng chia sẻ, truy cập và sử dụng dữ liệu cho các mục tiêu chính sách.

Một nguyên tắc quan trọng khác là cơ sở dữ liệu khoa học xã hội phải được thiết kế theo hướng mở và dùng chung, trong khuôn khổ quy định cho phép. Dữ liệu được thu thập bằng ngân sách nhà nước cần được coi là tài sản công, được quản lý tập trung, bảo đảm an toàn, bảo mật, nhưng đồng thời tạo điều kiện cho các nhà khoa học, cơ quan nghiên cứu và tư vấn chính sách tiếp cận, khai thác phục vụ lợi ích chung. Cách tiếp cận này phù hợp với tinh thần Nghị quyết 57-NQ/TW về phát triển công nghiệp dữ liệu và kinh tế dữ liệu, trong đó dữ liệu không chỉ được coi là nguồn lực chiến lược, mà còn là tư liệu sản xuất quan trọng, cần được tổ chức, khai thác và sử dụng hiệu quả nhằm phục vụ phát triển kinh tế - xã hội và nâng cao chất lượng xây dựng chính sách.

Khi cơ sở dữ liệu được xây dựng bài bản, các phương pháp phân tích định lượng, phân tích dữ liệu lớn, mô phỏng xã hội với sự hỗ trợ  của trí tuệ nhân tạo mới có điều kiện được áp dụng linh hoạt, qua đó nâng cao năng lực phân tích và dự báo. Ngược lại, nếu thiếu một nền tảng dữ liệu vững chắc, việc áp dụng các phương pháp hiện đại khó tạo ra giá trị thực tiễn. Hạ tầng dữ liệu xã hội vì vậy giữ vai trò quyết định trong việc tạo ra bước chuyển mình căn bản của nghiên cứu khoa học xã hội, từ mô hình thu thập dữ liệu rời rạc theo đề tài sang mô hình nghiên cứu tích lũy, trong đó mỗi công trình vừa đóng góp cho cơ sở dữ liệu chung, vừa khai thác giá trị gia tăng từ nền tảng đó.

Đối với tư vấn chính sách, cơ sở dữ liệu cho phép đánh giá chính sách không chỉ ở giai đoạn kết thúc, mà xuyên suốt vòng đời, từ thiết kế, triển khai đến điều chỉnh chính sách. Các dữ liệu điều tra cơ bản kết hợp với dữ liệu hành chính giúp theo dõi tác động chính sách theo nhóm dân cư, theo vùng và theo thời gian, qua đó cung cấp bằng chứng kịp thời cho việc điều chỉnh chính sách, phù hợp với thực tiễn. Đây là điều kiện then chốt nhằm nâng cao chất lượng quản trị quốc gia, tăng cường khả năng thích ứng của chính sách và bảo đảm phát triển kinh tế - xã hội ổn định, hiệu quả trước những biến động nhanh và phức tạp.

IV. Thuận lợi, thách thức và điều kiện hình thành cơ sở dữ liệu khoa học xã hội trong kỷ nguyên mới

Hiện nay, việc xây dựng cơ sở dữ liệu khoa học xã hội đang hội tụ nhiều điều kiện thuận lợi. Chủ trương đẩy mạnh chuyển đổi số đã được xác lập rõ ràng trong các văn kiện của Đảng và Nhà nước, qua đó tạo nền tảng chính trị - pháp lý quyết định cho việc nhìn nhận dữ liệu như một nguồn lực chiến lược của phát triển. Trong bối cảnh đó, dữ liệu khoa học xã hội ngày càng được đặt vào vị trí trung tâm của hoạt động nghiên cứu, tư vấn và hoạch định chính sách, thay vì chỉ được coi là sản phẩm trung gian của các đề tài, nhiệm vụ nghiên cứu. Một hệ thống dữ liệu liên thông, góp phần chuẩn hóa và tích lũy tri thức khoa học xã hội, sẽ là tiền đề để áp dụng các phương pháp phân tích định lượng, mô phỏng xã hội và trí tuệ nhân tạo, nâng cao năng lực dự báo và tư vấn chính sách trong bối cảnh chuyển đổi số quốc gia.

Bên cạnh đó, sự hình thành của một lực lượng nghiên cứu trẻ, được đào tạo trong môi trường số, có khả năng tiếp cận và sử dụng các công cụ phân tích dữ liệu trên nền tảng công nghệ mới, đang tạo ra lợi thế quan trọng cho quá trình xây dựng cơ sở dữ liệu khoa học xã hội. So với các thế hệ trước, nguồn nhân lực khoa học xã hội này có mức độ sẵn sàng cao hơn trong việc sử dụng dữ liệu, và tham gia vào các hệ sinh thái nghiên cứu mở. Nếu được định hướng và hỗ trợ phù hợp, đây sẽ là lực lượng nòng cốt góp phần nâng cao năng lực phân tích, dự báo và tư vấn chính sách trong tiến trình chuyển đổi số quốc gia.

Tuy nhiên, quá trình xây dựng cơ sở dữ liệu khoa học xã hội đang đối mặt với nhiều khó khăn, thách thức. Hoạt động nghiên cứu hiện nay chủ yếu vận hành theo mô hình đơn lẻ, gắn với từng đề tài, nhiệm vụ, chưa hình thành được cơ chế chia sẻ, tích lũy và tái sử dụng dữ liệu một cách hệ thống. Dữ liệu thường được coi là công cụ phục vụ nghiên cứu trước mắt, chưa được nhìn nhận như một sản phẩm khoa học có giá trị độc lập, cần được đầu tư, chuẩn hóa, lưu trữ và sử dụng lâu dài. Bên cạnh đó, hạn chế về năng lực dữ liệu của đội ngũ nghiên cứu, cùng với sự thiếu hụt chuyên gia khoa học và quản trị dữ liệu cho khoa học xã hội, đang trực tiếp ảnh hưởng đến chất lượng nghiên cứu và tư vấn chính sách.

Những thách thức trên bắt nguồn từ các nguyên nhân mang tính cấu trúc. Di sản của mô hình quản lý theo ngành dọc trong thời gian dài đã dẫn đến tư duy cục bộ trong quản lý dữ liệu, coi dữ liệu là tài sản riêng của từng bộ, ngành, trường đại học, viện nghiên cứu. Mô hình nghiên cứu hàn lâm truyền thống, tương đối tách rời khỏi thực tiễn xã hội và yêu cầu chính sách, cũng làm suy giảm động lực đầu tư dài hạn cho hạ tầng dữ liệu. Đồng thời, việc thu thập dữ liệu chưa được gắn chặt với cơ chế đánh giá, ghi nhận và xếp hạng hoạt động khoa học, khiến cho các nhà nghiên cứu và tổ chức khoa học chưa coi dữ liệu là một cấu phần cốt lõi quyết định năng lực nghiên cứu.

Trong bối cảnh đó, việc xây dựng cơ sở dữ liệu khoa học xã hội ở Việt Nam chỉ có thể triển khai hiệu quả khi hội tụ đầy đủ một số điều kiện mang tính quyết định sau đây:

Trước hết, cần thiết kế và xây dựng cơ sở dữ liệu khoa học xã hội ở tầm quốc gia, theo hướng tích hợp, liên thông, đồng bộ và định hướng dài hạn, trong đó các cuộc điều tra cơ bản đóng vai trò trụ cột. Đây là những khảo sát quy mô lớn, thu thập thông tin trực tiếp từ hộ gia đình, cá nhân, tổ chức, phản ánh đầy đủ các lĩnh vực khoa học xã hội. Việc triển khai các cuộc điều tra này cần được thực hiện theo chu kỳ lặp lại, sử dụng bộ công cụ chuẩn hóa và ổn định, nhằm tạo ra các chuỗi dữ liệu dài hạn, có khả năng so sánh theo thời gian và các địa phương.

Hình thành chương trình quốc gia về cơ sở dữ liệu khoa học xã hội, xác định rõ các bộ dữ liệu cốt lõi cần ưu tiên đầu tư, gắn nguồn lực với các lĩnh vực chính sách trọng yếu. Bên cạnh đó, cần thiết lập cơ chế điều phối liên ngành trong thu thập, quản lý và chia sẻ dữ liệu khoa học xã hội, bảo đảm chuẩn hóa, liên thông và khai thác hiệu quả các cơ sở dữ liệu hành chính phục vụ nghiên cứu và tư vấn chính sách.

Song song với đầu tư xây dựng cơ sở dữ liệu, cần ưu tiên đào tạo và phát triển nguồn nhân lực khoa học xã hội số một cách có hệ thống, bao gồm cả đội ngũ nghiên cứu và các vị trí chuyên trách về quản trị, tích hợp và phân tích dữ liệu. Đây là điều kiện tiên quyết để bảo đảm dữ liệu được thu thập đúng, đủ, sạch, được quản lý an toàn và khai thác hiệu quả. Đồng thời, cần tăng cường đầu tư phát triển hạ tầng dữ liệu và năng lực phân tích cho các cơ quan nghiên cứu khoa học xã hội, coi đây là khâu then chốt để nâng cao chất lượng nghiên cứu, năng lực dự báo và tư vấn chính sách dựa trên bằng chứng, đáp ứng yêu cầu quản trị quốc gia trong bối cảnh chuyển đổi số.

Về tầm nhìn chiến lược, cần gắn kết chặt chẽ nghiên cứu, dữ liệu và chính sách trong một chu trình thống nhất, coi đây là định hướng xuyên suốt trong phát triển khoa học xã hội giai đoạn tới. Dữ liệu khoa học xã hội phải được tổ chức như một nguồn lực chiến lược, không chỉ để lưu trữ mà để khai thác có hệ thống trong toàn bộ quá trình xây dựng, triển khai, và điều chỉnh chính sách. Trên nền tảng đó, từng bước hình thành hệ sinh thái số cho khoa học xã hội, trong đó dữ liệu được coi là tài sản chung của quốc gia, phục vụ đồng thời cho nghiên cứu, đào tạo và tư vấn chính sách trong kỷ nguyên phát triển mới./.

GS.TS. Đặng Nguyễn Anh, Viện Hàn lâm Khoa học xã hội Việt Nam
Thống kê truy cập
  • Đang online: 1
  • Hôm nay: 1
  • Trong tuần: 1
  • Tất cả: 1