Cơ hội tỷ USD từ dữ liệu phi truyền thống trong kỷ nguyên AI
Từng bị xem là những mảnh thông tin rời rạc, khó khai thác và ít giá trị, dữ liệu từ mạng xã hội, vệ tinh, giao dịch thanh toán hay tín hiệu định vị đang nhanh chóng trở thành một trong những tài sản được săn đón nhất trong nền kinh tế số.
Theo TS. Hồ Quốc Tuấn, Giảng viên cao cấp Đại học Bristol (Anh), thị trường dữ liệu phi truyền thống (alternative data) hiện có quy mô khoảng 10 tỷ USD và được dự báo có thể tăng lên hàng chục tỷ USD, thậm chí vượt mốc 100 tỷ USD vào năm 2030. Đây được xem là một trong những lĩnh vực tăng trưởng nhanh nhất của ngành dữ liệu toàn cầu.
TỪ DỮ LIỆU "BÊN LỀ" THÀNH TÀI SẢN CHIẾN LƯỢC
Trong nhiều năm, các tổ chức tài chính, doanh nghiệp và cơ quan quản lý chủ yếu dựa vào các nguồn dữ liệu truyền thống như GDP, lạm phát, doanh thu doanh nghiệp, giá cổ phiếu hay các báo cáo thống kê chính thức để đưa ra quyết định.
Dữ liệu phi truyền thống là tất cả những dữ liệu mới không nằm trong các nguồn cung cấp truyền thống nhưng có thể được sử dụng để phân tích tài chính, kinh tế hoặc nhiều mục đích khác
Tuy nhiên, sự phát triển của công nghệ số đã tạo ra một lượng dữ liệu khổng lồ nằm ngoài các hệ thống thống kê truyền thống. Đó có thể là các bài đăng trên mạng xã hội, dữ liệu giao dịch ngân hàng, dữ liệu vị trí từ điện thoại di động, hình ảnh vệ tinh, lưu lượng tàu biển hay thậm chí là các dữ liệu được thu thập từ hoạt động tìm kiếm trên Internet.
Những nguồn dữ liệu này được gọi là dữ liệu phi truyền thống.
Nếu như trước đây các dữ liệu này bị bỏ qua do khối lượng quá lớn và thiếu công cụ xử lý phù hợp, thì AI đang thay đổi hoàn toàn cuộc chơi.
"Dữ liệu phi truyền thống là tất cả những dữ liệu mới không nằm trong các nguồn cung cấp truyền thống nhưng có thể được sử dụng để phân tích tài chính, kinh tế hoặc nhiều mục đích khác", TS. Hồ Quốc Tuấn nhận định.
AI BIẾN DỮ LIỆU PHI CẤU TRÚC THÀNH GIÁ TRỊ KINH TẾ
Điểm khác biệt lớn nhất của dữ liệu phi truyền thống nằm ở việc phần lớn chúng tồn tại dưới dạng phi cấu trúc.
Đó có thể là văn bản trên mạng xã hội, hình ảnh vệ tinh, video, âm thanh hoặc các tín hiệu số phát sinh từ hoạt động thường nhật của con người. Khác với dữ liệu bảng biểu truyền thống, những dữ liệu này rất khó khai thác bằng các công cụ phân tích thông thường.
Sự xuất hiện của AI, đặc biệt là các mô hình học máy và mô hình ngôn ngữ lớn, đã tạo ra bước ngoặt quan trọng.
Theo TS. Hồ Quốc Tuấn, AI hiện nay có thể tự động thu thập, xử lý và phân tích lượng dữ liệu khổng lồ từ nhiều nguồn khác nhau để rút ra các tín hiệu kinh tế có giá trị.
Ví dụ, dữ liệu mạng xã hội có thể được sử dụng để đo lường tâm lý người tiêu dùng hoặc đánh giá phản ứng của thị trường đối với một sản phẩm mới. Dữ liệu giao dịch ngân hàng và thanh toán điện tử giúp phản ánh xu hướng chi tiêu của người dân theo thời gian thực. Trong khi đó, dữ liệu vệ tinh có thể cho thấy mức độ hoạt động của các cảng biển, khu công nghiệp hoặc chuỗi cung ứng toàn cầu.

Dữ liệu phi truyền thống đang bước từ vị trí bên lề vào trung tâm của các quyết định kinh doanh và chính sách. Ảnh minh họa
Tại Mỹ và châu Âu, nhiều tổ chức tài chính đã sử dụng AI để phân tích dữ liệu vệ tinh nhằm dự báo doanh thu doanh nghiệp, theo dõi hoạt động logistics hoặc đánh giá triển vọng tăng trưởng kinh tế trước khi các số liệu chính thức được công bố.
Không ít quỹ đầu tư sẵn sàng chi hàng triệu USD mỗi năm để mua các bộ dữ liệu như vậy nhằm tạo ra lợi thế cạnh tranh trên thị trường.
CHÌA KHÓA NẰM Ở LỰA CHỌN ĐÚNG DỮ LIỆU, HIỂU Ý NGHĨA KINH TẾ CỦA DỮ LIỆU
Sự bùng nổ của AI đang khiến dữ liệu ngày càng được ví như "dầu mỏ mới" của nền kinh tế số. Tuy nhiên, khác với dầu mỏ, giá trị của dữ liệu chỉ xuất hiện khi có khả năng khai thác và chuyển hóa thành tri thức.
AI ngày càng trở thành hạ tầng cốt lõi của nền kinh tế số, dữ liệu phi truyền thống đang bước từ vị trí bên lề vào trung tâm của các quyết định kinh doanh và chính sách.
Theo TS. Hồ Quốc Tuấn, cơ hội hiện nay không chỉ nằm ở việc sở hữu dữ liệu mà còn nằm ở khả năng lựa chọn đúng dữ liệu và hiểu được ý nghĩa kinh tế của chúng.
Một trong những xu hướng nổi bật là việc sử dụng dữ liệu vệ tinh kết hợp với AI để dự báo GDP, lợi nhuận doanh nghiệp và xu hướng tiêu dùng. Song song với đó là việc khai thác dữ liệu mạng xã hội, dữ liệu giao dịch và dữ liệu vị trí địa lý nhằm xây dựng các mô hình dự báo kinh tế theo thời gian thực.
Tuy nhiên, cùng với cơ hội là hàng loạt thách thức mới liên quan đến quyền riêng tư, bản quyền dữ liệu, tính minh bạch của mô hình AI và nguy cơ xuất hiện các tín hiệu nhiễu.
TS. Hồ Quốc Tuấn cho rằng khi lượng dữ liệu tăng lên quá nhanh, bài toán không còn là thiếu dữ liệu mà là xác định đâu là dữ liệu thực sự có giá trị.
Theo chuyên gia, AI ngày càng trở thành hạ tầng cốt lõi của nền kinh tế số, dữ liệu phi truyền thống đang bước từ vị trí bên lề vào trung tâm của các quyết định kinh doanh và chính sách. Cuộc đua khai thác nguồn tài nguyên mới này được dự báo sẽ ngày càng quyết liệt, không chỉ giữa các doanh nghiệp mà còn giữa các quốc gia trong kỷ nguyên số.
Bảo Bình
39 phút trước
1 phút trước
19 phút trước
21 phút trước
1 phút trước
2 phút trước
2 phút trước
4 phút trước
5 phút trước
5 phút trước
9 phút trước
9 phút trước