🔍
Chuyên mục: CNTT - Viễn thông

Tin tức là dữ liệu trong kỷ nguyên trí tuệ nhân tạo

3 giờ trước
Trong kỷ nguyên trí tuệ nhân tạo (AI), tin tức không chỉ còn là nội dung - nó là dữ liệu.

Tại lớp học Chuyên gia về AI tác nhân (Agentic AI) dành cho báo chí truyền thông, do Hiệp hội Truyền thông tin tức quốc tế (INMA) tổ chức, các lãnh đạo truyền thông từ một số cơ quan báo chí và công nghệ hàng đầu thế giới như Associated Press, Schibsted, Scroll và IAB Tech Lab đã thảo luận về cách họ tận dụng AI tác nhân trong đơn vị của mình.

Sự trỗi dậy của AI đang làm thay đổi tận gốc nhận thức của các nhà xuất bản tin tức về cách thức tạo ra và phân phối nội dung. Tại sự kiện của INMA, các nhà lãnh đạo truyền thông đã chia sẻ cách AI tác nhân đang thúc đẩy các nhà xuất bản phải xem xét lại việc sáng tạo và tận dụng nội dung trên web.

AP Intelligence, một sáng kiến chiến lược ra mắt vào cuối năm 2025, là một nỗ lực to lớn nhằm biến kho lưu trữ khổng lồ và các bài báo cáo của AP (Mỹ) thành dữ liệu có cấu trúc mà máy móc có thể đọc được. Đây không chỉ là sự thay đổi trong thực tiễn; đó là sự thay đổi trong tư duy.

Bà Sara Trohanis, Phó Chủ tịch phụ trách doanh thu khu vực châu Mỹ, người đứng đầu bộ phận đối tác chiến lược của AP, giải thích: “Chúng tôi đang thay đổi cách nhìn nhận tin tức như là dữ liệu và giải phóng tiềm năng mới đó để bảo đảm tin tức tiếp cận được những ngành công nghiệp và độc giả mới”.

Bà cũng nhấn mạnh, điều này đang “tạo ra nguồn dữ liệu tin tức đã được xác minh hàng đầu thế giới”. AP Intelligence được thúc đẩy bởi lượng lớn các điểm dữ liệu mà mỗi câu chuyện chứa đựng.

Bất kể quy mô bài báo ra sao, nó đều chứa “các điểm dữ liệu có thể tạo tiếng vang trong rất nhiều phân khúc ngành nghề khác nhau, vượt ra ngoài những đối tượng mà chúng tôi tiếp cận theo cách truyền thống”, bà Trohanis cho biết.

AP Intelligence được thúc đẩy bởi lượng lớn các điểm dữ liệu mà mỗi câu chuyện chứa đựng.

Thí dụ, một bài báo về cháy rừng sẽ bao gồm vị trí, thời gian, số người thương vong, tác động kinh tế, điều kiện thời tiết và bối cảnh lịch sử. Theo truyền thống, những chi tiết đó nằm trong lối viết báo kể chuyện. Nhưng hệ thống AI không đọc các câu chuyện theo cách con người đọc.

Bà Trohanis nói: “Chúng tiếp nhận các thực thể, mốc thời gian, vị trí địa lý và các mối quan hệ siêu dữ liệu (metadata)”. Với sự phát triển của AI tác nhân, báo chí có thể được cấu trúc hóa, mở ra giá trị to lớn giúp các ngành nghề phụ thuộc vào thông tin xác tín theo thời gian thực đưa ra quyết định. “Chúng tôi đang tích hợp hiểu biết thực tế về các sự kiện, ngành nghề thành kho dữ liệu giúp luồng người dùng và quy trình kinh doanh trở nên dễ dàng hơn”, bà Trohanis nói.

AI tác nhân đang định hình lại các sản phẩm tại hãng truyền thông Schibsted của Na Uy. Ông Juan Carlos Lopez Calvet, Giám đốc Dữ liệu và AI, đã trực tiếp trình diễn một công cụ mới, tự động tổng hợp nội dung từ thư viện dữ liệu của hãng để sản xuất video tin tức. Công cụ đó mang tên Videofy, hiện đang ở phiên bản thứ 10.

“Chúng tôi có rất nhiều dữ liệu cần tiếp nhận. Nó có thể là bài báo, văn bản, video, âm thanh. Chúng tôi chuyển đổi chúng và tạo đầu ra”, ông Lopez Calvet nói.

Trong bản demo, đầu ra là một video. Các tác nhân AI của Schibsted chủ động đối chiếu và tổng hợp các câu chuyện có điểm tương đồng trên tài sản dữ liệu. Từ những nguồn tài nguyên sẵn có và dữ liệu do tác nhân AI thu thập, việc phát triển các câu chuyện được bắt đầu.

Video được tạo ý tưởng tự động với việc lựa chọn trước âm thanh và hình ảnh từ thư viện tài sản, sau đó biên tập viên có thể chỉnh sửa.

Sự tiến bộ của AI ngày nay đã tạo ra một hệ sinh thái trực tuyến, giúp mọi người thu thập dữ liệu trên internet và tạo ra một bản tóm tắt tin tức cho riêng mình.

Bà Sannuta Raghu, Trưởng phòng AI Lab Báo chí & Tin tức tại Scroll (Ấn Độ), thảo luận về tính linh hoạt của nội dung: “Chúng tôi nhận ra rằng bạn có thể tạo ra các đơn vị kiến thức báo chí chi tiết (granular units). Bạn có thể thiết kế kho lưu trữ theo nhu cầu của mình dễ dàng hơn nhiều”.

Scroll đã xây dựng một công cụ có tên Factivo. Công cụ này lấy một câu chuyện tin tức đã được xác minh và chuyển đổi nó thành nhiều định dạng như video, dòng thời gian, máy tính, sơ đồ tư duy, các câu hỏi thường gặp (FAQ)…

Bằng cách phân chia thông tin thành các “nguyên tử” nhỏ và cấu trúc lại chúng trong kho lưu trữ, các tòa soạn có thể tạo ra trải nghiệm thú vị hơn cho người dùng.

Trong nhiều thập kỷ, các cơ quan báo chí đã xây dựng hoạt động kinh doanh dựa trên một giả định đơn giản: con người truy cập vào các trang web.

Giả định đó không còn đúng nữa. Ngày nay, phần lớn lưu lượng truy cập trên các trang web tin tức không đến từ con người mà từ máy móc. Các tác nhân AI, trình thu thập dữ liệu (crawler) và hệ thống tự động hiện đang đọc, diễn giải và phân phối lại báo chí ở quy mô lớn.

Ông Shailley Singh, Phó Chủ tịch điều hành sản phẩm, Giám đốc điều hành của IAB Tech Lab, cho biết: “Hơn 51% lưu lượng truy cập web không phải là con người”. Ông nhấn mạnh rằng chỉ dựa vào bộ lọc phản ứng (reactive filtering) là không đủ.

Một giải pháp được đưa ra là quyền truy cập mã hóa (tokenised access). Thay vì phải đoán xem yêu cầu truy cập có đến từ trình thu thập dữ liệu hợp lệ hay không, cơ quan báo chí có thể cấp một mã thông báo (token) kỹ thuật số dựa trên thỏa thuận cấp phép.

Khi có thỏa thuận với tác nhân AI, bạn có thể cấp cho họ một mã thông báo... giống như chữ ký số. Nếu mã thông báo hợp lệ, quyền truy cập sẽ được cấp. Nếu không, yêu cầu sẽ bị chặn. Ông Singh gọi đây là “một cách rất an toàn để quản lý ai được phép xem nội dung của bạn”.

Sơn nguyễn, linh hà, thảo trang

TIN LIÊN QUAN





















Home Icon VỀ TRANG CHỦ