Google Knowledge Graph Là Gì? Cách thức Hoạt Động Của Sơ Đồ Tri Thức?

Google Knowledge Graph (Sơ đồ tri thức) chứa đựng những cơ sở dữ liệu quan trọng của mỗi trang Web

Google Knowledge Graph (sơ đồ tri thức) là cầu nối quan trọng để Google có thể thấu hiểu được những nội dung trên trang Web của bạn. Vậy sơ đồ tri thức là gì và cách thức hoạt động của nó như thế nào? Câu trả lời sẽ được mình bật mí trong bài viết dưới đây, cùng tìm hiểu nhé!

Google Knowledge Graph là gì?

Mình nghĩ biểu đồ tri thức giống như một sự giao thoa hoàn hảo giữa bách khoa toàn thư và cơ sở dữ liệu. Trong đó, mỗi bài viết được nhà phát triển coi là một "thực thể' hay "chủ đề" của những văn bản hướng tới khách hàng của Google.

Google Knowledge Graph (Sơ đồ tri thức) chứa đựng những cơ sở dữ liệu quan trọng của mỗi trang Web
Google Knowledge Graph (Sơ đồ tri thức) chứa đựng những cơ sở dữ liệu quan trọng của mỗi trang Web

Định nghĩa về chủ đề

Nội dung của các chủ đề có thể là bất cứ điều gì. Tương tự như hầu hết những cơ sở dữ liệu, nó tồn tại một số định dạng duy nhất. 

Đôi khi bạn có thể nhìn thấy chúng trong những URL của Google. Đó là một có thể là một cái gì đó như [kgmid = g/11f0vfyswk & hl] mặc dù tên tham số là [kgid] được thay đổi theo từng chủ đề khác nhau.

Một số phát biểu phổ biến về chủ đề:

  • Tên hoặc nhãn(ví dụ như "Elvis Presley").
  • Một loại hoặc nhiều loại(điển hình như "Người").
  • Mô tả.
  • Danh sách URL hình ảnh(thường nhắc tới những quyền sử dụng được liên kết).
  • Mô tả chi tiết(thường là một số văn bản có URL nguồn).

Tuy nhiên, mặc dù Google cũng đã tuyên bố rằng những thông tin trong danh sách trên luôn có sẵn trong API của họ. Thế nhưng thực tế là những dữ liệu này đã được tăng cường đáng kể trong nội bộ. Chính vì vậy, chủ đề của bài viết có thể sẽ bao hàm thêm nhiều thông tin cụ thể hơn. 

Ví dụ trong một chủ đề liên quan tới nhân vật Elvis:

Chúng ta có thể đề cập tới ngày Elvis sinh và mất. Hay cung cấp thông tin anh ấy đã kết hôn với Priscilla Presley. Hoặc những tác phẩm mới của anh ấy mang tên là "chó săn". Cứ như vậy, chủ đề được tiếp tục mãi mãi.

Bạn có thể thấy rằng cách chia sẻ thông tin này thực sự không khác một quyển bách khoa toàn thư. Trong đó mọi dữ liệu đều nằm trong một trường như "đã kết hôn", thế nên việc kết nối giữa những chủ đề trở nên dễ dàng hơn. Ngoài ra, nó cũng hỗ trợ máy truy xuất được thông tin phù hợp khi có ai đó hỏi.

Một số lưu ý quan trọng về định hướng

Có rất nhiều Google Knowledge Graph trên thế giới, thế nhưng biểu đồ tri thức của Google chỉ có một. Một số khác bao gồm dbpedia.com, Inlinks.net(tiết lộ tên công ty), Wikidata.org.

Biểu đồ tri thức của Google là định dạng duy nhất
Biểu đồ tri thức của Google là định dạng duy nhất

Những điều cần biết về sơ đồ tri thức

Bất kỳ dữ liệu bán cấu trúc nào cũng có thể được mô tả dưới dạng Google Knowledge Graph, bao gồm bách khoa toàn thư hay những cơ sở dữ liệu như IMDB. Theo mình biết, Google đã xây dựng sơ đồ tri thức của mình ban đầu từ những bộ dữ liệu khác bao gồm CIA Factbook và Wikipedia.

Bên cạnh đó, nhiều SEOer còn có một quan niệm sai lầm cực kỳ phổ biến rằng bảng tri thức của Google chính là Google Knowledge Graph của nền tảng này. Thực tế, đây không phải là hai khái niệm đồng nhất. Mặc dù bản tri thức có thể đại diện cho một tập hợp con dữ liệu trong biểu đồ.

Bảng tri thức là một hình ảnh trực quan về những mục dữ liệu được kết nối thông qua sơ đồ tri thức trực thuộc Google. Tuy nhiên, Google Knowledge Graph của Google lại là một bản ghi ít trực quan về những chủ đề khác nhau.

Phân biệt “thực thể” và “chủ đề”

Một cách thức phân biệt cuối cùng mà mình muốn chia sẻ sẽ liên quan tới thuật ngữ. Khi mà sơ đồ tri thức thường được mô tả là được tạo thành từ "thực thể". Thế nhưng Google lại có xu hướng coi những "thực thể" này chính là "chủ đề" trong những tài liệu công khai của mình.

Đây là một từ khá "thân thiện với người dùng" để họ dễ dàng sử dụng. Tuy nhiên điều này có thể khiến bạn khó có thể biết khi nào Google đang đề cập tới một "thực thể".

Các loại chủ đề thực thể

Mỗi thực thể bất kỳ đều được để cập trong những chủ đề liên quan. Nó có thể là một cơ quan, một người, quốc gia, địa điểm hay người. Nếu như không thuộc gì trong số này, nó có thể được gán nhãn đơn giản là "Điều". Mặc dù những loại thực thể đó có thể tiếp tục được Google phát triển.

Thực thể là yếu tố chủ chốt trong một chủ đề bất kỳ
Thực thể là yếu tố chủ chốt trong một chủ đề bất kỳ

API có nhiệm vụ xử lý ngôn ngữ tự nhiên của Google cung cấp manh mối để gợi ý rằng nhiều loại thực thể đang được sử dụng, ví dụ như "hàng tiêu dùng" hay "các tác phẩm nghệ thuật".

Ngoài ra, nhiều người khác thường được liệt kê trong danh sách nhà phát triển API tìm kiếm sơ đồ tri thức của họ. Nhưng Google hiện tại có vẻ khá yếu trong việc phân loại chính xác nhiều thực thể.

Không những thế, một nghiên cứu đã chỉ ra rằng, ít hơn 20% thực thể là những yếu tố được công nhận trong thuật toán xử lý ngôn ngữ tự nhiên của Google. So với những thực thể được trả lại trong các đợt chào bán công khai của gã khổng lồ này.

Một số lợi ích của sơ đồ tri thức đối với Google

Bằng cách tổ chức thông tin của thế giới theo chủ đề, thay vì chỉ thu thập thông tin, lập chỉ mục trang Web thì những Website và những công cụ tìm kiếm có thể tận dụng được một số lợi ích tuyệt vời từ sơ đồ tri thức. Chúng bao gồm tính đa dạng, quy mô, tính toàn vẹn của thông tin và tốc độ.

Tận dụng sơ đồ tri thức hiệu quả đem lại nhiều lợi ích tuyệt vời cho nhà phát triển trang Web

Nhân rộng lợi ích

Tổng số lượng các trang Web luôn là một chủ để cực kỳ thu hút và được nhiều người quan tâm, nhiều người cho rằng chúng là vô số. Nhưng thực tế là không có một con số cụ thể khi mà chúng có thể lên đến hàng nghìn tỷ và đang con số này đang tăng lên từng ngày. 

Ngược lại, số lượng chủ đề mà con người có thể thấu hiểu được lại ít hơn rất nhiều(có lẽ khoảng vài trăm tỷ) và tăng trưởng với tốc độ chậm hơn nhiều. Điều này đồng nghĩa với việc có sự trùng lặp ý tưởng trong nội dung trên các trang Web.

Chính lẽ đó, bằng cách lưu trữ thông tin về một chủ đề nào đó theo cách bán cấu trúc. Nhờ đó mà thông tin của thế giới sẽ chiếm ít thông tin hơn và cũng ít bị trùng lặp hơn rất nhiều.

Đa dạng nguồn dữ liệu lợi ích

Lưu trữ thông tin về một chủ đề bất kỳ cho phép Google trích dẫn được nhiều nguồn dữ liệu hơn. Thay vì luôn đưa người dùng tới một trang Web duy nhất.

Điều này có nghĩa là Google có thể đối chiếu dữ kiện nổi bật về một chủ đề và hiển thị chúng trên màn hình hoặc thông qua những phương tiện khác theo cách tối ưu hơn cho người dùng hoặc truy vấn của họ. Ngoài ra, về lý thuyết thì các dữ liệu về một chủ đề có thể được lấy từ nguồn khác bên ngoài Internet.

Những lợi ích khác của sơ đồ tri thức

  • Tính toàn vẹn thông tin.
  • Truy xuất thông tin.
Sơ đồ tri thức mang tới những thông tin giá trị về các chủ đề
Lợi íchChi tiết
Lợi ích về tính toàn vẹn thông tinDù rằng sơ đồ tri thức của Google vẫn có thể tồn tại những sai sót và không có tính chính xác, thực tiễn. Đồng thời có thể bị những chuyên gia SEO hoặc các kẻ xấu thao túng. Thế nhưng phương pháp này vẫn có lợi ích riêng, đó chính là cung cấp cho Google một "điểm duy nhất của sự thật" - ít nhất là đối với những chủ đề không gây tranh cãi.Thực tế là một chủ đề mới cần phải vượt qua những ngưỡng chất lượng nhất định trước khi nó được đưa vào sơ đồ tri thức. Tuy nhiên, các SEOer cần lưu ý rằng những ngưỡng này cũng thưởng khó có thể được Google thảo luận một cách cởi mở.Xét về mặt tiêu cực, một điểm sự thật có thể làm giảm tỷ lệ về tính đa dạng của thông tin và dẫn tới dễ bị sai lệch nếu bản thân những nguồn dữ liệu cơ bản cũng bị sai lệch.
Lợi ích của truy xuất Thông tin(tốc độThông qua việc sắp xếp thông tin dựa theo chủ đề, việc truy xuất các tin tức trở nên nhanh hơn nhiều. Đây là một ưu điểm tuyệt vời, bởi nó giúp cả Google và người dùng thoát khỏi cảnh "mò kim đáy bể".

Cách hoạt động: Nơi bạn thấy Google Knowledge Graph được sử dụng

Như mình đã giải thích, cách hoạt động của bảng tri thức không giống như các sơ đồ tri thức. Tuy nhiên nó vẫn là cách sử dụng phổ biến nhất của Google Knowledge Graph đối với hầu hết những chuyên gia SEO.

Cách sử dụng Google Knowledge Graph

Không những thế, đối với nhiều người dùng các thiết bị điện thoại thông minh của hệ điều hành Android thì việc sử dụng biểu đồ kiến thức phổ biến nhất trong mọi trường hợp là truy cứu vào tính năng “khám phá” trên màn hình điện thoại của họ mỗi ngày.

Những chủ đề được người dùng quan tâm thường xuất hiện trong Google xu hướng. Trong đó, Google sẽ đưa ra những dấu hiệu về chủ đề có thể liên quan chặt chẽ với nhau. Và đôi khi những dữ liệu này có thể được thu thập từ việc kéo những tìm kiếm khác của cùng một người dùng. 

Những chủ đề có liên quan trong Google xu hướng không dựa trên ngữ nghĩa

Ngoài ra, Google cũng cung cấp một API tìm kiếm sơ đồ tri thức để hỗ trợ cho người dùng. Đồng thời hiển thị những thực thể trong đầu ra của API NLP của nó.

Tìm kiếm của Google

Tương tự như bảng tri thức, khi bạn nhập câu hỏi trên Google tìm kiếm mà nó có thể trả lời bằng Google Knowledge Graph. Thì lúc này bạn cũng sẽ nhận được một màn hình hiển thị những thông tin vô cùng phong phú trong SERPs. 

Điều này thường gây nên những thiệt hại đáng kể cho các kết quả tìm kiếm có giá trị cốt lõi. Khi mà những liên kết đến các trang Web chất lượng bị đẩy xuống dưới màn hình đầu tiên.

Kết luận

Có thể nói. Google Knowledge Graph đã từng mang đến những kết quả phong phú và tạo nên sự thu hút đặc biệt cho những người tìm kiếm. Cùng với đó là những lợi ích tuyệt vời cho các nhà phát triển trang Web.

Chính vì vậy, mình hy vọng những chia sẻ thú vị về sơ đồ tri thức trong bài viết trên sẽ trở thành vũ khí đắc lực cho các SEOer. Giúp bạn tối ưu hóa tốt nhất cho chiến lược SEO cho trang Web của mình. Chúc các bạn thành công!