Bạn có thực sự biết thực thể Google (Google Entity) là gì không?
Entity hay còn gọi là thực thể nó là một khái niệm bao quát từ khóa tuy nhiên nó lại cụ thể hơn từ khóa. Vậy nên nghiên cứu thực thể khác với nghiên cứu từ khóa. Thực thể là nền tảng đầu tiên bạn cần hiểu trước khi triển khai Entity SEO và Semantic SEO (tối ưu hóa công cụ tìm kiếm thực thể và tối ưu hóa công cụ tìm kiếm ngữ nghĩa).
Bạn có tò mò muốn biết lý do không?
Hãy cùng Tâm tìm hiểu sâu về các thực thể SEO của Google và cách chúng được sử dụng để xây dựng các mối quan hệ ngữ nghĩa trong nội dung. Trong bài viết này, Tâm sẽ giúp các bạn làm rõ:
- Thực thể Google là gì? (Google Entities)
- Lớp Chủ Đề là gì? (Topic Layer)
- Hướng dẫn chi tiết cách SEO Thực thể (SEO Entity)
Hiểu những khái niệm này sẽ giúp ích cho bạn rất nhiều khi nghiên cứu chủ đề để làm SEO Ngữ Nghĩa (Semantic SEO).
Thực thể (Entity) là gì?
Thực thể (Entity) là một phần thông tin trong cơ sở dữ liệu Knowledge Graph của Google, định nghĩa một vật thể hoặc một khái niệm là duy nhất, cụ thể và dễ nhận biết. Các thực thể này thường được đặc trưng bởi tên, loại, thuộc tính và mối quan hệ với các thực thể khác.
Thực thể cung cấp cho thuật toán Google khả năng hiểu sâu một vấn đề, đủ để trả lời các truy vấn của người dùng trong tìm kiếm.
Dịch thuật: Entity trong tiếng Việt là Thực thể; Entities trong tiếng Việt là các Thực thể.
Lần đầu tiên khi nghe tới khái niệm Thực thể Google, Tâm cũng hơi bối rối và thắc mắc là liệu một thực thể (entity) có phải là một đối tượng (object) trong thế giới thực? Làm thế nào để thực thể có thể bao gồm được khái niệm (concept) bên trong nó?
Nếu bạn có cùng suy nghĩ giống như Tâm thì đừng lo, thật ra mọi thứ không như ta nghĩ, ta thường liên tưởng từ ‘thực thể’ với những thứ trong thế giới thực.
Nhưng sự thật thì thực thể (entities) là các đơn vị (units) có ý nghĩa để tổ chức thông tin trên web. Từ góc độ tổ chức thông tin, không có sự khác biệt thực sự giữa danh từ trừu tượng (như khái niệm, màu sắc và cảm xúc) và danh từ cụ thể (những đối tượng trong thế giới thực).
Ví dụ:
- Ronaldo là thực thể [Personal]
- Paris là thực thể [Place]
- Đau răng là thực thể [Things]
- V.v…
Do đó, cơ sở dữ liệu của Google đối xử với các thực thể thông tin giống như cách nó đối xử với các thực thể trong thế giới thực.
Chức năng của Google Entities là gì?
Theo Google, các thực thể là những đơn vị có ý nghĩa để tổ chức thông tin và giúp công cụ tìm kiếm 2 việc chính:
- Hiểu truy vấn của người dùng (User queries)
- Trả lời những truy vấn này (Answer queries)
Nói là 2 việc, thực ra đây chỉ là 2 phân đoạn đầu và cuối của cả một quá trình xử lý thông tin phức tạp.
Do đó, Google đã, đang và sẽ tiếp tục đối mặt với lượng thông tin khổng lồ, hệ thống máy chủ của Google phải sắp xếp và phân loại hơn 50 tỷ trang thông tin trên web để cung cấp thông tin cần thiết cho người dùng. Điều này có nghĩa là Google phải ‘hiểu’ và phân loại được:
- User queries (truy vấn của người dùng)
- Web content (nội dung của các website mà nó lưu trữ)
Để giải quyết bài toán này tốt hơn, Google và các công cụ tìm kiếm khác đã chuyển từ công cụ tìm kiếm từ vựng (lexical) sang công cụ tìm kiếm ngữ nghĩa (semantic).
- Công cụ tìm kiếm từ vựng (Lexical Search Engine) tìm chuỗi từ khóa (keywords) trong truy vấn tìm kiếm và khớp chúng với các từ khóa đó trong nội dung web. Đây là một cách tìm kiếm thông tin không chính xác và dẫn đến việc xuất hiện của các “bậc thầy” nhồi nhét từ khóa.
- Ngược lại, tìm kiếm ngữ nghĩa (Semantic Search Engine) là một bước tiến để cải thiện độ chính xác của kết quả tìm kiếm bằng cách phân tích ý nghĩa của các từ trong truy vấn tìm kiếm của người dùng và khớp chúng với nội dung trả lời truy vấn. Để làm điều này, các thuật toán xử lý ngôn ngữ tự nhiên của Google được thiết kế để ‘hiểu’ ngôn ngữ con người.
Tâm viết rất nhiều về Semantic SEO, nếu bạn muốn tìm hiểu sâu về SEO Ngữ Nghĩa hãy bắt đầu đọc bài này trước: Semantic SEO là gì? Hoặc xem toàn bộ các bài viết về chủ đề SEO.
Quay trở lại với Google Entities, Thực thể là các đơn vị có ý nghĩa để tổ chức thông tin. Để Google ‘hiểu’ các truy vấn tìm kiếm và khớp chúng với nội dung ‘đúng’, Google cần xác định thực thể mà truy vấn tìm kiếm đang đề cập và cách nó liên quan đến các thực thể khác.
Ví dụ, Tâm nhập vào thanh tìm kiếm truy vấn có nội dung là “ai là người phát minh ra internet”, Google bằng cách nào đó biết rằng câu trả lời là ‘GS Joseph Carl Robnett Licklider’. Bên dưới, bạn có thể thấy Google làm nổi bật thông tin về GS Joseph Carl Robnett Licklider.

Rõ ràng là Google đang sử dụng Semantic SE (Công cụ tìm kiếm ngữ nghĩa), kết quả của ảnh trên cho thấy cách Google trả lời một truy vấn tìm kiếm với kết quả đầu tiên không bao gồm chuỗi truy vấn, tức là không bao gồm cụm từ khóa tìm kiếm.
Ngược lại mặc dù có chính xác cụm từ khóa tìm kiếm “ai là người phát minh ra internet” nhưng kết quả đến từ LinkedIn (khung tím trong ảnh) lại không được ưu tiên.
Bạn hãy thử với các truy vấn khác xem có đúng vậy không nhé!
Bây giờ, trước khi chúng ta đến với SEO thực thể, hãy phân tích xem những gì cấu thành nên một thực thể (entity).
Phân tích cấu trúc thực thể Google (Entity structure)
Bây giờ chúng ta sẽ tiến hành “giải phẫu” một thực thể, để xem bên trong nó có những gì!
Thực thể được tạo thành từ các phần khác nhau, hiểu được các thành phần này sẽ giúp bạn thấy cách chúng liên quan đến nhau. Hiểu mối quan hệ của chúng sẽ giúp bạn tạo nội dung mà Google ‘hiểu’ và làm điều đó sẽ giúp bạn xếp hạng cao hơn trong SERP và kéo về nhiều khách truy cập hơn (tất nhiên rồi!).
Điều đầu tiên ta cần hiểu là các thực thể tồn tại trong một danh mục gọi là Knowledge Graph (Sơ đồ tri thức – Sơ đồ kiến thức). Có thể khẳng định rằng, sơ đồ tri thức là môi trường để thực thể có thể tồn tại.
Google Knowledge Graph là gì?
Knowledge Graph (Sơ đồ tri thức – Sơ đồ kiến thức) của Google là một kho thông tin được sử dụng để lưu trữ các thực thể cùng với mô tả và thuộc tính của chúng. Ngoài ra, Knowledge Graph còn hỗ trợ cấu trúc các thực thể bằng cách tạo ra các kết nối giữa các thực thể và khái niệm.
Hiểu rõ được cấu trúc này là một phần quan trọng trong việc hiểu các thực thể của Google (Tâm sẽ phân tích thêm bên dưới).
Knowledge Graph của Google lấy tất cả thông tin thực thể này từ các nguồn như:
- The CIA World Factbook
- Wikipedia
- Wikidata
- Và thậm chí nó cũng có thể đến từ website của bạn.
Google cũng lấy thông tin thực thể từ web mở. Có nghĩa là Google sẽ lấy các định nghĩa thực thể, danh mục, loại thực thể, thuộc tính thực thể và tất tần tật những gì liên quan từ các nguồn này. Sau đó nó lưu trữ tất cả thông tin dưới dạng cấu trúc trong Knowledge Graph.
Bây giờ bạn đã quen thuộc với môi trường mà các thực thể (Entity) tồn tại, tiếp tục Tâm sẽ phân tích cấu trúc bên trong các thực thể.
Thuộc tính của Thực thể (Entity Properties)
Như Tâm đã đề cập ở trên, các thực thể được tạo thành từ các thành phần. Hãy xem xét các thành phần này riêng biệt.
1. Định danh của thực thể (Entity Identifier)
Nói đơn giản, một cơ sở dữ liệu chứa các kiến thức thực thể cần một cách hiệu quả để xác định từng thực thể riêng biệt. Điều này có nghĩa là mỗi thực thể cần có định danh duy nhất của riêng mình.
Để thấy một định danh duy nhất trong thực tế, bạn có thể test bằng công cụ khám phá API Tìm kiếm Knowledge Graph của Google.
Trong ảnh chụp màn hình bên dưới, Tâm đã nhập vào mục query, “Alex Ferguson” để test dữ liệu Knowledge Graph của Google. Phía bên phải là kết quả trả về.
Nếu bạn cuộn xuống bên tab kết quả, bạn sẽ thấy “@id”: “kg:/m/0bvlv”
Đây là định danh duy nhất. Bạn sẽ nhận thấy rằng định danh duy nhất không phải là tên của thực thể. Đó là một mã dành riêng cho Entity “Alex Ferguson”.
Vậy tại sao Google không sử dụng tên của thực thể? Lý do là nhiều thực thể có tên giống hệt nhau, trong khi định danh là duy nhất cho từng thực thể, cho phép Google dễ dàng phân biệt chúng.
2. Tên của thực thể (Entity Name)
Mỗi thực thể có một tên. Không giống như định danh duy nhất, các thực thể có thể chia sẻ tên.
Ví dụ, Michael Jackson vừa là tên một Ca sĩ vừa là tên của một Chính trị gia. Ngoài ra, một số thực thể có thể được biết đến bằng nhiều tên.
Ví dụ, gõ The Rock hoặc Dwayne Johnson vào Google sẽ cho ra cùng một kết quả.
Những tên thay thế này được coi là bí danh.
Vậy, nếu mỗi thực thể có một định danh duy nhất, tại sao chúng cần tên?
Tên thực thể rất quan trọng, cho dù định danh duy nhất là một cách để công cụ tìm kiếm nhận diện thực thể, tên là cách mà người dùng thực sự sẽ nhận diện ngôn ngữ của thực thể. Người dùng sẽ nhập tên của thực thể trong truy vấn tìm kiếm.
Ngược lại, Google sẽ thấy tên trong truy vấn tìm kiếm, dựa trên ngữ cảnh, cố gắng khớp tên với ID thực thể trong Cơ sở Kiến thức (Knowledge Graph).
Như bạn có thể thấy trong ảnh chụp màn hình bên dưới, tên thực thể là Alex Ferguson:
Nếu bạn muốn thấy tên thực thể trong thực tế, hãy gõ nó vào Google, và nếu Knowledge Graph có dữ liệu về thực thể, tên sẽ được hiển thị ở đầu bảng điều khiển kiến thức của thực thể.
3. Loại thực thể (Entity Type)
Các thực thể được chia vào các nhóm gọi là loại thực thể. Loại thực thể đơn giản là các danh mục nhóm các thực thể có thuộc tính tương tự lại với nhau.
Nhìn lại bảng kết quả mà Tâm vừa test trong Knowledge Graph của Google, bạn có thể thấy loại thực thể bằng cách tìm kiếm “@type”. Bạn có thể thấy, đối với Google, Alex Ferguson vừa là sự vật vừa là con người.
Dưới đây là danh sách các loại thực thể chính được Knowledge Graph của Google công nhận:
- Book – Sách
- Book Series – Bộ sách
- Educational Organization – Tổ Chức Giáo Dục
- Event – Sự kiện
- Government Organization – Tổ chức chính phủ
- Local Business – Doanh nghiệp địa phương
- Movie – Phim
- Movie Series – Loạt phim
- Music Album – Album nhạc
- Music Group – Nhóm nhạc
- Music Recording – Bản ghi âm nhạc
- Organization – Tổ chức
- Periodical – Xuất bản định kỳ (báo chí)
- Person – Người
- Place – Địa điểm
- Sports Team – Đội Thể Thao
- TV Episode – Tập phim
- TV Series – Loạt phim nhiều tập
- Video Game – Trò chơi điện tử
- Video Game Series – Series trò chơi
- WebSite – Trang Web
4. Thuộc tính của thực thể ( Entity Attributes)
Các thực thể thường được đặc trưng bởi các tập hợp thuộc tính. Mỗi loại thực thể sẽ thường có các tập hợp thuộc tính riêng.
Ví dụ, các thực thể được phân loại là con người sẽ thường có các thuộc tính như ngày sinh, thành viên gia đình, chiều cao, v.v.
Mặt khác, các địa điểm có thể có vĩ độ, kinh độ, quốc gia, mã bưu chính, v.v. là các thuộc tính chính.
Đôi khi, các thuộc tính này là các thực thể tự thân. Ví dụ, quốc gia. Khi điều này xảy ra, các thuộc tính này không được coi là thuộc tính, mà là các thực thể liên quan. Điều này đặc biệt quan trọng đối với SEO, và Tâm sẽ giải thích ở bên dưới.
Để thấy các thuộc tính trong thực tế, hãy xem Bảng Tri Thức thực thể (Google Knowledge Panel) của Alex Ferguson dưới đây.
Như bạn có thể thấy, bảng tri thức cho bạn biết:
- Ông ấy sinh ra khi nào và ở đâu
- Chuyên môn và nơi ông ấy đã và đang làm việc
- Hôn thê của ông ấy
- Ngày gia nhập các “tổ chức” để làm việc
- Con cái
- Cháu
- Cha mẹ
Các từ có màu xanh (anchor text – có liên kết url dẫn đến các trang khác) là các thuộc tính cũng là các thực thể tự thân. Nếu bạn nhấp vào bất kỳ từ nào có liên kết, Google sẽ chuyển hướng bạn đến trang tìm kiếm (SERP) của thực thể đó.
5. Các thực thể liên quan (Related Entities)
Thực thể liên quan mô tả cách các thực thể liên quan hay liên kết với nhau. Ví dụ, đối với Google, cả Alex Ferguson và CLB Manchester United đều là các thực thể liên quan với nhau. Mối quan hệ ở đây là Alex Ferguson từng làm việc tại câu lạc bộ Manchester United.
Bạn có thể thử test bằng cách gõ “Manchester United coaches” vào thanh tìm kiếm Google.
Ở trên, bạn có thể thấy tất cả các thực thể mà Google coi là “coach/manager” của thực thể Manchester United – Man Utd.
Google sử dụng những mối quan hệ thực thể này để trả lời các câu hỏi do người dùng tạo ra. Vì vậy, trong ví dụ ở trên, bằng cách tìm kiếm ‘Manchester United coaches’, Google hiểu rằng người dùng về bản chất đang hỏi rằng ‘Ai đã từng hoặc đang là “coach-huấn luyện viên” của Manchester United’.
Google đã ‘hiểu’ mối quan hệ giữa Man Utd và các huấn luyện viên của entity này và có thể hiển thị thông tin đó trong tính năng SERP ở trên.
Hiểu cách các thực thể liên quan với nhau là thông tin cực kỳ hữu ích khi nói đến SEO thực thể (Entity SEO). Bằng cách bao gồm các thực thể liên quan trong nội dung thực thể của bạn, bạn sẽ xây dựng ngữ cảnh để Google hiểu nội dung của bạn đang nói về thực thể nào.
Đọc xuống dưới, Tâm sẽ diễn giải phần này cho bạn hiểu.
Cách các thực thể thay đổi công cụ tìm kiếm
Bằng cách sử dụng các thực thể (Entity) như một đơn vị để phân loại thông tin, và tổ chức các thực thể thành các mối quan hệ, Google có thể tạo ra trải nghiệm tìm kiếm phong phú.
Điều này có nghĩa là khi bạn tìm kiếm trên Google, bạn thường thấy các tính năng của SERP (Công cụ tìm kiếm-Trang tìm kiếm) bao gồm các thực thể liên quan và các thuộc tính của thực thể đó.
Các tính năng SERP là các yếu tố xuất hiện trên trang kết quả của công cụ tìm kiếm Google, nằm bên trên các kết quả không phải tìm kiếm truyền thống.
Bạn có thể tìm hiểu về Các tính năng của công cụ tìm kiếm mà Tâm viết tại đây: SERP Feature – Tìm hiểu về các tính năng của SERP
Điều này cho phép Google mang lại các câu trả lời ngắn gọn cho các câu hỏi của người dùng. Bạn có thể thấy các câu trả lời này xuất hiện trong các tính năng SERP.
Một điểm mạnh khác, vì Google trình bày thông tin thực thể trong các tính năng của SERP, chúng tạo ra một nguồn thông tin phong phú khi bạn tìm hiểu thông tin trong Knowledge Graph của Google, việc phân tích các tính năng là rất quan trọng cho SEO thực thể.
Ví dụ, nếu chúng ta gõ từ ‘thời tiết’ vào Google, Google có thể nhận ra rằng Tâm đang yêu cầu thông tin về thực thể ‘thời tiết.’
Google sẽ tìm câu trả lời cho câu hỏi này bằng 2 bước:
- Xác định vị trí của người dùng để thêm thực thể liên quan là “Place-địa điểm” vào thực thể “thời tiết”
- Tìm kiếm thông tin trên các trang web hoặc app trong chỉ mục của Google.
Google sau đó tổng hợp thông tin dưới dạng tính năng SERP.
Bạn có thể thấy khung màu đỏ xác định vị trí cụ thể của người dùng, khung màu vàng là cách mà Google “biểu diễn” thực thể ‘thời tiết’ dưới dạng Tính năng SERP.
Bây giờ, trước khi chúng ta đi vào cách làm SEO thực thể, có một khái niệm quan trọng nữa bạn phải hiểu.
Lớp Chủ Đề là gì? (Topic Layer)
Lớp Chủ Đề – Topic Layer là một bản đồ ngữ nghĩa dùng để sắp xếp các thực thể trong Knowledge Graph của Google thành các chủ đề chính và chủ đề phụ. Điều này giúp các thuật toán của Google hiểu cách các thực thể trong một chủ đề liên quan với nhau.
Lớp chủ đề cho phép Google tinh chỉnh kết quả tìm kiếm và nâng cao trải nghiệm người dùng bằng cách cung cấp các tính năng SERP như bảng điều khiển kiến thức, giúp cho việc tìm kiếm trở nên tinh tế hơn, liên quan về mặt khái niệm và thú vị hơn.
Bắt đầu từ 2018, Google thêm Topic Layer vào Knowledge Graph. Trước khi Lớp Chủ Đề tồn tại, Google đã có thể kết nối các thực thể và hiển thị chúng trong các tính năng SERP.
Hãy xem qua bài blog công bố về Topic Layer của Nick Fox – Vice President of Product & Design, Search and Assistant: Helping you along your Search journeys
Topic Layer có tính năng gì?
Topic Layer được thiết kế để giúp người dùng của Google bằng cách xem việc tìm kiếm như một quá trình nghiên cứu thay vì chỉ là một cách để có được thông tin nhanh chóng.
Có những chủ đề quá phức tạp để nắm bắt nhanh chóng, và người dùng có thể cần nhiều tìm kiếm trong một khoảng thời gian dài.
Topic Layer được thiết kế để giúp người dùng khám phá một chủ đề bằng cách cung cấp các phương thức để theo dõi các tìm kiếm của họ và đề xuất những gì nên tìm hiểu tiếp theo.
Đây là một mô hình mới của Google để nâng cao trải nghiệm tìm kiếm của người dùng. Google đã là ‘nhà vô địch’ trong việc trả lời các câu hỏi. Giờ thì Google còn có thể giúp người dùng trong quá tìm hiểu và học tập các kiến thức mới với quy mô lớn hơn nhiều.
Bạn có thể thử test nhanh, nhập tìm kiếm và xem trang kết quả cho từ khóa ‘marketing’.
Như bạn có thể thấy trong bảng điều khiển kiến thức, Google hiển thị các chủ đề phụ trong khung màu đỏ như:
- Purpose – Mục tiêu của Marketing
- Types – Các loại hình của Marketing
- Jobs salary – Thu nhập của ngành này
- Importance – Những thông tin quan trọng về Marketing
- >>6 more – Và thêm 6 chủ đề phụ khác đã ẩn đi
Đây đều là các chủ đề phụ trong chủ đề chung về marketing. Hơn nữa, Google cũng đề xuất các tìm kiếm liên quan khác và các câu hỏi liên quan, bạn có thể thấy trong 2 khung màu vàng mà Tâm đánh dấu. Kể cả những tìm kiếm liên quan cũng được Google phân loại là chủ đề phụ.
Nếu Marketing là chủ đề chính, thì Digital Marketing, Marketing Strategy, Advertising và Marketing Management đều là các thực thể chủ đề phụ.
Tại sao Topic Layer lại quan trọng khi SEO?
Chỉ cần nhìn sơ qua ví dụ minh họa mà Tâm vừa phân tích ở trên, bạn sẽ hiểu được những gì quan trọng khi SEO thực thể, kinh nghiệm của Tâm là: hãy cấu trúc nội dung của bạn theo cách mà các công cụ tìm kiếm tổ chức thông tin thành các chủ đề chính và chủ đề phụ. Đây là cách an toàn, nhanh và tiết kiệm tài nguyên nhất khi triển khai SEO.
SEO thực thể như thế nào?
Bây giờ bạn đã hiểu các thực thể của Google là gì và cách Google sử dụng chúng để trả lời các truy vấn của người dùng, Tâm tin bạn cũng đã hình dung được Semantic SEO không chỉ đơn giản là nhồi từ khóa của bạn trong metadata và headers.
Mục tiêu của SEO thực thể (Entity SEO) là biến trang web của bạn trở thành một chuyên gia về thực thể bạn chọn. Bạn làm điều đó bằng cách tạo ra một mạng lưới nội dung kỹ lưỡng bao gồm thực thể của bạn và tất cả các thực thể liên quan của nó.
Bạn phải xây dựng nội dung đó vào kiến trúc trang web của bạn trong một hệ thống phân cấp dễ hiểu và có thể đọc được bằng máy.
Nghe có vẻ phức tạp nhỉ? Chỉ cần bạn đọc và thực hành đúng các bước Tâm liệt kê dưới đây, rồi bạn sẽ thấy nó dễ hiểu, học phải đi đôi với hành mà, đúng không?
Bắt đầu nha, có ba bước cơ bản để làm SEO thực thể:
1. Nghiên cứu cách Google “học-hiểu” thực thể của bạn
Trong phần này, Tâm sẽ giải thích và hướng dẫn cho bạn nghiên cứu cách mà Google tìm hiểu thực thể của bạn.
Đây là bước quan trọng vì nếu bạn trình bày nội dung của mình theo cách mà công cụ tìm kiếm có thể hiểu, bạn sẽ hô biến website của mình thành một chuyên gia trong lĩnh vực.
Làm sai điều này, bạn sẽ khiến cho Google bối rối. Làm Google bối rối, và nội dung của bạn có khả năng sẽ bị “đóng mạng nhện” – lãng quên ở một góc nào đó trong chỉ mục của Google.
Google sử dụng các chỉ số đánh giá giúp hệ thống “algorithm của nó” hiểu trang web của bạn viết-mô tả-trưng bày về cái gì.
Mục tiêu của bạn là phải thể hiện được cho Google thấy website của bạn là một ‘chuyên gia’ (communicate authority) bằng cách xây dựng một mạng lưới nội dung được cấu trúc tốt, dễ điều hướng và bao quát chủ đề của bạn một cách kỹ lưỡng. (Hoặc ít nhất là kỹ lưỡng hơn so với các đối thủ cạnh tranh của bạn.)
Phần tiếp theo, Tâm sẽ chỉ cho bạn cách tìm các thực thể để tối ưu hóa SEO.
Bạn cũng có thể đọc bài Hướng dẫn cách tạo Topical Map! của Tâm để phân tích sâu hơn vấn đề.
Mục tiêu của chúng ta là cố gắng tổng hợp một danh sách tất cả các thực thể SEO liên quan đến chủ đề của bạn và cấu trúc các thông tin đó thành một hệ thống chủ đề chính/chủ đề phụ.
#1: Phân tích SERP
Hãy bắt bắt đầu bằng cách tìm kiếm thực thể của bạn trên Google. Cố gắng liệt kê các “từ khóa” – “thuật ngữ” đầu ngành. Ví dụ: Chủ đề bạn định SEO là “Digital Marketing” thì bạn nên bắt đầu bằng keywords “Marketing“.
Khi bạn làm như vậy thì Google giả định bạn đang ở giai đoạn đầu của hành trình tìm kiếm và sẽ sử dụng thông tin trong Knowledge Graph của nó để trình bày chủ đề ở mức cao nhất trong SERP.
Sau khi nhập “từ khóa” đầu ngành vào thanh tìm kiếm, nếu bạn tìm thấy một bảng điều khiển kiến thức thì bạn đã tiết kiệm được rất nhiều thời gian nghiên cứu.
Lý do là các bảng điều khiển kiến thức này lấy thông tin trực tiếp từ Knowledge Graph. Bạn sẽ biết được rằng những thực thể nào được kết nối với chủ đề chính của bạn.
Bên dưới, bạn có thể thấy một bảng điều khiển tri thức cho thực thể “Kinh doanh”.

Ta có thể thấy thực thể “Kinh doanh” được kết nối với:
- Scientific study – các nghiên cứu khoa học về kinh doanh
- Main types – các loại hình chính của kinh doanh
- Purpose – mục đích của việc kinh doanh
- Companies – các công ty điển hình trong kinh doanh
Ngoài ra ở phía trên chúng ta còn thấy gợi ý về các “từ khóa mở rộng – broad keywords” có liên quan đến thực thể ‘kinh doanh’.
Điều này có nghĩa là nếu bạn muốn tạo một trang web về Kinh Doanh, đây là một số thực thể SEO mà bạn phải bao gồm trong nội dung trang web của mình.
Nếu bạn không tìm thấy bảng điều khiển tri thức hãy thử các cách sau:
- Đổi ngôn ngữ tìm kiếm sang tiếng Anh
- Đổi vị trí tìm kiếm sang các nước sử dụng tiếng Anh (ưu tiên Hoa Kỳ)
- Đổi “từ khóa”
Sau khi áp dụng cả 3 cách mà vẫn không thấy (vận may chưa tới), hãy xem bước tiếp theo.
#2: Phân tích Wikipedia
Google lấy phần lớn thông tin thực thể của nó từ các trang Wikipedia. (Bạn có thể thấy điều này trong thực tế vì phần lớn các bảng điều khiển kiến thức lấy phần Giới thiệu của chúng từ Wikipedia). Wikipedia là một mỏ vàng nghiên cứu thực thể.
Chỉ cần tìm kiếm thực thể của bạn trong Wikipedia và quét tất cả các liên kết nội bộ. Các liên kết này thể hiện cho các “thuộc tính” hoặc thực thể phụ liên quan đến thực thể chính của bạn.
Ví dụ, bên dưới, là ảnh chụp màn hình trang Wikipedia của “waterproofing” (chống thấm) được viết bằng tiếng Anh, vì Tâm không thể tìm được Knowledge Panel cho thực thể “chống thấm xây dựng” khi tìm kiếm bằng Tiếng Việt.
Việc sử dụng trang tiếng Anh là vì nó đầy đủ thông tin và các liên kết nội bộ, đây cũng là cơ hội cho bạn khi chưa có nhiều Website Tiếng Việt xây dựng chủ đề “chống thấm trong xây dựng” một cách bài bản.
Các liên kết nội bộ màu xanh thể hiện các thực thể phụ hoặc thuộc tính liên quan đến “Waterproofing”, cuộn trang xuống phần ‘In Construction – Trong xây dựng’, bằng cách nghiên cứu ngữ nghĩa ta có thể xác định những thực thể phụ quan trọng như là:
- building envelope – lớp phủ công trình xây dựng
- construction – xây dựng
- flat roofs – mái bằng
- felt paper – tấm lợp
- asphalt – xi măng nhựa đường
- bituminous waterproofing – chống thấm màng bitum
- vân vân…
Nghiên cứu này sẽ giúp bạn hiểu các thực thể liên quan mật thiết đến thực thể hoặc chủ đề chính của bạn. Tổng hợp một danh sách và cố gắng vẽ sơ đồ cách các thực thể này kết nối với nhau. Từ đó xây dựng Cấu trúc Website và lên kế hoạch liên kết nội bộ.
Một cách khác để tìm các thực thể SEO là phân tích đối thủ của bạn.
#3: Phân tích đối thủ cạnh tranh
Một phần quan trọng phân tích thực thể là hiểu cách các trang web thành công sử dụng các thực thể. Bạn có thể làm điều này bằng cách nhìn vào các cụm từ khóa của họ. Điều quan trọng là bạn phải hiểu rằng từ khóa không phải là thực thể, tuy nhiên các từ khóa sẽ chứa đựng thông tin thực thể mà bạn có thể triển khai.
Có nghĩa là bạn không nên tập trung vào các cụm từ khóa cụ thể mà là tìm các chủ đề chung mà các cụm từ đó đang đề cập đến.
Bạn có thể sử dụng các công cụ như: Ahrefs, SEMRush, Site Analyzer hoặc SimilarWeb để nghiên cứu đối thủ của mình. Tâm sẽ hướng dẫn chi tiết trong một bài viết riêng và sẽ đính kèm URL vào đây ngay sau khi hoàn thành.
2. Xây dựng kết nối thực thể
Theo John Mueller của Google, một website có cấu trúc rõ ràng và mạch lạc giúp Google hiểu cách các nội dung bên trong được kết nối. Điều này có nghĩa là Google phân tích cấu trúc trang web của bạn, bao gồm:
- URL hierarchy – Cấu trúc URL
- Breadcrumbs – Điều hướng
- Internal links – Liên kết nội bộ
Cấu trúc trang web – Site Structure của bạn càng logic, bạn càng cho công cụ tìm kiếm rõ ràng hơn.
Điều này không chỉ giúp Google hiểu trang web của bạn về cái gì, mà còn giúp người dùng điều hướng nội dung của bạn một cách hiệu quả hơn.
Trong ví dụ dưới đây, chủ đề chung (hoặc thực thể) là ‘Chống thấm’ thì ‘Loại công trình’ là một chủ đề phụ, và Tòa Nhà hay Biệt Thự là các thực thể liên quan tồn tại một cách logic trong hệ thống phân cấp chủ đề/chủ đề phụ này.
- chongtham.abc/dich-vu-chong-tham/loai-cong-trinh/
- chongtham.abc/dich-vu-chong-tham/loai-cong-trinh/toa-nha/
- chongtham.abc/dich-vu-chong-tham/loai-cong-trinh/biet-thu/
Nếu bạn không chắc chắn cách cấu trúc trang web của mình, hãy thử nghiên cứu cách các trang web thành công nhất trong ngành của bạn cấu trúc nội dung của họ.
Bạn không cần phải sao chép cấu trúc trang web của các đối thủ cạnh tranh hàng đầu trong ngành của bạn; thay vào đó, hãy để nghiên cứu của họ lấy cảm hứng và củng cố nền tảng cho mình. Xây dựng một cấu trúc trang web thân thiện với người dùng hơn so với đối thủ cạnh tranh của bạn có thể mang lại cho bạn một lợi thế cạnh tranh.
Bây giờ bạn đã xây dựng các hệ thống phân cấp thực thể vào kiến trúc trang web của mình, hãy chuyển sang nội dung trên trang của bạn.
3. On-page SEO cho thực thể
*On-page SEO: là quá trình tối ưu hóa SEO cho nội dung, chức năng, và các yếu tố khác trên trang của một website
Google thu thập dữ liệu nội dung trang web của bạn và phân tích nó về mặt ngữ nghĩa. Điều này có nghĩa là nội dung trên trang web của bạn phải được tối ưu hóa cho SEO thực thể.
3 nhiệm vụ chính khi bạn One-page SEO cho thực thể:
- Cấu trúc tiêu đề ngữ nghĩa (Semantic header)
- Trả lời ý định của người dùng (User intent)
- Xây dựng kết nối thực thể trong nội dung của bạn (entity connections)
#1 Cấu trúc tiêu đề ngữ nghĩa
Cấu trúc tiêu đề ngữ nghĩa tương tự như cấu trúc trang web nhưng liên quan đến cách bạn cấu trúc từng trang. Điều này đơn giản có nghĩa là đảm bảo rằng H2s, H3s, v.v., của bạn tuân theo một cấu trúc logic. (Xem phần Table of contents của website này ở bên trái để biết ví dụ về cách blog này được cấu trúc.)
Điều quan trọng là hiểu rằng một trang web được thiết kế xung quanh một chủ đề hoặc được thiết kế để trả lời một truy vấn của người dùng. Hãy tạo nội dung cho một trang như một chủ đề nhỏ. Điều này có nghĩa là tiêu đề của bạn nên được cấu trúc để phân chia nội dung trang của bạn một cách rõ ràng, dễ hiểu.
- H1 – Tiêu điểm thực thể chính
Bắt đầu với tiêu đề H1, rõ ràng đưa ra thực thể hoặc chủ đề chính của nội dung của bạn. Giữ nó ngắn gọn và chỉ ra chủ đề chính. - H2 – Chủ đề phụ và thực thể hỗ trợ
Sử dụng tiêu đề H2 để giới thiệu các chủ đề phụ hoặc thực thể hỗ trợ liên quan đến chủ đề chính của bạn. Điều này củng cố thực thể chính trong khi cung cấp một cấu trúc rõ ràng. - H3 – Ngữ cảnh sâu hơn và chi tiết
Tiêu đề H3 có thể đi sâu hơn vào các khía cạnh hoặc chi tiết cụ thể liên quan đến chủ đề phụ. Điều này thêm độ sâu cho nội dung của bạn và báo hiệu sự liên quan đến các công cụ tìm kiếm.
Ví dụ:
<H1>Phân tích cấu trúc thực thể
<H2>Thuộc tính của thực thể
<H3>Thuộc tính định danh của thực thể
<H3>Thuộc tính tên của thực thể
Kinh nghiệm của Tâm là bạn nên thay đổi kiểu chữ và kích thước phông chữ giữa các Header để nhấn mạnh hệ thống phân cấp này cho người dùng.
#2 Trả lời ý định người dùng
Các công cụ tìm kiếm ngữ nghĩa được thiết kế để trả lời ý định tìm kiếm (Search Intent) của người dùng, một cách đơn giản để tăng độ liên quan của trang là trả lời truy vấn tìm kiếm ở đầu trang. Điều này không chỉ tăng mức độ liên quan mà còn làm cho trải nghiệm người dùng tốt hơn.
Thường khi triển khai nội dung, chúng ta có xu hướng mở bài và phải tới thân bài ta mới đi vào ý chính. Hãy thử làm ngược lại, đưa hook (câu hỏi, điều bạn khẳng định) lên đầu bài, trả lời trực tiếp vấn đề mà bạn đang viết. Cách làm này sẽ giúp tăng khả năng nội dung của bạn được Google mang lên đặt ở top 1-2-3.
Tại sao phải làm vậy? Thực tế có rất nhiều người dùng chỉ đang đi tìm câu trả lời ngắn gọn cho một câu hỏi duy nhất. Và cũng có nhiều người khác đang tìm kiếm các phân tích chi tiết.
Đưa ra một câu trả lời ngắn gọn ở đầu bài viết cho những người tìm kiếm câu trả lời ngắn gọn, và sau đó theo đó bằng phân tích chi tiết của bạn.
#3 Xây dựng các kết nối cho thực thể
Một cách hiệu quả để Google hiểu nội dung của bạn đang nói về cái gì là sử dụng ngữ cảnh và ngữ nghĩa. Mỗi trang tập trung vào trả lời một truy vấn tìm kiếm. Để trả lời một truy vấn nhất định, Google phân tích các thực thể trên một trang.
Nếu bạn viết về một chủ đề nhất định, bạn nên đưa các từ khóa hoặc các thực thể liên quan vào trong nội dung về chủ đề đó.
Ví dụ, nếu bạn đang viết về ‘Trương Tam Phong’, bạn nên nhắc đến ‘Võ Đang’ trong nội dung của bạn. Lý do là vì các thực thể ‘Trương Tam Phong’ và ‘Võ Đang’ được kết nối với nhau.
Bên dưới, bạn có thể thấy trang SERP của ‘Võ Đang’ với thực thể ‘Trương Tam Phong’ mà Tâm đã highlight.
‘Trương Tam Phong’ xuất hiện nhiều lần trên SERP này. Điều này có nghĩa là Google hiểu rằng các thực thể này được kết nối. Càng nhiều các thực thể liên quan chặt chẽ như thế này xuất hiện trong nội dung của bạn thì nó càng rõ ràng với Google.
Và Google thì như Tâm được biết, họ rất thích sự rõ ràng.
Để triển khai nội dung mà có thể chèn được thực thể phụ vào một cách mượt mà và tự nhiên nhất, Tâm thường áp dụng 2 phương pháp.
Đầu tiên, cách mà Tâm hay dùng nhất là chơi trò có tên “Người Ấy Là Ai” (một chương trình truyền hình mà vợ Tâm rất thích xem). Hãy xem lại đoạn nội dung mà bạn định chèn tên của Thực thể phụ vào, sau đó bỏ Tên của thực thể đó ra và thay bằng biến số X.
Ví dụ, bạn viết về chủ đề ‘Thái Cực Quyền’:
X là nhân vật lịch sử có thật ở thời cuối nhà Nguyên đầu nhà Minh. Ông là người sáng lập ra phái Võ Đang cũng như 2 môn võ “Thái Cực quyền” và “Thái Cực kiếm”.
Sau khi đọc lại đoạn nội dung mà bạn vừa thay tên Thực thể phụ bằng X và vẫn hiểu rõ đoạn này nói về ‘Trương Tam Phong’, thì đoạn nội dung này và thực thể phụ ‘Trương Tam Phong’ đã được thêm vào một cách hợp lý, không khiên cưỡng, và Google đánh giá rất cao dạng internal-link này.
Cách thứ 2, đi sâu vào kỹ thuật, Tâm sẽ nói sơ qua để các bạn hình dung cách mà các Team SEO lớn họ phân tích từ khóa và ngữ nghĩa. Đó là sử dụng Google’s Natural Language API thông qua Google Console. Và cách này hoạt động tốt nhất với nội dung là tiếng Anh nên ví dụ dưới đây Tâm sẽ sử dụng một “search query” bằng tiếng Anh.
Đầu tiên Tâm sẽ search với query là “cristiano ronaldo training routine” (lịch tập luyện của cristiano ronaldo); sau đó Tâm lấy toàn bộ nội dung của kết quả đầu tiên trong SERP. Nhập toàn bộ nội dung đó vào console của Natural Language API và tiến hành phân tích Entities (các thực thể).
Dưới đây là ảnh chụp một phần các Entities của nội dung này mà Google nhận diện.
Bài viết top 1 này có 1,851 từ (words) và có tới hơn 600 lần xuất hiện của các thực thể.
Vì nội dung này phân tích chế độ ăn uống và chế độ tập luyện của Cristiano Ronaldo, bạn có thể thấy các thực thể tập trung vào thể dục, sức khỏe và thực phẩm trên trang, chẳng hạn như:
- cardio
- chicken
- circuit training
- core exercises
- CR7 Drive – tên một loại thực phẩm chức năng mà CR7 kết hợp với Herbalife
- vân..vân…
Google Entity – Thực thể, nền tảng mới của SEO
Nội dung được tạo ra từ các thực thể. Các thực thể giúp Google hiểu dữ liệu theo cách thông minh hơn, qua đó trả kết quả tìm kiếm chi tiết hơn cho nội dung có liên quan mà người dùng đang tìm kiếm.
Hy vọng qua bài viết này Tâm có thể giúp bạn hiểu rõ hơn về chủ đề thực thể trong tìm kiếm. Với các kiến thức này bạn có thể hoàn toàn tự tin khi triển khai các chiến dịch SEO Thực thể trong tương lai.
Trước khi kết thúc bài viết này, Tâm muốn gửi lời cảm ơn sâu sắc nhất đến Bill Slawski tác giả của SEO by the Sea, một huyền thoại đã không còn trên cõi đời này, có thể nói rằng toàn bộ kiến thức về Thực thể của Tâm đến từ các tài liệu của Mr. Slawski.
Bạn có thể theo dõi các bài viết cũ của Bill Slawski tại đây: SEO by the Sea
Câu hỏi thường gặp
Sự khác biệt giữa thực thể và từ khóa là gì?
Thực thể là các mẩu thông tin trong Knowledge Graph của Google định nghĩa một vật thể hoặc khái niệm là duy nhất, cụ thể và dễ nhận biết. Từ khóa ngược lại là các chuỗi đại diện cho các từ mà người dùng sử dụng để tìm kiếm trên Google.
Tìm kiếm thực thể là gì?
Tìm kiếm thực thể bao gồm việc sử dụng hiểu biết ngữ nghĩa để kết nối và truy xuất thông tin dựa trên các đối tượng, người hoặc khái niệm cụ thể thay vì chỉ dựa vào việc khớp từ khóa. Nó nâng cao độ chính xác và sự liên quan của tìm kiếm.