Khái niệm về Thực thể
Entity hay còn gọi là Thực thể là khái niệm quan trọng nhất cần hiểu trong SEO. Một thực thể được Google định nghĩa là: “Một sự vật hoặc khái niệm là số ít, duy nhất, được xác định rõ ràng và có thể phân biệt được.”
Điều quan trọng là phải hiểu rằng một thứ không nhất thiết phải là một vật thể vật lý, nó cũng có thể là một màu sắc, một ngày tháng, một ý tưởng, và hơn thế nữa. Do đó có thể hiệu rộng hơn, thực thể là bất kỳ thứ gì:
- Số ít.
- Độc nhất.
- Được xác định rõ ràng.
- Có thể phân biệt được.
Các yếu tố xếp hạng SEO
Để biết được Thực thể có vai trò gì với SEO, hãy điểm qua 3 trong số các yếu tố xếp hạng quan trọng nhất là:
- Content.
- Links.
- RankBrain.
Hãy nhìn lại ba yếu tố xếp hạng này.
Content
Nội dung hay còn gọi là Content , theo quan điểm SEO, là sự kết nối các thực thể bằng các mối quan hệ. Trong tuyên bố, “ SEO đã chết ” có thực thể “SEO”, có thực thể “đã chết” và có mối quan hệ mà cái này kết nối với cái kia và hướng của mối quan hệ đã nói.
Links
Các liên kết (Links) giúp kết nối giữa các thực thể ngay cả trước khi Google biết về sự liên kết này. Các liên kết sẽ tuyên bố mối quan hệ và hướng giữa các trang trên web. Các trang đó là các thực thể chứa các thực thể khác.
Hơn nữa, thực thể của anchor text được kết nối thông qua mối quan hệ với một chủ đề (cũng là một thực thể) và thực thể chủ đề đó sau đó được kết nối thông qua mối quan hệ có hướng (liên kết) với thực thể của trang mục tiêu.
RankBrain
RankBrain không phải là một yếu tố xếp hạng theo nghĩa truyền thống. Về cơ bản, bản thân RankBrain chỉ đơn giản xác định các chỉ số và mối quan hệ thực thể nào là quan trọng nhất đối với một truy vấn cụ thể.
Ví dụ: Đối với một truy vấn như [quà tặng dịp lễ tốt nhất], RankBrain sẽ giải thích tín hiệu nào hợp lý nhất để tạo ra kết quả tốt nhất.
Đối với một truy vấn như “Nội chiến Hoa Kỳ”, thực thể có cấp bậc chính quyền sẽ là một yếu tố quan trọng hơn là sự mới mẻ.
Chúng ta biết gì về các thực thể?
Phần lớn những gì chúng ta biết về các thực thể đó chính là một số bằng sáng chế, một số người thông minh và từ những gì có ý nghĩa.
Mặc dù các bằng sáng chế thường cần phải được đọc rất kỹ, nhưng những bằng sáng chế dưới đây rất có ý nghĩa nên không có gì phải nghi ngờ khi chúng được kết hợp vào hệ thống của Google. Điều đó nói rằng, có nhiều cách Google có thể sử dụng các bằng sáng chế này.
Xếp hạng kết quả tìm kiếm dựa trên số liệu thực thể
Xếp hạng Kết quả Tìm kiếm Dựa trên Chỉ số Thực thể là tiêu đề của bằng sáng chế của Google mà họ đã được cấp vào năm 2015 và là bằng sáng chế đầu tiên về các thực thể mà tôi đã đọc. Nó không phải là cuối cùng.
Theo bằng sáng chế, việc xếp hạng các thực thể để tìm kiếm liên quan đến việc xem xét bốn yếu tố. Họ đang:
- Sự liên quan. Mức độ liên quan được xác định dựa trên các thực thể đồng xuất hiện. Về cơ bản, nếu hai thực thể được tham chiếu thường xuyên trên web (ví dụ: “Joe Biden
” và “Tổng thống”), sẽ nhận được một cái gì đó như:
Điều này là do chúng tồn tại đủ thường xuyên cùng nhau và trên các thuộc tính đủ thẩm quyền để mang lại một kết quả duy nhất.
Quá trình tương tự này kết nối các thực thể khác với thuật ngữ khi chúng ta đa cấp hóa nó:
Mỗi người trong số những người này là một thực thể và họ được liên kết với thực thể “Chủ tịch” và do đó, khi truy vấn là số nhiều – chúng ta thấy tất cả chúng.
2. Danh nhân. Google sử dụng một công thức khá đơn giản (trong bằng sáng chế) để xác định mức độ đáng chú ý của một thực thể. Tránh công thức này, về cơ bản, nó phân tích rằng một thực thể càng có giá trị (được xác định bởi những thứ bao gồm liên kết, đánh giá, đề cập và mức độ liên quan), thì giá trị của danh mục hoặc chủ đề mà nó đang cạnh tranh càng thấp, độ nổi tiếng của nó càng cao. Nhìn bề ngoài, điều này nghe có vẻ không hợp lý hoàn toàn, nhưng về cơ bản, ý nghĩa của nó là nếu bạn là một con cá lớn trong một cái ao nhỏ, bạn sẽ có độ nổi tiếng cao hơn so với việc bạn là con cá đang bơi trong đại dương.
3. Sự đóng góp. Đóng góp được xác định bởi các tín hiệu bên ngoài (ví dụ: liên kết, đánh giá) và về cơ bản là thước đo đóng góp của một thực thể cho một chủ đề. Bài đánh giá từ một nhà phê bình ẩm thực có uy tín và có uy tín sẽ bổ sung vào chỉ số này so với lời nói của Dave trên Yelp về giá cả vì đóng góp thực thể của họ trong không gian cao hơn.
4.Giải thưởng. Chỉ số giải thưởng chính xác như âm thanh của nó, thước đo các giải thưởng có liên quan khác nhau mà một tổ chức đã nhận được. Đây có thể là giải Nobel, giải Oscar… Loại giải thưởng xác định trọng lượng của nó và giải thưởng càng lớn thì giá trị gắn với đối tượng được đề cập càng cao.
Khi tất cả được nói và thực hiện, quá trình bắt đầu với việc người dùng yêu cầu thông tin về một thực thể.
Tôi có thể vào Google [best actresses].
- Sau đó, Google chạy qua quy trình của họ theo thứ tự sau:
- Xác định mức độ liên quan của các thực thể khác và gán giá trị.
- Xác định tính đáng chú ý của các thực thể đó và gán giá trị cho mỗi thực thể.
- Xác định chỉ số đóng góp của các thực thể này và chỉ định một giá trị.
- Xác định bất kỳ giải thưởng nào được trao cho các đơn vị và ấn định giá trị.
- Xác định trọng số áp dụng mà mỗi loại phải có dựa trên loại truy vấn (nghe có quen không?)
- Xác định điểm cuối cùng cho mỗi thực thể có thể.
- Tạo ra một SERP trông giống như…
Này, chúng tôi không nói rằng thuật toán của họ là hoàn hảo. Nhưng không tệ.
Trả lời câu hỏi bằng cách sử dụng tham chiếu thực thể trong dữ liệu phi cấu trúc
Về phía trước một chút về thời gian, chúng tôi hiện đang xem xét một bằng sáng chế được cấp vào năm 2016.
Bằng sáng chế này chứa một số ý tưởng mạnh mẽ và rất may, rất dễ để tóm tắt.
Dưới đây là những điều cần rút ra:
- Mỗi thực thể được gán một mã định danh duy nhất. Điều này có thể sẽ liên quan đến việc Google mua lại Metaweb vào năm 2010.
- Việc xác định đối tượng có nhiều khả năng được người tìm kiếm yêu cầu nhất có thể được hoàn thành bằng cách thiết lập đối tượng nào xuất hiện nhiều lần nhất trong 10 kết quả hàng đầu.
- Có một cơ sở dữ liệu thực thể. Để tiết kiệm Google phải xử lý các kết quả hàng đầu mỗi khi truy vấn được chạy, một cơ sở dữ liệu tồn tại chỉ lưu trữ các thực thể và kết nối của chúng. Hãy coi nó giống như một cơ sở dữ liệu liên kết, nhưng dành cho các thực thể.
- Các thực thể được xếp hạng theo điểm chất lượng có thể bao gồm độ mới, các lựa chọn trước đó của người dùng, các liên kết đến và có thể là các liên kết đi.
- Khi truy vấn cho một thực thể được thực hiện, mức độ liên quan của các thực thể khác được xác định cho kết quả. Để minh họa, đối với truy vấn [dave davies], Google cần xác định số liệu thực thể nào liên quan quan trọng nhất đến nó. Thực thể ngày sinh được coi là quan trọng, thực thể của anh trai anh ấy, ban nhạc của anh ấy và một số người khác đủ quan trọng để tạo nên bảng tri thức. Rằng anh ấy sinh ra thứ tám trong gia đình của mình không được coi là đủ quan trọng. Điều này không có nghĩa là tầm quan trọng của các thực thể chỉ liên quan đến bảng tri thức, chỉ là đó là một trong những minh họa trực quan rõ ràng nhất về nó.
- Đây là các phương pháp để Google suy ra ngữ cảnh cho nhiều thực thể có cùng tên. Để sử dụng ví dụ “ký sinh trùng” có thể là bộ phim, hoặc tên các con vật gây bệnh. Nếu tôi hỏi một câu hỏi “ai đóng phim” thì muốn nói đến tên phim, còn tra cứu “bệnh nguy hiểm thế nào” thì nhắc đến ký sinh trùng gây bệnh.
- Phương pháp này cũng cho phép Google tìm hiểu các thực thể mới.
Với kỹ thuật này, khả năng của Google trong việc tìm hiểu về các thực thể và mối quan hệ của chúng trở nên mạnh mẽ hơn đáng kể.
Kết hợp với những tiến bộ của họ trong việc hiểu ngôn ngữ tự nhiên và học máy và tầm quan trọng của các thực thể thậm chí còn tăng vọt.
Các thực thể liên quan
Bằng sáng chế cuối cùng mà chúng ta sẽ thảo luận ở đây có tiêu đề đơn giản là “ Các thực thể có liên quan ” và đã được cấp ở dạng hiện tại vào đầu năm nay. Dưới đây là những gì chúng tôi có thể lấy từ bằng sáng chế:
Một lần nữa, chúng tôi thấy một tham chiếu đến cơ sở dữ liệu thực thể. Cơ sở dữ liệu này không chỉ chứa một danh sách các thực thể đã biết mà còn như đã đề cập ở trên, còn cả cách chúng kết nối với các thực thể khác. Thực thể Dave Davies (anh chàng Kinks, không phải tôi) sẽ kết nối với các thực thể:
- “Ngày 3 tháng 2 năm 1947” bởi mối quan hệ “có ngày sinh”
- “Daniel Davies” bởi mối quan hệ “có con”
- “Davedavies.com” bởi mối quan hệ “có trang web”
- Và như thế. Tất cả các kết nối này được chứa trong cơ sở dữ liệu.
Có một cơ chế để xác định mức độ ưu tiên của mối quan hệ thực thể. Như đã lưu ý ở trên, thứ tự mà Dave Davies bước vào cuộc sống trong gia đình mình là một thực thể đã biết nhưng không được ưu tiên so với các thực thể khác được xác định là mang lại xác suất quan tâm cao hơn cho người tìm kiếm.
Các trang web mạnh hơn như Wikipedia cung cấp mối quan hệ chặt chẽ hơn giữa các thực thể. Ví dụ: một trang Wikipedia thảo luận về Ronald Reagan với tư cách là tổng thống Hoa Kỳ sẽ kết nối hai thực thể “Ronald Reagan” và “Tổng thống” hơn nhiều so với những gì họ đề cập trong bài viết này với một cơ quan chuyên đề liên quan đến SEO và tiếp thị.
Như bạn có thể thấy, bản thân bằng sáng chế rất nhanh để tóm tắt nhưng những ý tưởng bên trong nó thì vô cùng mạnh mẽ.
Tại sao các thực thể lại quan trọng đối với SEO?
Các thực thể quan trọng đối với SEO bởi vì, bản thân chúng ta hiểu mọi thứ xung quanh mình trong bối cảnh của các thực thể và các mối quan hệ của chúng.
Thực thể và RankBrain
Nếu không có RankBrain, Google không thể học cách ưu tiên các tín hiệu một cách chính xác và nhanh chóng cũng như điều chỉnh những điều chưa biết và học hỏi từ chúng. Với các thực thể đi kèm thì RankBrain có ý nghĩa:
- Khả năng tính toán xác suất đáp ứng ý định có thể có của người dùng với độ chính xác cao hơn nhiều.
- Khả năng hiểu từ ngôn ngữ và giọng điệu, cho dù kết quả sẽ là tích cực hay tiêu cực.
- Giảm đáng kể sự phụ thuộc vào các liên kết.
- Các liên kết sẽ vẫn là một tín hiệu, nhưng chúng sẽ đơn giản trở thành một cơ chế trong số nhiều cơ chế để thiết lập các giá trị thực thể.
- Để tối ưu hóa trong thế giới mới này, cần thay đổi cách nghĩ về các trang web của mình và cách tiếp thị ra bên ngoài.
Nếu chúng ta muốn xếp hạng cho “vật dụng màu xanh”, chúng ta cần xem xét rằng Google hiện có thể hoặc sẽ sớm hiểu tất cả các thực thể khác nhau liên quan đến chúng và theo thứ tự nào thì ý định của người tìm kiếm nhiều khả năng sẽ được đáp ứng. Và bây giờ bạn cần cân nhắc xem bạn cần những thực thể nào trên trang web của mình và chúng cần được kết nối như thế nào để tối đa hóa xác suất Google hiểu rằng bạn có nhiều khả năng đáp ứng nhiều loại ý định hơn đối thủ cạnh tranh của bạn.
Thực thể và liên kết?
Có lẽ điều quan trọng hơn đối với các chuyên gia SEO sẽ là sự thay đổi trong các liên kết. Các liên kết sẽ đơn giản trở thành một trình kết nối thực thể trong số nhiều liên kết.
Tại sao một liên kết lại cần thiết để chuyển giá trị nếu mọi tín hiệu khác và sự hiểu biết sâu sắc về cách các thực thể liên quan được đặt ra?
Nếu bạn đang viết nội dung, hãy nghĩ đến các thực thể khác sẽ tồn tại trên trang hoặc trang web và đảm bảo rằng chúng có. Nhìn vào 10 trang web hàng đầu và xác định những thực thể nào khác có trên các trang đó. Và khi bạn đang xây dựng liên kết, hãy nghĩ đến các thực thể mà bạn quan tâm nhất khi liên kết với chính mình và nhận liên kết trên các trang web đó, biết rằng ngay cả khi các liên kết giảm giá trị, bạn vẫn ổn.
Tài liệu tham khảo
- Dave Davies (Ngày 15 tháng 11 năm 2018). What Are Entities & Why They Matter for SEO, searchenginejournal. Truy cập ngày 21 tháng 4 năm 2022