Ra đời đầu tiên vào năm 1993, đến nay Search Engine đã trở thành một phần không thể thiếu của cuộc sống, và không ngừng được cải thiện về số lượng và chất lượng các kết quả tìm kiếm mang đến cho người dùng những thông tin quan trọng thiết thực. Sự phát triển của Search Engine được gắn liền với sự phát triển của công nghệ thông tin toàn cầu, và đặc biệt gắn liền với sự thay đổi của ngành dịch vụ SEO. Vậy Search Engine (SE) là gì ? – Công cụ tìm kiếm là gì? chúng ta hãy cùng nhau tìm hiểu.
Khái niệm Search Engine – Công cụ tìm kiếm :
Trước khi Google thống trị lĩnh vực tìm kiếm internet, người dùng cao tuổi ngày xưa chắc hẳn vẫn còn nhớ tới Altavista, Lycos, Yahoo,… là những nhà cung cấp dịch vụ tìm kiếm thông tin internet với đội ngũ chuyên gia phân loại, tóm tắt và đánh giá nội dung hùng hậu (đánh giá chất lượng thông tin thủ công). Việc đánh giá này tất nhiên là sẽ tốt hơn nhưng với sự phát triển mạnh mẽ về hạ tầng phần cứng và viễn thông, cũng như xu hướng bùng nổ thông tin trên internet với lượng tài nguyên thông tin khổng lồ vào những năm đầu 2000 thì các cỗ máy tìm kiếm bán tự động không đáp ứng được nhu cầu tìm kiếm của người sử dụng.
Năm 1998, 2 đồng sáng lập Google đã đưa ra thuật toán PageRank trong luận văn của mình nhằm giúp đánh giá chất lượng nội dung các website một cách tự động tốt hơn và triển khai thử nghiệm trên internet. Đến 2013-2014, với sự hoàn thiện về tính năng cũng như có các cộng sự xuất sắc về kỹ thuật máy tính và hạ tầng đủ mạnh, Google được cả thế giới tin dùng với lượng thị phần chiếm tới 85% thị phần. Đến nay, khái niệm máy chủ tìm kiếm được nhắc tới thì ai cũng nghĩ tới Google.
Search Engine (tên đầy đủ là Web Search Engine) – Công cụ tìm kiếm là một loại hệ điều hành được thiết kế với chức năng tìm kiếm các thông tin trên mạng World Wide Web. Khi người dùng sử dụng công cụ tìm kiếm, họ sẽ cần phải nhập một từ khóa (keyword) của chủ đề mình cần tìm hiểu để có thể nhận về một bảng kết quả có chức các trang web, hình ảnh. video, địa chỉ bản đồ (đối với tên địa danh) hoặc các loại files tài liệu,… có liên quan đến chủ đề tìm kiếm đó.
Các kết quả trả về này sẽ được sắp xếp theo một thứ tự nhất định bằng các thuật toán tìm kiếm của Search Engine, và tùy vào mỗi Search Engine mà chúng ta tại có một thuật toán tìm kiếm khác nhau. Do không hề được can thiệp bởi con người, nên các kết quả trả về này còn được gọi là kết quả tìm kiếm tự nhiên (Organic Search Traffic).
Cơ Chế Hoạt Động của Search Engine :
Hiện nay, Search Engine thường được cấu tạo bởi 4 bộ phận chính, nhằm giảm thiểu tối đa thời gian tìm kiếm thông tin cho người dùng. Cụ thể:
1. Spider ( hay còn được gọi là “Crawler” hay “Bot“) :
Là một công cụ giúp Search Engine thu thập dữ liệu của một trang web bất kỳ nào đó, bao gồm dữ liệu thông tin về nội dung trên trang, số lượng và tần suất liên kết của các trang web khác đến trang đó. Việc thu thập dữ liệu của Spider sẽ được thực hiện không ngừng từ một website bất kỳ nào đó và chỉ kết thúc khi tất cả các liên kết có liên quan được thu thập dữ liệu hết.
Các thông tin về những liên kết đến và đi khỏi website (internal link & external link) sẽ được gắn liền với website, để giúp công cụ tìm kiếm có thể đánh giá độ phổ biến và uy tín của website (Domain authority & Domain popularity). Như vậy, từ một trang ban đầu, Spider có thể đã thu thập dữ liệu của hàng triệu các website khác, đảm bảo tất cả các website đều có thể được thu thập dữ liệu và được đánh giá một cách chính xác nhất.
2. Công cụ lập chỉ mục – Index :
Là công cụ thực hiện việc lưu một cách tối ưu toàn bộ dữ liệu đã thu thập của một trang web, bao gồm nội dung và các liên kết đến và đi trên trang. Các dữ liệu này sẽ được mã hóa dưới dạng file text (văn bản) để có thể lưu lại với dung lượng thấp nhất và trích xuất kết quả tìm kiếm được nhanh nhất. Dữ liệu sau khi được mã hóa sẽ được phân tích và lập chỉ mục lưu lại trong bộ cơ sở dữ liệu gốc, giúp cho Search Engine không phải tìm thông tin trên từng website mỗi khi có người dùng tìm kiếm từ khóa, giảm thiểu tối đa thời gian trả về kết quả tìm kiếm cho người dùng.
3. Phân tích (Analysis) :
Khi một người gõ từ khóa lên trang tìm kiếm. Lúc này công cụ tìm kiếm sẽ quét trên hệ thống máy chủ để tìm ra các website có độ liên quan nhất tới từ khóa được gõ vào. Việc phân tích này được dựa trên độ liên quan của từ khóa, vị trí địa lý, thói quen… của người sử dụng.
4. Bảng kết quả tìm kiếm(SERP) :
Kết quả tìm kiếm của Google sau khi được Công cụ trích xuất kết quả tìm kiếm xử lý và xếp hạng kết quả tìm kiếm, sẽ được hiển thị trên một bảng kết quả như chúng ta vẫn thấy khi sử dụng Google.
Công cụ trích xuất kết quả tìm kiếm: Khi có một tìm kiếm của người dùng được gởi đến cho Search Engine, từ khóa đó sẽ phải đi qua các bộ lọc truy vấn nhằm giúp công cụ tìm kiếm đánh giá rõ hơn về thông tin tìm kiếm và thông tin của người dùng. Từ đó, tìm kiếm và trích xuất các thông tin từ những dữ liệu đã được index sao cho phù hợp với truy vấn của người dùng nhất. Như vậy, về bản chất, mỗi khi người dùng tìm kiếm thông tin trên mạng, họ chỉ đang tìm kiếm thông tin trên những bản lưu website mà Search Engine đã lưu trước đó.
Các Search Engine Hàng Đầu Hiện Nay :
Hiện nay, Search Engine là một lĩnh vực khá độc quyền, với việc top 4 các công cụ tìm kiếm hiện nay chiếm trên 97% thị phần người dùng trên toàn thế giới, bao gồm: Google Search, Yahoo! Search, Bing Search và Baidu Seacrh. Cụ thể:
1. Google Search
Google Search, hay còn được gọi là Google Web Search hay ngắn gọn là Google, là một công cụ tìm kiếm thông tin Online thuộc sở hữu bởi tập đoàn Google, là một trong những Search Engine được sử dụng phổ biến nhất hiện nay trên thế giới, với hơn 3 tỷ lượt tìm kiếm mỗi ngày. Được phát triển từ năm 1997 bởi Larry Page và Sergey Brin, đến năm 1998, Google đã chính thức ra mắt công cụ tìm kiếm của mình.
Đến nay, sau nhiều năm liên tục được cập nhật và phát triển, với hàng tỷ dữ liệu được lưu trữ, tốc độ tìm kiếm ưu việt hàng đầu và luôn đi tiên phong trong việc tạo và cập nhật các thuật toán chống spam, giúp đem lại trải nghiệm tốt nhất cho người dùng.
2. Yahoo search
Yahoo Search là công cụ tìm kiếm website trực thuộc sở hữu của tập đoàn Yahoo!. Đây là công cụ tìm kiếm lớn thứ ba tại Mỹ tính đến tháng 2 năm 2015, với lượng truy vấn tìm kiếm đạt 12,8%. Mặc dù được thành lập từ năm 1995, nhưng phải đến 2004, Yahoo! mới chính thức trình làng sản phẩm Search Engine của mình. Mặc dù được ra đời sau, nhưng do lợi thế về thị phần người sử dụng Yahoo! Messenger và Yahoo! Mail khá lớn. Yahoo Search vẫn cạnh tranh khá tốt với các đối thủ đi trước mình cả nửa thập niên. Trước sự cạnh tranh quá khốc nghiệt với Google Search, năm 2009, Yahoo và Microsoft đã quyết định đi đến một sự thỏa thuận hợp tác cùng phát triển Bing Yahoo Search.
3. Bing Search
Bing Search, tiền thân là MSN Search (trước đó còn gọi với tên là Live Search, Windows Live Search) là một công cụ tìm kiếm của tập đoàn Microsoft. Công cụ tìm kiếm Bing lần đầu tiên được ra mắt vào 28 tháng 5 2009, và trở thành công cụ tìm kiếm lớn thứ hai tại thị trường Bắc Mỹ. Ngày 29 tháng bảy năm 2009, Microsoft và Yahoo! đã đi đến một thỏa thuận mười năm với nội dung sẽ Yahoo! Search sẽ được thay thế bởi Bing Search. Yahoo! sẽ nhận được để giữ 88% doanh thu từ tất cả các doanh quảng cáo tìm kiếm trên trang web của mình trong năm năm đầu tiên của thỏa thuận, và có quyền để bán quảng cáo trên một số trang web của Microsoft.
4. Baidu Search
Baidu là một công cụ tìm kiếm của Trung Quốc thành công nhất cho đến nay, được thiết kế riêng cho người dùng sử dụng Tiếng Trung. Từ khi được ra mắt vào năm 2000, đến nay Baidu đã trở thành công cụ tìm kiếm được sử dụng nhiều thứ 2 thế giới, chỉ sau Google. Để có một thành công như vậy, ngoài việc kế thừa những thành công của những đối thủ đi trước như Google hay Wikipedia, Baidu đã phải có một sự hỗ trợ rất lớn từ chủ nghĩa dân tộc và những hỗ trợ độc quyền của chính phủ của Trung Quốc. Hiện nay, Baidu Search đã trở thành công cụ tìm kiếm không thể thiếu cho những ai sử dụng tiếng Trung và muốn kinh doanh tại thị trường này.
Thị phần sử dụng công cụ tìm kiếm
Hiện nay, Search Engine là một mảng thị phần cạnh tranh rất gay gắt trên toàn cầu, với ngôi đầu bảng tạm thời rơi vào Google Search, với thị phần người dùng trung bình trên toàn cầu rơi vào khoảng trên 70%. Cụ thể:
Thị phần tìm kiếm trên toàn cầu của Search Engine năm 2014 – Seach Engine là gì? Thị phần tìm kiếm trên toàn cầu của Search Engine năm 2014
Tuy nhiên, tại Nga và một số các quốc gia Đông Á, Google lại để mất vị thế dẫn đầu của mình vào tay các đối thủ khác. Cụ thể, Yandex là công cụ tìm kiếm được sử dụng nhiều nhất tại Nga với 61,9% thị phần tìm kiếm. Tại Trung Quốc. Baidu là công cụ tìm kiếm phổ biến nhất, Naver tại Hàn Quốc và Yahoo! Japan và Yahoo! Taiwan tại Nhật Bản và Đài Loan. (nguồn: wikipedia.com)
Google Search là công cụ tìm kiếm được sử dụng nhiều nhất tại Việt Nam hiện nay. Và nó được dân SEO thường xuyên sử dụng
Kết Luận :
Như vậy bài viết đã một phần nào giải đáp cho các bạn mới học hay đang làm SEO hiểu rõ hơn về Search Engine là gì, cơ chế hoạt động của Search Engine từ đó giúp các bạn dể dàng sử dụng hơn để áp dụng thành công trong lãnh vực SEO của mình. Bài viết nếu còn thiếu sót mong các bạn đóng góp thêm. Trân thành cám ơn các bạn đã quan tâm theo dõi.