Máy tìm kiếm (Search Engine) là gì? Top 9 công cụ tìm kiếm thông dụng


Chắc hẳn ai cũng đã từng 1 lần tra cứu một thông tin gì đó trên Google. Vậy đã bao giờ bạn thắc mắc liệu rằng Google là gì mà lại có thể biết hết mọi thứ như vậy chưa? Nếu rồi thì bài viết dưới đây sẽ cho bạn mọi thông tin cần biết về máy tìm kiếm, thứ tạo nên Google.

Định nghĩa máy tìm kiếm và nguyên lý hoạt động

Máy tìm kiếm là gì?

Máy tìm kiếm là một hệ thống có chức năng tìm kiếm và đưa ra những câu trả lời phù hợp nhất cho truy vấn của người dùng. Một khi người dùng nhập "cụm từ tìm kiếm", thì máy tìm kiếm sẽ lục trong cơ sở dữ liệu của mình và đưa ra các thông tin như văn bản, hình ảnh, video, website… liên quan nhất đến "cụm từ tìm kiếm" . 

Máy tìm kiếm trong tiếng anh là search engine. Một số người vẫn quen gọi là công cụ tìm kiếm (search tool) nhưng dù gọi bằng cách nào thì ta vẫn sẽ hiểu là đang nói đến các công cụ tìm kiếm tiêu biểu như: Google, Yahoo!, Bing,…

Các máy tìm kiếm phổ biến trên thế giới

Nguyên lý hoạt động của máy tìm kiếm 

Dù giải thích nghe có vẻ đơn giản nhưng máy tìm kiếm được tạo nên bởi những quy trình cực kì tinh vi và phức tạp. Dưới đây là quy trình máy tìm kiếm hoạt động được khái quát một cách dễ hiểu nhất:

Crawling

Crawling hay còn được gọi là quy trình khám phá URL. Máy tìm kiếm sẽ thả những "con bọ" cho chúng "bò" (crawl) đi khắp các trang trên internet để quét và thu thập thông tin thô về cho nó. Bằng cách này, các trang mới sẽ liên tục được cập nhật để thêm vào danh sách các trang đã biết. 

> Tìm hiểu thêm về: URL là gì?

Khi một trang được phát hiện, trình thu thập thông tin sẽ kiểm tra nội dung của trang đó. Công cụ tìm kiếm sử dụng thuật toán để chọn trang nào cần thu thập dữ liệu và tần suất thu thập dữ liệu.

Indexing

Indexing còn được gọi là quy trình lập chỉ mục. Sau khi một trang được thu thập thông tin, nội dung trên trang sẽ được xử lý, phân tích và gắn thẻ với các thuộc tính và siêu dữ liệu giúp công cụ tìm kiếm hiểu nội dung đó nói về cái gì.

Quy trình này cũng là lúc công cụ tìm kiếm loại bỏ các trang trùng lặp và thu thập tín hiệu về nội dung, chẳng hạn như về vị trí địa lí, lĩnh vực kinh doanh,... Chẳng hạn một garage oto ở TP.HCM sẽ có những thẻ về lĩnh vực cơ khí, máy móc, đời sống,...

Searching và Ranking

Searching và Ranking hay còn được gọi là quy trình tìm kiếm và xếp hạng. Lúc này, khi người dùng nhập truy vấn, công cụ tìm kiếm sẽ tìm kiếm chỉ mục cho các trang phù hợp và trả về các kết quả có vẻ phù hợp nhất trên trang kết quả của công cụ tìm kiếm (SERP).

Về phần công cụ xếp hạng nội dung (ranking), còn dựa trên một số yếu tố, chẳng hạn như độ tin cậy của trang, liên kết dẫn đến trang và từ khóa mà các trang chứa.

Quy trình hoạt động của máy tìm kiếm

Các công cụ tìm kiếm thông dụng nhất hiện nay

Dù cho Google luôn lả "kẻ thống trị" đối với lĩnh vực công cụ tìm kiếm với hơn 90% thị phần nhưng tại một số nơi nhất định như Mỹ hay Hàn Quốc vẫn có những công cụ tìm kiếm khác phổ biến không kém.

Ngoài ra thì sự phát triển của các máy tìm kiếm khác như sự hợp tác với cha đẻ của ChatGPT - OpenAI cũng dự kiến sẽ lấy đi một ít từ miếng bánh lớn của Google

Google vẫn đang thông trị ngành công cụ tìm kiếm

Dưới đây là danh sách top 9 công cụ tìm kiếm phổ biến nhất (cập nhật cuối năm 2023 đầu năm 2024):

1. Google 

Top 1: Google

Với hơn 90% thị phần tìm kiếm, Google chắc chắn là công cụ tìm kiếm phổ biến nhất. Ngoài ra, Google chiếm gần 95% lưu lượng truy cập trên thiết bị di động.

2. Bing

Top 2: Bing

Bing, đối thủ lớn nhất của Google, theo ngay phía sau với 7% số lượt tìm kiếm trên máy tính để bàn ở Mỹ nhưng chỉ 1,5% số lượt tìm kiếm trên thiết bị di động. 

3. Yahoo!

Top 3: Yahoo!

Dù không phải là một công cụ tìm kiếm có giao diện đẹp nhưng nhờ có sự hỗ trợ từ "gà cùng một mẹ"  là Bing, thì Yahoo vẫn giành được vị trí thứ ba trong danh sách với chỉ hơn 2% thị phần trên toàn thế giới.

Kết quả tìm kiếm giữa hai công cụ Yahoo! và Bing cực kỳ giống nhau nhưng Yahoo! vẫn là một công cụ tìm kiếm quan trọng với tổng số hơn 600 triệu người dùng hàng tháng.

4. DuckDuckGo

DuckDuckGo

DuckDuckGo tự giới thiệu mình là "Công cụ tìm kiếm không thu thập dữ liệu của bạn". DuckDuckGo sẽ không theo dõi, thu thập hoặc lưu trữ bất kỳ thông tin nào của bạn. Ngoài ra, DuckDuckGo có giao diện rõ ràng và chỉ có một trang tìm kiếm, giúp sử dụng dễ dàng hơn các công cụ tìm kiếm khác. 

5. Ask.com

Top 5: Ask.com

Ask.com, trước đây gọi là Ask Jeeves, là một công cụ tìm kiếm được thiết kế để trả lời các câu hỏi. Theo Ask.com, sứ mệnh của nó là “cho phép những người tò mò tìm thấy thông tin họ cần”.

Giao diện của Ask.com tương tự như giao diện của Yahoo. Tuy nhiên, không giống như Yahoo được cung cấp bởi Bing, Ask.com là công cụ tìm kiếm độc lập của riêng nó. 

6. Naver

Top 6: Naver

Naver là công cụ tìm kiếm chiếm gần 34% thị trường công cụ tìm kiếm tại Hàn, phổ biến thứ 2 chỉ sau Google. Giao diện của Naver hoàn toàn bằng tiếng Hàn và không có phiên bản tiếng Anh của trang web.

Naver là một công cụ tìm kiếm được bản địa hóa, nghĩa là nó không thu thập dữ liệu và lập danh mục toàn bộ Internet. Nếu bạn đang nhắm mục tiêu đến thị trường Hàn Quốc với nội dung của mình, hãy đảm bảo SEO của bạn phù hợp với tiêu chí của công cụ tìm kiếm phổ biến thứ hai tại Hàn Quốc này.

> Tìm hiểu thêm về: SEO là gì? 

7. Ecosia

Top 7: Ecosia

Ecosia là “công cụ tìm kiếm trồng cây”. Đối với mỗi tìm kiếm mà người dùng thực hiện, Ecosia sẽ trồng cây từ lợi nhuận mà công ty kiếm được. Đến nay, Ecosia đã tài trợ cho 170 triệu cây xanh.

Ecosia đang ngày càng phổ biến, nhưng nó đặc biệt phổ biến ở Đức, nơi công ty đặt trụ sở. Trên toàn thế giới, Ecosia đã giành được 0,11% thị phần công cụ tìm kiếm. Giống như Yahoo!, Ecosia được hỗ trợ bởi Bing.

8. AOL

Top 8: AOL

AOL, trước đây gọi là America Online, vừa là công ty truyền thông trực tuyến vừa là công cụ tìm kiếm. Giao diện của trang web có thanh tìm kiếm và các bài báo thời sự quốc gia, cùng với tin tức địa phương và thời tiết. Hầu hết 85,7% lưu lượng truy cập của AOL đến từ Mỹ.

9. Internet Archive

Internet Archive

Internet Archive là một loại công cụ tìm kiếm nhưng... lại hoạt động như một kho lưu trữ miễn phí, từ sách, phim, phần mềm, nhạc cho đến cả trang web.

Hầu hết người dùng của Internet Archive đều ở Hoa Kỳ. Tuy nhiên, công cụ tìm kiếm này đang trở nên phổ biến ở các quốc gia khác, chẳng hạn như Anh và Ấn Độ.

>>Xêm thêm bài viết: Chuyện nghề SEOer: Làm thân với công cụ tìm kiếm Google

Bài viết này đã giới thiệu sơ lược về các công cụ tìm kiếm như Google cũng như cơ chế hoạt động của chúng. Google đã và đang liên tục cập nhật các thuật toán (cách sắp xếp kết quả tìm kiếm) nhằm tạo ra công cụ thuận tiện nhất cho người dùng. Hãy theo dõi những bài viết tiếp theo để biết thêm thông tin nhé.