Les moteurs de recherche ont divers mécanismes qui les font fonctionner, mais ils impliquent généralement trois fonctions : rechercher sur le Web, répertorier les informations importantes qu'ils trouvent dans un index et fournir des résultats de requête de recherche basés sur cet index. Ils s'appuient sur des algorithmes et des classements pour fournir des résultats pertinents.
Pour effectuer des recherches sur le Web, un moteur de recherche utilise des programmes automatisés appelés araignées. En commençant par les sites Web populaires, ces araignées parcourent les pages Web et recherchent des mots significatifs. Ils trouvent et suivent des liens dans chaque page pour explorer plus de pages. Pour manipuler le comportement de ces araignées, les propriétaires de sites Web peuvent utiliser des balises méta pour décrire leurs pages avec des mots-clés spécifiques. Les propriétaires de sites Web peuvent également ajouter des protocoles d'exclusion de robots pour signaler aux araignées d'ignorer des pages spécifiques.
Après l'exploration, les araignées soumettent leurs résultats dans l'index du moteur de recherche. En plus de répertorier les mots et les URL qui contiennent ces mots, un moteur de recherche peut attribuer un poids à chaque entrée de son index. Le poids d'une entrée détermine la fréquence à laquelle le mot est utilisé sur une page et influence la valeur de l'entrée dans l'index. Des algorithmes sont également utilisés pour déterminer le classement des entrées dans l'index. Par exemple, l'algorithme PageRank de Google valorise les pages auxquelles d'autres pages renvoient fréquemment.
Lorsqu'un utilisateur soumet une requête, le moteur de recherche renvoie les résultats qu'il juge les plus pertinents. L'utilisateur peut affiner davantage les résultats grâce aux opérateurs booléens.