Tout d'abord l'indexation, qu'est ce que c'est. L'indexation des fichiers, consiste à collecter les fichiers présents sur votre disque dur (ou tout autre supporte mémoire) dans le but de les placer dans une base de donnée. Les informations collectées peuvent se limiter au niveau du système du fichier (Noms, Extensions, voir Types mime, et Emplacements), que des fichiers eux même (indexation approfondies des IDTAG, du contenu des documents textuel, tableur, voir des fois jusqu'à l'application d'un logiciel de reconnaissance optique de caractère sur des images, comme le fait Nepomuk). Cela permet, dans le cadre d'une recherche, d'acceder très rapidement à la masse d'informations récupérées, sans devoir à chaque fois aller gratter tout le contenu de vos documents. Cependant, l'indexation est liée a une problématique non négligeable :
LES RESSOURCES SYSTÈME. En effet, l'obtention de ces informations nécessitent d'aller fouiner sur le disque dur (Utilisation du HDD), consomme de la ram et des ressources CPU, en fonction de la
profondeur de la collecte des données. L'indexation requiert aussi la mise en place d'une base de donnée pour stocker toute ces données collectées. Cela prend de la place, et n'est pas nécessairement très
sécurisé, surtout si l'éditeur de votre système d'exploitation n'est pas vraiment connu pour être très respectueux de la vie privée (Coucou Microsoft et Apple

).
Pour exemple :

la quantité d'informations que Nepomuk a stocké sur mon ordinateur est de
574 Méga Octets.

Nepomuk et ses sous-services, consomment en tout un total de 257824 Kilo Octets de mémoire, pour 8 services (nepomukserver, nepomukfilewatch, nepomukservicestub, nepomukfileindexer, akonadi_nepomuk_feeder, nepomukstorage et sans oublier le serveur de base de donnée Virtuoso.). Le plus
ramovaure est
akonadi_nepomuktag_ressource. Faudrait que je retire le module Akonadi d'ailleurs, ça me libérerait de la ram xD
Quelques conseils peuvent cependant limiter la consommation de mémoire.
Concentrer l'indexation des documents sur les dossiers qui vous semblent important. Cela permet de limiter les lectures sur le disque dur, et d'éviter qu'il y ai une énorme base de donnée de 29 Gigas (blague à part).
N'indexez pas d'informations sensible, comme des mots de passe par exemple, ou des RIB, ou des relevés de compte électronique, voir même des données privées qui n'ont pas lieu d'être indexées. Il suffit tout simplement de « désactiver » l'indexation sur les répertoires concernés.
Certain indexeurs (comme Nepomuk) divisent la phase d'indexation en deux parties :

Mise en place d'une liste de fichiers simple (Niveau 1) avec les types MIME

Sur demande, ou, quand vous n'utilisez pas votre ordinateur pendant 3mn, Nepomuk passe ne mode « Miam miam les données » en indexant plus profondément (tags, contenu, etc...).
Je parle beaucoup de Nepomuk car je ne connais que celui là a vrai dire. Il y en a probablement d'autre ^^ Et vous lesquel utilisez-vous ?
D'ailleurs, Nepomuk est en voie d'être remplacé par
Baloo d'ici KDE 4.13 :
http://community.kde.org/Baloo Ils annoncent une consommation mémoire plus réduite

et la progression de la ré-écriture des logiciels utilisant Nepomuk ici :
http://community.kde.org/Baloo/NepomukPort