Thema: Suchmaschine (nur) für eigenen Host
Hallo zusammen,<P>Wie sieht denn ein sinnvoller Algorithmus zum durchsuchen alles html Dokumente nach bestimmten Suchworten auf dem eigenen Host aus?<P>Ich möchte so was mit Perl programmieren, weiß aber nicht so recht wie ich drangehen soll.<P>Bis jetzt komm ich nur zu so was:<P>Entweder so:<P>Ich öffne das das roots Verzeichnis speichere alle Verzeichnise, falls welche Vorhanden, in einem Array.<P>Ich durchsuche alle Dateien.<P>Ich öffne das erste Verzeichnis aus dem Array und speicher wieder alle Unterverzeichnisse, falls vorhanden, in einem Array,<P>die Dateien durchsuch ich wieder.<P>usw. wenn keine Verzeichnisse mehr vorhanden sind geh ich einen Hoch und mach bei dem nächsten Verzeichnis weiter.<P>...<P>Hört sich, find ich, erst mal ganz logisch an, wenn ich das aber mal so Struktogramm mäßig umsetzen möchte, weiß ich nicht wie ich das sinnvoll in ne Schleife oder so packen kann, so dass ich nicht mit einer vordefinierten tiefe der Verzeichnisse arbeiten muß. Oder macht man so was mit einer rekursiven Funktion? Wenn ja, wie? [img]images/icons/smile.gif" border="0[/img]<P>Der zweite Ansatz:<P>Ich öffne das Roots Verzeichnis,<P>Ich durchsuche die Dateien.<P>Ich öffne das erste Verzeichnis und merk mir den Verzeichnisnamen. <P>ich durchsuch wieder die Dateien und öffne das erste Verzeichnis und merk mir den Verzeichnisnamen.<P>usw. so lange bis kein Unterverzeichnis mehr da <P>Dann geh ich ein Verzeichnis nach oben und öffne das ersten nächste Verzeichnis welches nicht namentlich in meiner merkliste erwähnt ist.<P>so müßte das ja theoretisch auch klappen.<P>praktisch aber die geleichen Problem und was mach ich wenn 2 Verzeichnisse den gleichen Namen haben?<P>wär für Hilfe sehr dankbar,<P>thx, sel.