| Vorheriges Thema anzeigen :: Nächstes Thema anzeigen |
| Autor |
Nachricht |
Zer00
Anmeldedatum: 01.06.2006 Beiträge: 109
|
Verfasst am: Mi Jul 02, 2008 6:30 am Titel: Thread auslesen |
|
|
Guten Morgen,
ich suche nach einer Möglichkeit in einem Forum bestimmte Threads auszulesen und verschiedene Informationen in eine .txt-Datei zu schreiben. Wichtig wären natürlich der Inhalt (Inhalt:), Autor (Autor:), und das Datum (Datum:).
Die Textdatei bekomme ich selber gefüllt und formatiert.
Mir mangelt es gerade nur an einer Idee wie ich auf die einzelnen Bereiche zugreifen kann. Wenn ich mir die ClassNN anzeigen lasse, ändern Sie sich nicht wirklich häufig. Ein Beispiel gibts hier. _________________ Wer Rechtschreibfehler findet, der darf sie behalten. |
|
| Nach oben |
|
 |
halweg
Anmeldedatum: 05.01.2006 Beiträge: 785 Wohnort: Dresden
|
Verfasst am: Mi Jul 02, 2008 12:37 pm Titel: |
|
|
Aus meiner Sicht kann man, wenn man die Website als Text kopiert, über eine Suche die interessanten Textteile extrahieren. Also über die Suche nach Schlüsselwörtern (vom ..., mitglied seit ...) und RegExReplace den ganzen Text strukturieren.
Das Ganze dürfte allerdings etwas Fleißarbeit bedeuten.
Evtl. kann man auch die Message-ID herausfinden und diese dann separat per URL aufrufen (in dem gezeigten Forum könnte das über den "Drucken"-Button gehen). Da hat man dann ein einzelnes Textdokument mit einer einheitlichen Struktur zum durchsuchen. |
|
| Nach oben |
|
 |
Zer00
Anmeldedatum: 01.06.2006 Beiträge: 109
|
Verfasst am: Mi Jul 02, 2008 1:23 pm Titel: |
|
|
Erstmal danke das Du geantwortet hast.
Ja, der drucken Button sah auch für mich sehr interessant aus, nur wie kann ich den ansteuern? Der ist ja in jedem Thread wieder anders.
Deinen ersten Vorschlag verstehe ich nicht ganz. Ich kann ja nicht einfach aus einer I-Net-Seite eine .txt machen...obwohl kann ich schon, nur dann steht da sehr viel anderes Zeug mit drin... _________________ Wer Rechtschreibfehler findet, der darf sie behalten. |
|
| Nach oben |
|
 |
halweg
Anmeldedatum: 05.01.2006 Beiträge: 785 Wohnort: Dresden
|
Verfasst am: Mi Jul 02, 2008 3:20 pm Titel: |
|
|
mit | Code: | | URLDOWNLOADTOFILE, % "http://www.chefkoch.de/forum/2,27,293345/Buegeln.html", c:\test.txt | könntest du eine Textdatei des Quelltextes erzeugen. Oder mit CTRL-A den reinen Textinhalt in die Zwischenablage kopieren.
In dem konkreten Fall könnte man den Druckbutton erreichen, indem man im IE den Text "vom" auf der Webseite sucht und dann mit {TAB} zum nächsten Dialogelement (Druck) springt. Da kann man entweder mit {ENTER} draufdrücken und mit CTRL-A den reinen Text auslesen (scheint mir einfacher) oder mit {APPSKEY}v die Verknüpfung kopieren und dann wiederum mit URLDOWNLOADTOFILE den Beitrag als Quelltext in eine Textdatei kopieren (alles IE).
Zuletzt bearbeitet von halweg am Mi Jul 02, 2008 3:35 pm, insgesamt einmal bearbeitet |
|
| Nach oben |
|
 |
BoBo² Gast
|
Verfasst am: Mi Jul 02, 2008 3:29 pm Titel: |
|
|
| Code: | | javascript:var o=document.documentElement.innerText;window.clipboardData.setData("Text",o);void(0); | ... oder innerHTML (lässt sich anhand der Tags besser parsen) |
|
| Nach oben |
|
 |
Zer00
Anmeldedatum: 01.06.2006 Beiträge: 109
|
Verfasst am: Do Jul 03, 2008 7:08 am Titel: |
|
|
Also die Sache mit Crtl+A werde ich mal probieren. Wenn da wirklich nur der Text markiert wird, wäre das fast schon die Lösung.
Wenn nicht muss ich mich wirklihc mal damit beschäftigen wie ich den 'Drucken'-Button immer sicher ansprechen kann.
Ich hatte vermutet, dass sich dieses Problem mit JavaScript gut lösen lässt, nur habe ich davon leider keine Ahnung...und reinlesen ist imme so eine Sache wo der Zeitdruck nicht mitmacht.
Aber danke schonmal. Ich werde noch ein wenig probieren und dann melde ich mich nochmal.
EDIT: @halweg: Den drucken Button meine ich nicht. Ich denke eher an den 'Thema Drucken'-Button. Dann hätte ich gleich alle Posts schön formatiert unternander.  _________________ Wer Rechtschreibfehler findet, der darf sie behalten. |
|
| Nach oben |
|
 |
Zer00
Anmeldedatum: 01.06.2006 Beiträge: 109
|
Verfasst am: Do Jul 03, 2008 12:41 pm Titel: |
|
|
So, ich denke ich bin ein gutes Stück weiter. Hier ist die JavaScript-Funktion welche der 'Thema drucken'-Button auslöst:
| Code: | | javascript:open_window('/forum/forum-print-thread.php?ForumID=27&ThreadID=293345','druck','menubar=yes,scrollbars=yes,width=640,height=400'); |
Die ForumID und die ThreadID kann ich mir aus der URL holen, oder sogar aus dem HTML-Code direkt.
Jetzt stellt sich mir nur die Frage, wie kann ich diese Funktion über AHK ausführen? _________________ Wer Rechtschreibfehler findet, der darf sie behalten. |
|
| Nach oben |
|
 |
BoBo² Gast
|
Verfasst am: Do Jul 03, 2008 1:32 pm Titel: |
|
|
Na per Control-Befehl über die Addresszeile (noob-standard). Oder per Initialisierung eines COM-Objects in einer AHK-GUI (geek-alike). | Code: | | javascript:open_window('/forum/forum-print-thread.php?ForumID=27&ThreadID=293345','druck','menubar=yes,scrollbars=yes,width=1024,height=768');javascript:self.print(); |
|
|
| Nach oben |
|
 |
Zer00
Anmeldedatum: 01.06.2006 Beiträge: 109
|
Verfasst am: Do Jul 03, 2008 1:47 pm Titel: |
|
|
Gut, ich danke Dir. Das werde ich am WE oder Montag erstmal ausprobieren. Sollte ich dann noch Fragen haben, werde ich mich bestimmt wieder melden.  _________________ Wer Rechtschreibfehler findet, der darf sie behalten. |
|
| Nach oben |
|
 |
Zer00
Anmeldedatum: 01.06.2006 Beiträge: 109
|
Verfasst am: Mo Jul 07, 2008 11:05 am Titel: |
|
|
Hallo, ich stehe gerade leider ein wenig auf dem Schlauch...
Hast Du es geschafft auf der Seite den Button anzusprechen?
Ich bekomme zurzeit nichtmal ein funktionsfähiges Script hin wo die JavaScript-Funktion ordentlich gesendet wird.
Wäre echt nett, wenn Du mir aus meiner "Unwissenheits-Phase" helfen würdest.
Danke. _________________ Wer Rechtschreibfehler findet, der darf sie behalten. |
|
| Nach oben |
|
 |
halweg
Anmeldedatum: 05.01.2006 Beiträge: 785 Wohnort: Dresden
|
Verfasst am: Mo Jul 07, 2008 11:38 am Titel: |
|
|
Falls du IE benutzt: Versuchs doch mal mit | Code: | #y::
SEND, ^f
SLEEP, 200
SEND, vom{ENTER}{ESC}
SLEEP, 300
SEND, +{TAB 4}{ENTER}
RETURN | Is zwar ein qick and dirty Ansatz, dafür brauchst nicht so viel zu basteln.  |
|
| Nach oben |
|
 |
Zer00
Anmeldedatum: 01.06.2006 Beiträge: 109
|
Verfasst am: Mo Jul 07, 2008 11:55 am Titel: |
|
|
@halweg: Danke für die Antwort. Das ist die Notlösung. Ich denke man kann es durchaus über JavaScript realisieren, ich weiß nur nicht wie ich JavaScript über AutoHotkey realisieren kann.  _________________ Wer Rechtschreibfehler findet, der darf sie behalten. |
|
| Nach oben |
|
 |
garry
Anmeldedatum: 25.10.2005 Beiträge: 396 Wohnort: switzerland
|
|
| Nach oben |
|
 |
Zer00
Anmeldedatum: 01.06.2006 Beiträge: 109
|
Verfasst am: Mo Jul 07, 2008 12:44 pm Titel: |
|
|
Hallo garry,
ja, das Forum hat RSS.
Dein Script ist super, wirklich...Respekt.
Ich habe es mir noch nicht ganz angeschaut, da ich in der Firma bin. Ich werde es mir heute Abend mal genauer anschauen...Vlt. kann es ja sogar alles was ich möchte...zumindest nach ein paar Modifikationen bei der Stringbearbeitung fürs Notepad.  _________________ Wer Rechtschreibfehler findet, der darf sie behalten. |
|
| Nach oben |
|
 |
|