Vollständige Version anzeigen : [Java] Webcrawler - URL download & save to file


TR!xXZT4R
22.01.2014, 20:35

Liebe RRler,

ich bin seit 2 Tagen mit Java und IRC ein bisschen am rum experimentieren.
Mein Ziel ist es, einen Bot in einen IRC Channel einzubinden, welcher viele tolle Möglichkeiten bietet.

Als Beispiel begrüßt er jetzt schon Neuankömmlinge im Chat oder kickt Leute welche mit Schimpfwörtern um sich schleudern.
Er gibt auch auf Anfrage die Uhrzeit wieder.

Jetzt kommt aber (für mich) der interessanteste Punkt. Ich möchte dass er mir alle Bilddateien die im Channel gepostet werden, lokal herunterlädt.
Sowas nennt man Webcrawler und davon gibt es schon viele :) jedoch brauch ich gar keine neuen Klassen etc, sondern nur eine Abfrage.

Die Idee: Sobald jemand einen Link postet welcher mit ";jpg" endet , soll er aktiv werden.. (das funktioniert schon bereits).

if(message;contains(";jpg")){
entnehme URL --> speichere das Bild --> bennene es nach der URL
}


da ich die Variable "message" habe (String) sind diese schritte eigentlich nicht schwer duchzuführen
sowas wie: URL = new URL(message);
es soll eben nun geprüft werden ob das wirklich eine URL zu einem Bild ist , und wenn JA , Speichere sie mit der URL als Namen als Bilddatei ab.
Ich verstehe nur nicht wir ich angeben kann wohin es die Datei speichern soll :(

Ich bin über jeden Hinweis froh

MfG TR!xX


Edit: Falls iwas unklar ist oder Fragen sind , einfach fragen ! Ich denke ihr braucht sicher noch einige Infos , jedoch will ich nicht den gesamten Code von diesem Bot hier rein posten.

Hardware Preisvergleich | Amazon Blitzangebote!

Videos zum Thema
Video Loading...
xolox
23.01.2014, 22:43

Eine minute Google benutzt, ersten Eintrag von Stackoverflow angeklickt:

how to download image from any web page in java - Stack Overflow (;stackoverflow~com/questions/5882005/how-to-download-image-from-any-web-page-in-java)

sollte eigentlich verständlich sein.


TR!xXZT4R
24.01.2014, 08:59

Eine minute Google benutzt, ersten Eintrag von Stackoverflow angeklickt:

how to download image from any web page in java - Stack Overflow (;stackoverflow~com/questions/5882005/how-to-download-image-from-any-web-page-in-java)

sollte eigentlich verständlich sein;


naja.. habe ja oben schon geschrieben, dass ich einige gefunden habe , damit aber nichts anfangen kann. Ich will ja nicht so sein und mich beschweren , weil ich über jede Hilfe dankbar bin, aber nach einem kompletten Sourcecode ahbe ich ja nicht gesucht.. sondern nur eine Hilfe beim erstellen der Methode , und vielleicht eine kleine Erklärung wie das funktionieren kann. Denn nur copy-paste aus diesem Sourcecode hilft mir leider nicht :(

Edit: wobei der eine Eintrag auf der Seite schon mal recht hilfreich aussieht. Ich muss jetzt nur noch herausfinden wie das ganze so funktioniert und es an meinen Bot anpassen! Ich danke dir recht herzlich für deine Hilfe xolox!


Figger
24.01.2014, 16:29

Jetzt kommt aber (für mich) der interessanteste Punkt. Ich möchte dass er mir alle Bilddateien die im Channel gepostet werden, lokal herunterlädt.
Sowas nennt man Webcrawler und davon gibt es schon viele :)

Das ist kein Crawler sondern ein ganz normaler Http-request.

es soll eben nun geprüft werden ob das wirklich eine URL zu einem Bild ist

Stichwort: Regulärer Ausdruck / Regular Expression / Regex. Falls du auf Nummer sicher gehen willst, überprüfe den MIME-Type der Zieldatei.

und wenn JA , Speichere sie mit der URL als Namen als Bilddatei ab;

Da sollte xolox Link hilfreich sein.

Ich verstehe nur nicht wir ich angeben kann wohin es die Datei speichern soll :(
Mit File (Java Platform SE 7 ) (;docs;oracle~com/javase/7/docs/api/java/io/File;html) spezifizierst du in Java eine Datei. Ist der angegebene Pfad nicht absolut, dann wird er relativ zum working directory, also dem Ort an dem dein Programm liegt, interpretiert.
Siehe dazu auch Galileo Computing :: Java ist auch eine Insel (;openbook;galileocomputing~de/javainsel9/javainsel_16_001;htm#mj78bd405fb0de0cff099c06255fe36853)

Gruß,
Figger


TR!xXZT4R
28.01.2014, 07:49

Alles Klar, ja habs auch korrigiert, es hat mir doch weiter geholfen :) Vielen Dank euch beiden für die Hilfe!

Kann geclosed werden


Ähnliche Themen zu [Java] Webcrawler - URL download & save to file
  • [Java] Attribut in XML File ändern [Gelöst]
    Hey, was wäre die beste, einfachste, schnellste Lösung um in einer XML Datei den Wert eines Attributs bzw. mehrerer zu ändern? Hab schon was über XML Parser gelesen, wobei SAX nur parsen kann und DOM auch manipulieren kann. Wie soll ich DOM verwenden um das Attribut zu ändern und im se [...]

  • [Java] Jar-File absichern
    Schönen guten Tag, ich bin gerade dabei ein (Java-)Programm zu schreiben, das unter anderem Daten verschlüsselt ablegt und eigene Webservices nutzt. Jetzt möchte ich mich gerne dagegen absichern, dass Nutzer des Programms die Jar-Datei decompilen. Denn das Passwort, das zum Verschlüsseln [...]

  • [Java] SVG File in XML parsen
    Also ich soll in unserer Ufgabenstellung eine SVG Datei einlesen, und diese dann in SVG parsen. Dabei soll ich das Batik Framework bzw die ExtensibleDOMImplementation nutzen. Ehrlich gesagt fehlt mir da jedoch jeglicher Zugang zu dem Kram -;- Ich verstehs eifnach nicht bzw ich hab keine Ahnung wie [...]

  • Command and Conquer 3 Save file problem??!?!
    Hi leute, und zwar hab ich folgendes problem ich wollte gerade eben mal c&c 3 spielen habs geöffnet und dann kam aufeinmal das ich ein Namen eingeben soll also ein neues Profil erstellenn soll! Aber ich hab doch schon eins wo ich schon sachen draufgespeichert habe! Ich habe bei Eigene Da [...]



raid-rush.ws | Imprint & Contact pr